计算机与现代化 ›› 2025, Vol. 0 ›› Issue (01): 80-85.doi: 10.3969/j.issn.1006-2475.2025.01.013
摘要: 针对传统网络流量分类方法无法避免未知流量对分类的影响和难以实现实时流量分类的问题,本文提出一种基于高维特征降维聚类的实时流量分类模型。首先,搭建CNN网络模型对流量数据进行高维特征提取,并保存特征向量。然后使用UMAP对特征向量进行降维,并使用DBSCAN聚类算法对流量进行分类,在实现应用程序粒度分类的基础上,有效降低未知流量对模型的影响。同时,提出一种基于流一致性的时延控制机制,借鉴TCP拥塞控制机制的思想,大幅减少流量分类的时间,使得本文模型能够满足实时流量分类的要求。同时,在真实网络中采集一套应用程序粒度的流量数据集,并在公开数据集和本文数据集上进行实验验证。结果表明,本文方法在已知数据集中准确率约为98%,当未知流量接近50%时,准确率保持在80%左右,且能够满足实时分类的要求。
中图分类号: