计算机与现代化 ›› 2025, Vol. 0 ›› Issue (02): 28-32.doi: 10.3969/j.issn.1006-2475.2025.02.004
摘要: 数据重采样是解决数据类别不平衡的一种重要方法。传统方法通过最小化样本空间的几何误差构建平衡样本,但在复杂分布模式的高维空间表现不佳,而且依赖统计特征的方式也缺乏对下游任务的针对性。为了解决这个问题,本文提出一种基于神经网络的数据采样模型SOD-NN。利用神经网络的非线性处理能力学习样本在高维空间中的分布特征,并与下游任务联合构造两阶段网络形成整体优化,提升采样过程对下游任务的拟合能力。采样时首先对数据集进行空间划分,得到的样本子集通过残差处理避免数据退化问题,进而利用自注意力机制构造全局特征,确保与原始样本的分布一致性。实验结果表明本文模型能有效提升下游分类任务中少数类样本的识别性能,提升下游任务的鲁棒性。
中图分类号: