日前,学院机器学习实验室:方宇副教授、曹雪梅(研究生)、王欣教授(知识工程研究中心)与闵帆教授合著的论文 “Three-way sampling for rapid attribute reduction”在《Information Sciences》上发表。 INS是中科院SCI一区、计算机科学顶级期刊,影响因子8.233。
随着数据维度和数据量的迅速增加,使用原始数据进行属性约简在计算上变得不可行。 大数据通常包含各种冗余属性和噪声,这导致数据处理中的过拟合和效率低下问题。 为了解决这些问题,本文通过引入三支决策,提出了一种通用的属性约简采样方法(3WS),能显著提高数据质量的同时准确描述决策边界。 为了提高属性约简的有效性和效率,设计了一种基于三支采样的快速属性约简方法(3WS-RAR)。 在15个相对较大的数据集上做了实验并分析了参数的影响。实验结果表明,与最新的属性约简模型相比,3WS-RAR的性能更好。
论文整体流程
论文链接:https://www.sciencedirect.com/science/article/pii/S0020025522007538