随着垃圾邮件的不断增多,它的危害性越来越严重,为了消除这种危害性,垃圾邮件的过滤技术就显得异常重要。由于垃圾邮件数据具有稀疏性、高特征维数和多重相关性等,所以直接对它进行分类的话会造成运算量很大和错误分类的问题。本文针对这些问题,先用非负矩阵分解的方法对实验数据进行特征提取,然后再用分类方法对它进行分类。在实验中,比较之后发现经过分解之后的数据比没有经过分解的数据有更高的分类准确率。
陈俊; 刘遵雄.基于非负矩阵分解特征提取的垃圾邮件过滤[J].华东交通大学学报,2010,27(6):75-79..[J]. JOURNAL OF EAST CHINA JIAOTONG UNIVERSTTY,2010,27(6):75-79