黑龙江大学自然科学学报

2019, v.36(06) 750-756

[打印本页] [关闭]
本期目录(Current Issue) | 过刊浏览(Past Issue) | 高级检索(Advanced Search)

一种基于模糊C均值聚类的稀疏数据缺失值填充方法
A missing data imputation method of sparse data based on fuzzy C-ceans clustering

张楷卉;李鹏;

摘要(Abstract):

缺失数据处理通常基于统计学的方法,在数据预处理阶段对缺失值进行填补,其效率和准确性并不高。因此,提出了一种基于模糊C均值(FCM)聚类的嵌入式填充方法(FCMSI)。此算法通过平均比率法(ARM)对稀疏数据进行初始化填充;采用局部距离策略对FCM进行改进,并对数据进行聚类;将缺失数据作为变量,在每次聚类迭代后的簇内采用协同过滤(CF)的思想对变量值进行替换,直到结果收敛。利用UCI标准数据集进行对比实验,并采用三种不同评价指标衡量,验证了FCMSI方法比传统填充方法性能显著提高。

关键词(KeyWords): 缺失数据填充;稀疏数据;模糊C均值聚类;协同过滤

Abstract:

Keywords:

基金项目(Foundation): 国家自然科学基金资助项目(61103149);; 黑龙江省普通高校基本科研业务费专项资金资助(LGYC2018JQ003)

作者(Author): 张楷卉;李鹏;

Email:

参考文献(References):

扩展功能
本文信息
服务与反馈
本文关键词相关文章
本文作者相关文章
中国知网
分享