2012届中国矿业大学优秀硕士学位论文获得者---徐丽

2012届中国矿业大学优秀硕士学位论文获得者---徐丽

分享
  • 产品详情
  • 产品参数

2012届徐丽硕士获得中国矿业大学优秀硕士学位论文

一、学位论文信息

论文题目:基于粗糙集理论的聚类算法研究

内容摘要:聚类分析作为数据挖掘技术的方法之一,在识别数据内在联系方面起到非常重要的作用。研究至今,人们已经提出很多经典算法来解决各领域的聚类问题。随着信息技术和数据库的发展,聚类分析所面临的不仅是“数据爆炸”,而且还有“维度灾难”问题。传统聚类算法在分析处理这样的数据时往往不能得到良好的结果,甚至有的时候会出现算法失效现象,因此研究能够分析处理高维海量数据的聚类算法迫在眉睫。

粗糙集理论是一种处理不精确、不一致、不完整信息和知识的数学工具。这恰好迎合了现在数据模糊冗杂的特点。近年来粗糙集理论凭借不需要先验知识就能客观严谨的对数据进行处理的优点,得到了蓬勃的发展。

本论文在深入分析研究粗糙集理论与聚类算法的基础上,对国内外现有粗糙聚类算法进行了总结与概述,通过分析他们的优缺点,提出两个能够处理高维数据聚类的新算法。第一,针对数据模糊、相互间差异微弱的特点,引入核函数来处理非线性数据聚类问题。同时考虑到不同样本对最终类簇的贡献度不同,利用粗糙集上下近似来对样本重新划分从而得到准确度高的聚类结果。如果把样本不加处理的直接进行聚类,不仅会增加算法复杂度而且会影响结果质量,因此提出在聚类之前对数据样本进行约简的预处理办法,并且对基于属性重要度的约简算法进行了改进,使其可以得到更精确的属性集。第二,AP聚类算法在处理类簇有多个的情况时运算速度很快,并且不需要预先指定聚类中心。但由于现实数据的属性集合中冗余和噪声属性的存在,使得构建数据相似度矩阵变得冗杂,因此提出引入粗糙熵来删除冗余属性,对属性集合进行优化。为了充分利用重要度大的属性,对约简集合中的属性赋予不同的权重,用经过双重优化过的样本集再去做聚类分析。最后分别通过实例和实验论证了两个算法的有效性。

二、学术论文

1. 徐丽,丁世飞. 粒度聚类算法研究[J].计算机科学,2011,38(8): 25-28.

2. 徐丽,丁世飞,郭锋锋. 基于改进属性约简的粗核聚类算法[J].广西师范大学学报(自然科学版),2011,29(3) :105-109.

3. 李剑英,丁世飞,徐丽,钱钧.一种模糊加权的改进层次聚类算法研究[J].微电子学与计算机,2011,28(9): 210-213.

4. Shifei Ding,Li Xu,Chunyang Su,Fengxiang Jin. An optimizing method of RBF neural network based on genetic algorithm[J].Neural Computing and Applications,2012, 21(2):333-336 (SCI, EI).

5. Ding Shifei, Xu Li, Zhu Hong, and Zhang Liwen. Research and Progress of Cluster Algorithms based on Granular Computing[J]. International Journal of Digital Content Technology and its Applications, 2010, 4(5): 96-104 (EI).

6. Shifei Ding, Li Xu, Chunyang Su, Hong Zhu. Using Genetic Algorithms to Optimize Artificial Neural Networks[J]. Journal of Convergence Information Technology, 2010, 5(8): 54-62 (EI).

7. Ding  Shifei, Xu Li, Zhu Hong, Jin Fengxiang. A fuzzy kernel clustering algorithm based on improved rough set attribute reduction[J]. International Journal of Advancements in Computing Technology, 2011, 3(6):199-206 (EI).

三、获奖情况

1. 2010年获中国矿业大学计算机学院一等奖学金

2. 2011年获中国矿业大学计算机学院一等奖学金

四、研究项目

1. 江苏省基础研究计划(自然科学基金)“面向高维复杂数据的粒度知识发现研究”No. BK2009093

2. 国家自然科学基金分布式计算环境下的并行数据挖掘算法与理论研究”No.60975039


年级
2009级