聚类分析的含义是什么
聚类分析指将物理或抽象对象的集合分组为由类似的对象组成的多个类的分析过程。它是一种重要的人类行为。聚类分析的目标就是在相似的基础上收集数据来分类。聚类源于很多领域,包括数学,计算机科学,统计学,生物学和经济学。在不同的应用领域,很多聚类技术都得到了发展,这些技术方法被用作描述数据,衡量不同数据源间的相似性,以及把数据源分类到不同的簇中。
区别聚类与分类的不同在于,聚类所要求划分的类是未知的。
聚类是将数据分类到不同的类或者簇这样的一个过程,所以同一个簇中的对象有很大的相似性,而不同簇间的对象有很大的相异性。
从统计学的观点看,聚类分析是通过数据建模简化数据的一种方法。传统的统计聚类分析方法包括系统聚类法、分解法、加入法、动态聚类法、有序样品聚类、有重叠聚类和模糊聚类等。采用k-均值、k-中心点等算法的聚类分析工具已被加入到许多著名的统计分析软件包中,如SPSS、SAS等。
从机器学习的角度讲,簇相当于隐藏模式。聚类是搜索簇的无监督学习过程。与分类不同,无监督学习不依赖预先定义的类或带类标记的训练实例,需要由聚类学习算法自动确定标记,而分类学习的实例或数据对象有类别标记。聚类是观察式学习,而不是示例式的学习。
聚类分析是一种探索性的分析,在分类的过程中,人们不必事先给出一个分类的标准,聚类分析能够从样本数据出发,自动进行分类。聚类分析所使用方法的不同,常常会得到不同的结论。不同研究者对于同一组数据进行聚类分析,所得到的聚类数未必一致。
从实际应用的角度看,聚类分析是数据挖掘的主要任务之一。而且聚类能够作为一个独立的工具获得数据的分布状况,观察每一簇数据的特征,集中对特定的聚簇集合作进一步地分析。聚类分析还可以作为其他算法(如分类和定性归纳算法)的预处理步骤。
猜你喜欢内容
-
上交所是什么
上交所,全称为上海证券交易所,是一个为证券集中交易提供场所和设施,组织和监督证券交易,实行自律管...
-
什么是资产阶级
资产阶级,指的是部分西方经济思想学派通过科学性手段对资本主义社会所做的阶级划分的其中一个富有阶级...
-
中小板和创业板的区别
中小板和创业板的区别主要表现在以下方面:1、进入门槛不同:中小企业板块的进入门槛较高,上市条件较为...
-
北向资金是什么意思
北向资金,又称为“北上资金”,是指从香港股市中通过沪股通的方式流入大陆股市的资金。在中国股市中,...
-
沪股通是什么
沪股通是指投资者委托香港经纪商,经由香港联合交易所设立的证券交易服务公司,向上海证券交易所进行申...
-
建设银行的概述
建设银行是中国建设银行的简称,中国建设银行前身是中国人民建设银行,属于中央管理的大型国有银行。按...
-
什么是基金募集期
基金募集期指基金合同和基金招募说明书中所载明的,并经过中国证监会所核准的基金份额的募集期限,同时...
-
什么是基金销售牌照
基金销售牌照指由中国证监会所颁发的,用于证明从事基金产品销售的企业或机构具有基金销售资格的许可证...
-
600359股票是什么
600359股票代表新农开发,是新疆塔里木农业综合开发股份有限公司在上交所发行的股票,股票首发主承销商...
-
600019股票是什么
600019股票代表宝钢股份,是宝山钢铁股份有限公司在上交所发行的股票。公司主营业务是钢铁冶炼、加工,...






















