松哥常言统计分三级:“初级说一说,中级比一比,高级找关系”;今天所言之题,即为高级找关系之一法。聚类与判别,所谓天下合久必分、分久必合,合则聚类,分则判别。 根据研究对象特征对研究对象进行分类的一种多元分析技术, 把性质相近的个体归为一类, 使得同一类中的个体都具有高度的同质性, 不同类之间的个体具有高度的异质性。根据分类对象的不同分为样品聚类(Q聚类)和变量聚类(R)。现实研究中个案聚类常用哦 根据一定量案例的一个分组变量和相应的其他多元变量的已知信息, 确定分组与其他多元变量之间的数量关系, 建立判别函数, 然后便可以利用这一数量关系对其他未知分组类型所属的案例进行判别分组。 1、基本思想不同 ( 1) 聚类分析的基本思想 根据相似性( 亲疏关系),具体找出一些能够度量样品或指标之间相似程度的统计量, 把一些相似程度较大的样品( 或指标) 聚合为一类, 把另外一些相似程度较大的样品( 或指标) 又聚合为另一类; 关系密切的聚合到一个小的分类单位, 关系疏远的聚合到一个大的分类单位, 直到把所有的样品(或指标)聚合完毕。 ( 2) 判别分析的基本思想 对已知分类的数据建立由数值指标构成的分类规则即判别函数, 然后把这样的规则应用到未知分类的样本去分类。 2.研究目的不同
|
|