因子分析和聚类分析?

2024-05-18 18:50

1. 因子分析和聚类分析?

问题一:如何对做过因子分析的因子做聚类分析  一般过程如下: 
  1.做完因子分析后,可以根据得分标记几类特殊的因子; 
  2.选择K-means或者分层聚类后,根据先前得到的因子,提取其特殊的性质,再进一步命名聚类分析后所得的几类。 
  支持我一下哈~ 
  
   问题二:因子分析和聚类分析的区别和联系  完全不同的方法,没必要去比较区别和联系 
  
   问题三:聚类分析和因子分析的区别  聚类就是根据数据内在的特征将个案归类的,你这个就等于聚成了一类,所以没有怎么回事,数据就是如此,你可以试一下不用因子直接用变量聚类看下怎么样 
  
   问题四:什么样的数据适合做因子分析和聚类分析  存在相关性的数据 
  
   问题五:在做同一个统计的时候,分别做了因子分析和聚类分析,但二者结果不一致说明了什么?  不一致很正常,这原本就是两种方法,好比面和饭吃到嘴里,口感不一致一样 
  做专业数据分析,找我吧 
  
   问题六:在因子分析的基础上如何使用聚类分析?  根据各个样本的最后各因子的总得分,进行聚类分析即可。 
  
   问题七:问问题===,因子分析得出结果怎样聚类分析  当然可以的,但通常是将各因子的综合得分作为聚类分析的变量。

因子分析和聚类分析?

2. 因子分析和聚类分析的区别和联系

因子分析和聚类分析,很多时候容易混淆。接下来讲讲二者的区别和联系
因子分析:比如有20个题,将20个题浓缩成5个关键词;
聚类分析:常见为样本聚类,比如有500个人,这500个人可以聚成几个类别。
因子分析和聚类分析的联系在于:
分析角度上,比如:可先讲20个题做因子分析,并且得到因子得分。将因子得分在进一步进行聚类分析。最终聚类得到几个类别群体。再去对比几个类别群体的差异等。

3. 怎样用因子分析结果做聚类分析

可以保存因子得分,然后做聚类分析。这个在spssau里就能实现。
分析之前勾选‘因子得分’即可。


怎样用因子分析结果做聚类分析

4. 因子分析后如何进行聚类分析?

一、案例说明
  
 1.案例背景
  
 研究短视频平台用户行为的分类情况,调查搜集了200份数据其中20项可分为品牌活动,品牌代言人,社会责任感,品牌赞助和购买意愿品牌五个维度。案例数据中还包括基本个体特征比如性别、年龄,学历,月收入等。以及短视频平台观看情况和消费情况。数据样本为200个。
  
 2.分析目的
  
 想要根据短视频平台调查的数据进行聚类分析,由于分析项过多,所以先进行因子分析,将得到的因子得分进行聚类分析后进行命名,以及和其他基本个体特征比如性别进行交叉分析最终得到结论。
  
 二、SPSSAU操作
  
 因为案例的预设维度为5所以将分析项拖拽到右侧分析框后,下拉选择因子个数为5并勾选因子得分。
                                          
 三、因子分析结果
  
 1.前提条件
  
 KMO值与Bartlete球形检验
                                          
 使用因子分析进行信息浓缩研究,首先分析研究数据是否适合进行因子分析,从上表可以看出:KMO值为0.929,大于0.6,满足因子分析的前提要求,意味着数据可用于因子分析研究。以及数据通过Bartlett 球形度检验( p <0.05),说明研究数据适合进行因子分析。接下来查看分析项是否需要调整。
  
 2.因子与测量项之间的关系
  
 因子分析进行因子浓缩时,通常会经历多个重复循环,删除不合理项,并且重复多次循环,最终得到合理结果。一般出现的情形我们分为两种,一种为“张冠李戴”,一种为“纠缠不清”,具体描述如下。
  
 (1)“张冠李戴”
  
 一般情况下,如果20项与5个因子之间的对应关系情况,与专业知识情况不符合,比如第一项本该属于第二个因子但是被划分到了第一个因子下面,此时则说明可能该项应该被删除处理,其出现了‘张冠李戴’现象。例如案例中的“购买意愿1”和“购买意愿4”。
                                          
 (2)“纠缠不清”
  
 除了“张冠李戴”现象,有时候会出现‘纠缠不清’现象,比如案例中的“品牌赞助4”可归属为因子2,同时也可归属到因子4,这种情况较为正常(称作‘纠缠不清’),需要结合实际情况处理即可,可将该项删除,也可不删除,这时,分析带有一定主观性。
                                          
  Step1: 第一次分析 
  
 本例子中共20个分析项,此20个分析项共分为5个维度,因此在分析前可主动告诉SPSSAU,此20项是五个因子,否则SPSSAU会自动判断多少个因子(通常软件自动判断与实际情况有很大出入,所以建议主动设置因子个数)。如下图:
                                          
 从上图中可以看出:
  
 品牌活动1-4这4项,它们全部对应着因子1,因子载荷系数值均高于0.4,说明此4项应该同属于一个维度,即逻辑上品牌活动1-4这4项,并没有出现 “张冠李戴”现象。4个分析项值隶属于因子1一个维度也没有出现“纠缠不清”的情况。
  
 品牌代言人1-4共4项,它们全部对应着因子1,但是品牌代言人3、品牌代言人4同时又属于因子3,属于“纠缠不清”,暂不处理。
  
 “社会责任感1-4”共4项,此4项均对应着因子1或因子3,此3项并没有出现‘张冠李戴’问题,但是出现了“纠缠不清”。
  
 “品牌赞助1-4”共4项,它们全部对应着因子2,“品牌赞助4”既对应因子2又对应因子4出现了“纠缠不清”,应该给予关注。
  
 “购买意愿1-4”共四项,当他们对应因子4则“购买意愿1”出现“张冠李戴”若对应因子5则“购买意愿4”出现“张冠李戴”。
  
 总结上述分析可知:“购买意愿1”或者“购买意愿4”这两项出现“张冠李戴”,应该首先将此两项中的一项删除;而其他出现“纠缠不清”现象的,暂时不处理(进行关注即可)。此次将“购买意愿1”进行删除后重新分析(将“购买意愿4”删除也是可以的,由研究者自己决定)。
  
  Step2: 第二次分析 
  
 将“购买意愿1”这项删除后,进行第二次分析。结果如下:
                                          
 从上图可知“品牌代言人3”、“品牌代言人4”出现‘张冠李戴’现象,应该删除,以及“品牌活动1-4”、“品牌代言人1-2”等出现‘纠缠不清’现象,暂不处理,但应该给予关注。总结可知:应该将“品牌代言人3”、“品牌代言人4”先删除后再次进行第3次分析。
  
  Step3: 第三次分析 
  
 将“品牌代言人3”、“品牌代言人4”删除后再次分析结果如下:
                                          
 从上图可知“品牌代言人1-2”可同时出现在因子1和因子5下面,但考虑到因子5当前仅余下2项,因而表示可以接受,以及“社会责任感1-4”是一样的,最终找出五个因子,它们分别与项之间的对应关系良好。因子分析结束。
  
 3.调整因子后的结果
  
 (1)KMO 和 Bartlett 的检验
                                          
 使用因子分析进行信息浓缩研究,首先分析研究数据是否适合进行因子分析,从上表可以看出:KMO值为0.915,大于0.6,满足因子分析的前提要求,意味着数据可用于因子分析研究。以及数据通过Bartlett 球形度检验(p<0.05),说明研究数据适合进行因子分析。
  
 (2)因子载荷系数表
                                          
 从上图可知“品牌代言人1-2”可同时出现在因子1和因子5下面,但考虑到因子5当前仅余下2项,因而表示可以接受,以及“社会责任感1-4”是一样的,最终找出五个因子,它们分别与项之间的对应关系良好。分析项不需要进一步调整,接下来进行查看因子的提取个数以及信息浓缩情况。
  
 4.因子提取
  
 (1)方差解释率
                                          
  方差解释率 可以说明因子包含原数据信息的多少,方差解释率越大说明因子包含的信息越多。因子分析中,主要关注旋转后的数据部分。由上图可以显示17个指标中,五个因子方差解释率分别为26.400%、21.703%、19.013%、15.359%以及7.087%,累积方差解释率由五项相加为89.563%,累积方差解释率这个值没有固定标准,一般超过60%都可以接受。特征根对于因子的提取有什么作用,以下展开来说。
  
 (2)特征根
  
  特征根 一般是指标旋转前每个因子的贡献程度。此值的总和与项目数匹配,此值越大,代表因子贡献越大。当然因子分析通常需要综合自己的专业知识综合判断,即使是特征根值小于1,也一样可以提取因子。在进行因子分析时,研究者没有预设因子数,系统就会以特征根“大于1”为标准进行划分。因为此案例在分析前的预设因子个数为4所以也同样可以进行分析。除了特征根之外SPSSAU还提供了更加直观的碎石图帮助判断。
  
 (3)碎石图
                                          
 从图中可以看出,横轴表示指标数,纵轴表示特征根值,当提取前5个因子时,特征根值变化较明显,对解释原有变量的贡献较大;当提取5个以后的因子时,特征根变化也相对平稳,对原有变量贡献相对较小,由此可见提取前5个因子对原变量有的显著作用。碎石图仅辅助决策因子个数,如果由此图分析三个因子也是可以的。
  
 此案例按专业知识来看提取5个因子,如果没有预设因子个数也可以默认让系统进行决策。提取后要观察因子的信息浓缩程度。
  
 5.信息浓缩
  
 旋转后因子载荷系数表
                                          
  旋转后因子载荷系数 可以用于判断因子与题项之间的对应关系,如果出现“张冠李戴”或者“纠缠不清”的情况需要关注,上述结果已经是处理后的结果,以及各个题项的共同度。如果某分析项对应的多个因子载荷系数绝对值均低于0.4,可考虑删除该项。上图分析中均大于0.4。所以不用删除调整。
  
 从结果中可以看出,使用因子分析对14个项进行浓缩处理,浓缩为四个因子。因子与题项对应关系如下:
  
 其中品牌活动1-4在因子1上有较高的载荷,说明因子1可以解释这几个分析项,它们主要反映了短视频平台进行品牌传播中的品牌活动;品牌赞助1-4在因子2上有较高的载荷,它们主要反映了短视频平台进行品牌传播中的品牌赞助活动;社会责任感1-4在因子3上有较高的载荷,它们主要反映了短视频平台进行品牌传播的社会责任等;购买意愿2-4在因子4上有较高的载荷,它们主要反映了短视频平台某品牌用户的购买意愿,品牌代言人1-2在因子5上有较高的载荷,它们主要反映了短视频平台某品牌用的代言人受众情况。
  
 从上表可知:所有研究项对应的共同度值均高于0.4,意味着研究项和因子之间有着较强的关联性,因子可以有效的提取出信息。因为本篇案例是想得到 因子得分后进行聚类分析 进行命名得到有效结论用于公司决策。所以对于因子分析权重方面不进行赘述,如想了解,可以点击文末链接进行查看。
  
 6.因子得分
  
 因子分析往往是预处理步骤,后续还需要结合具体研究目的进行分析,如回归分析、聚类分析等。此时,可能需要用到因子得分,返回分析页面勾选[因子得分]即可生成因子得分。因为本篇案例的研究目的是利用因子得分进行聚类分析,所以需要勾选[因子得分],以及对因子得分进行命名。
                                          
 5个维度命名分别为品牌活动、品牌赞助、社会责任感、购买意愿以及品牌代言人如下:
                                          
 接下来利用因子得分进行聚类分析,聚类分析将从,聚类基本情况,方差分析,聚类效果的图示化以及聚类命名来说明。
  
 四、聚类分析结果
  
 首先要查看数据分布是否均匀,一般来说,每个类别的样本比例应分布均匀,如果出现某一类占比过大或过小,可以考虑重新设置聚类类别个数。
  
 1.聚类基本情况
                                          
 使用聚类分析对样本进行分类,使用Kmeans聚类分析方法,从上表可以看出:最终聚类得到3类群体,此3类群体的占比分别是42.50%, 14.50%, 43.00%。整体来看,3类人群分布较为均匀,整体说明聚类效果较好。
  
 2.方差分析
                                          
 聚类类别与聚类分析项进行交叉分析,如果呈现出显著性(p<0.05),意味着聚类得到的不同类别样本,在相同指标上有明显的差异。这说明参与聚类分析的5个变量能够很好的区分类别,类间差异足够大,其中p值越小说明明类别之间的差异越大。
  
 对不同类别进行均值比较除了可以查看方差分析还可以进行查看 聚类项重要性对比。 
                                          
 如果某个指标重要性较低,考虑移出该指标。从上述结果看,所有研究项均呈现出显著性,说明不同类别之间的特征有明显的区别,聚类的效果较好。
  
 3.聚类效果的图示化
  
 可通过散点图直观展示聚类效果,使用任意两个聚类指标进行散点图绘制(可视化模块里面的散点图),并且在‘颜色区分(定类)[可选]框中放入‘聚类类别’项,以查看不同类别时,两两指标的散点效果。
                                          
 从图中可以发现各个类别之间有明显的区别,聚类的效果较好。其中发现第一个类别品牌活动与品牌代言人都比较大,建议研究时可以更加关注。
  
 4.聚类类别命名
  
 研究者也可以观察折线图趋势进行命名。参考如下:
                                          
 通过上图可知,第一类人群在每个指标上的得分都比较高,可以命名为旅“品牌发烧友”。第二类人群在社会责任感、购买意愿得分较高,品牌代言人、品牌赞助得分较低,品牌活动介于二者之间,可命名为“品牌从众友”。第三类各项得分都较低,命名为“品牌冷淡者”。
  
 将三类命名:SPSSAU‘数据处理’- ‘数据标签’。
                                          
 5.聚类后的差异分析
  
 得到聚类类别之后,接着需要对比不同类别群体的差异性;如在“性别”、“年龄”上的差异性。最常见与个人信息情况做交叉分析,可以得到不同类型的人群分布情况便于结合不同群体提出针对性的建议措施。本次案例将聚类类别与“年龄”进行交叉分析,如下进行阐述。
                                          
 从上表可知,利用卡方检验(交叉分析)去研究年龄对于聚类类别共1项的差异关系,从上表可以看出:不同年龄样本对于聚类类别共1项呈现出显著性(p<0.05),意味着不同年龄样本对于聚类类别共1项均呈现出差异性,具体建议可结合括号内百分比进行差异对比。
  
 年龄对于聚类类别呈现出0.05水平显著性(chi=14.335, p=0.026<0.05),通过百分比对比差异可知,26-30岁选择品牌发烧友的比例49.21%,会明显高于平均水平42.50%。20-25岁选择品牌从众者的比例26.23%,会明显高于平均水平14.50%。36-40岁选择品牌冷淡者的比例53.33%,会明显高于平均水平43.00%。31-35岁选择品牌冷淡者的比例49.18%,会明显高于平均水平43.00%。可以根据数据结果进一步决策。也可以和“性别”、“学历”等进行交叉分析。这里不进行过多描述。
  
 五、其它
  
 1.聚类中心
  
 整体说明聚类效果较好
                                          
 上表为经过迭代后类中心的变化,数据是经过标准化后的,至于数据是否需要标准化,聚类算法是根据距离进行判断类别,因此一般需要在聚类之前进行标准化处理,SPSSAU 默认 是选中进行标准化处理。数据标准化之后,数据的相对大小意义还在(比如数字越大GDP越高),但是实际意义消失了。
  
 2.SSE
  
 对于聚类中心的 SSE 指标说明如下:
  
 在进行Kmeans聚类分析时SPSSAU默认输出误差平方和SSE值,该值可用于测量各点与中心点的距离情况,理论上是希望越小越好,而且如果同样的数据,聚类类别越多则SSE值会越小(但聚类类别过多则不便于分析)。SSE指标可用于辅助判断聚类类别个数,建议在不同聚类类别数量情况下记录下SSE值,然后分析SSE值的减少幅度情况,如果发现比如从2个聚类到3个6类别时SSE值减少幅度明显很大,那么此时选择3个聚类类别较好。比如该案例若聚类数为2,此时SSE值为872.226,但是当聚类数为3时此时SSE值为779.077,发现SSE减少幅度较大。所以可以看出选择3个聚类类别较好。
                                          
 六、总结
  
 本篇案例结合了线性回归与聚类分析,由于分析项过多,先进行因子分析,通过因子分析发现存在“张冠李戴”的情况,需要调整因子,调整因子后分析因子提取、信息浓缩情况,并且得到因子得分,进一步进行聚类分析,发现初步结果较好,将结果进行图示化展示,可以看出各个类别之间有明显的区别,将类别命名后,进行交叉分析,发现类别与年龄之间存在差异,并且具体描述,对公司或者平台对后续决策中提供有效结论。

5. 聚类分析的因子分析模型

因子分析模型(FA)基本思想因子分析模型FA的基本思想“因子分析”于1931年由Thurstone提出,概念起源于Pearson和Spearmen的统计分析FA用少数几个因子来描述多个变量之间的关系,相关性较高的变量归于同一个因子;FA利用潜在变量或本质因子(基本特征)去解释可观测变量FA模型X1=a11F1+a12F2+ …+a1pFp+v1X2=a21F1+a22F2+ …+a2pFp+v2 X=AF+VXi=ai1F1+ai2F2+ …+aipFp+viXm=ap1F1+ap2F2+ …+ampFm+vmXi — 第i个标准化变量aip — 第i个变量对第p个公因子的标准回归系数F — 公因子Vi — 特殊因子公因子模型F1=W11X1+W12X2+ …+W1mXmF2=W21X1+W22X2+ …+W2mXmFi=Wi1X1+Wi2X2+ …+WimXmFp=Wp1X1+Wp2X2+ …+WpmXmWi — 权重,因子得分系数Fi — 第i个因子的估计值(因子得分)有关统计量Bartlett氏球体检验:各变量之间彼此独立KMO值:FA合适性因子负荷:相关系数因子负荷矩阵公因子方差(共同度)特征值方差百分比(方差贡献率)累计方差贡献率因子负荷图碎石图FA步骤定义问题检验FA方法的适用性确定因子分析方法因子旋转解释因子计算因子得分注意事项样本量不能太小变量相关性公因子有实际意义

聚类分析的因子分析模型

6. 聚类分析、判别分析、主成分分析、因子分析

来自: 带呀带尾呀 (数据小生、数字营销、新媒体)
  
 主成分分析与因子分析的区别
  
 1. 目的不同: 因子分析把诸多变量看成由对每一个变量都有作用的一些公共因子和仅对某一个变量有作用的特殊因子线性组合而成,因此就是要从数据中控查出对变量起解释作用的公共因子和特殊因子以及其组合系数;主成分分析只是从空间生成的角度寻找能解释诸多变量变异的绝大部分的几组彼此不相关的新变量(主成分)。
  
 2. 线性表示方向不同: 因子分析是把变量表示成各公因子的线性组合;而主成分分析中则是把主成分表示成各变量的线性组合。
  
 3. 假设条件不同:主成分分析中不需要有假设;因子分析的假设包括:各个公共因子之间不相关,特殊因子之间不相关,公共因子和特殊因子之间不相关。
  
 4. 提取主因子的方法不同:因子分析抽取主因子不仅有主成分法,还有极大似然法,主轴因子法,基于这些方法得到的结果也不同;主成分只能用主成分法抽取。
  
 5. 主成分与因子的变化:当给定的协方差矩阵或者相关矩阵的特征值唯一时,主成分一般是固定的;而因子分析中因子不是固定的,可以旋转得到不同的因子。
  
 6. 因子数量与主成分的数量:在因子分析中,因子个数需要分析者指定(SPSS根据一定的条件自动设定,只要是特征值大于1的因子主可进入分析),指定的因子数量不同而结果也不同;在主成分分析中,成分的数量是一定的,一般有几个变量就有几个主成分(只是主成分所解释的信息量不等)。
  
 7. 功能:和主成分分析相比,由于因子分析可以使用旋转技术帮助解释因子,在解释方面更加有优势;而如果想把现有的变量变成少数几个新的变量(新的变量几乎带有原来所有变量的信息)来进入后续的分析,则可以使用主成分分析。当然,这种情况也可以使用因子得分做到,所以这种区分不是绝对的。
  
 1 、聚类分析
  
 基本原理:将个体(样品)或者对象(变量)按相似程度(距离远近)划分类别,使得同一类中的元素之间的相似性比其他类的元素的相似性更强。目的在于使类间元素的同质性最大化和类与类间元素的异质性最大化。
  
 常用聚类方法:系统聚类法,K-均值法,模糊聚类法,有序样品的聚类,分解法,加入法。
  
 注意事项:1. 系统聚类法可对变量或者记录进行分类,K-均值法只能对记录进行分类;
  
 2. K-均值法要求分析人员事先知道样品分为多少类;
  
 3. 对变量的多元正态性,方差齐性等要求较高。
  
 应用领域:细分市场,消费行为划分,设计抽样方案等
  
 2、判别分析
  
 基本原理:从已知的各种分类情况中总结规律(训练出判别函数),当新样品进入时,判断其与判别函数之间的相似程度(概率最大,距离最近,离差最小等判别准则)。
  
 常用判别方法:最大似然法,距离判别法,Fisher判别法,Bayes判别法,逐步判别法等。
  
 注意事项:1. 判别分析的基本条件:分组类型在两组以上,解释变量必须是可测的;
  
 2. 每个解释变量不能是其它解释变量的线性组合(比如出现多重共线性情况时,判别权重会出现问题);
  
 3. 各解释变量之间服从多元正态分布(不符合时,可使用Logistic回归替代),且各组解释变量的协方差矩阵相等(各组协方方差矩阵有显著差异时,判别函数不相同)。
  
 相对而言,即使判别函数违反上述适用条件,也很稳健,对结果影响不大。
  
 应用领域:对客户进行信用预测,寻找潜在客户(是否为消费者,公司是否成功,学生是否被录用等等),临床上用于鉴别诊断。
  
 3、 主成分分析/ 因子分析
  
 主成分分析基本原理:利用降维(线性变换)的思想,在损失很少信息的前提下把多个指标转化为几个综合指标(主成分),即每个主成分都是原始变量的线性组合,且各个主成分之间互不相关,使得主成分比原始变量具有某些更优越的性能(主成分必须保留原始变量90%以上的信息),从而达到简化系统结构,抓住问题实质的目的。
  
 因子分析基本原理:利用降维的思想,由研究原始变量相关矩阵内部的依赖关系出发,把一些具有错综复杂关系的变量归结为少数几个综合因子。(因子分析是主成分的推广,相对于主成分分析,更倾向于描述原始变量之间的相关关系)
  
 求解主成分的方法:从协方差阵出发(协方差阵已知),从相关阵出发(相关阵R已知)。
  
 (实际研究中,总体协方差阵与相关阵是未知的,必须通过样本数据来估计)
  
 求解因子载荷的方法:主成分法,主轴因子法,极大似然法,最小二乘法,a因子提取法。
  
 注意事项:1. 由协方差阵出发与由相关阵出发求解主成分所得结果不一致时,要恰当的选取某一种方法;
  
 2. 对于度量单位或是取值范围在同量级的数据,可直接求协方差阵;对于度量单位不同的指标或是取值范围彼此差异非常大的指标,应考虑将数据标准化,再由协方差阵求主成分;
  
 3.主成分分析不要求数据来源于正态分布;
  
 4. 在选取初始变量进入分析时应该特别注意原始变量是否存在多重共线性的问题(最小特征根接近于零,说明存在多重共线性问题)。
  
 5. 因子分析中各个公共因子之间不相关,特殊因子之间不相关,公共因子和特殊因子之间不相关。
  
 应用领域:解决共线性问题,评价问卷的结构效度,寻找变量间潜在的结构,内在结构证实。
  
 4、对应分析/最优尺度分析
  
 基本原理:利用降维的思想以达到简化数据结构的目的,同时对数据表中的行与列进行处理,寻求以低维图形表示数据表中行与列之间的关系。
  
 对应分析:用于展示变量(两个/多个分类)间的关系(变量的分类数较多时较佳);
  
 最优尺度分析:可同时分析多个变量间的关系,变量的类型可以是无序多分类,有序多分类或连续性变量,并 对多选题的分析提供了支持。
  
 5、典型相关分析
  
 基本原理:借用主成分分析降维的思想,分别对两组变量提取主成分,且使从两组变量提取的主成分之间的相关程度达到最大,而从同一组内部提取的各主成分之间互不相关。

7. spss聚类分析和因子分析的区别

因子分析和聚类分析,很多时候容易混淆。接下来讲讲二者的区别和联系
因子分析:比如有20个题,将20个题浓缩成5个关键词;
聚类分析:常见为样本聚类,比如有500个人,这500个人可以聚成几个类别。
因子分析和聚类分析的联系在于:
分析角度上,比如:可先讲20个题做因子分析,并且得到因子得分。将因子得分在进一步进行聚类分析。最终聚类得到几个类别群体。再去对比几个类别群体的差异等。

spss聚类分析和因子分析的区别

8. 聚类分析的区别