解释分层聚类的结果

2视图(30天)
sc
sc 2015年6月10日
评论道: sc2015年6月10日
我试图进行矢量量化的数据集使用HCA的教程 //www.tianjin-qmedu.com/help/stats/hierarchical-clustering.html
这是我的代码段
% M M N维度的条目的数据矩阵,在[M, N] =大小(X);
CLUSTER_DESIRED = 128;
Y = pdist (X);% Y矩阵表示为一个向量的距离
Z =连杆(Y);% Z包含集群二叉树
c = cophenet (Z, Y);% c措施集群相关系数
T =集群(Z,“maxclust”,CLUSTER_DESIRED);%为每个数据点分配一个集群
h =嘘(T, CLUSTER_DESIRED);%计算点的数量在每个集群
大约是32000和N大约40我的数据。事实证明,大部分的点被分配到1 128集群(超过95%的所有数据)。做HCA之前,我试图使用k - means发展速率,以及由此产生的码书是不好的对我后续的实验。我猜HCA的结果告诉我,我的数据肯定是向量空间中均匀分散。我解释这个正确吗?矢量量化是不会为这样adata组工作?
1评论
sc
sc 2015年6月10日
我意识到链接函数使用默认“单一”链接。所以我尝试其他链接。事实证明一切,但“沃德”生成较密集。“病房”链接,另一方面,生成更多的传播集群。然而,ophenetic相关系数较低(0.5629)相比,在0.8“单一”链接。现在我有问题确定集群的数量。

登录置评。

答案(0)

社区寻宝

找到宝藏在MATLAB中央,发现社区如何帮助你!

开始狩猎!