与大数据聚类
6视图(30天)
显示旧的评论
我有一个向量与500万年距离(5000000 * 1)获得通过
pdist
功能和目的是做分层聚类分析。但是当我使用了
链接
函数得到以下错误:
错误使用链接(第240行)要求1 x12081952473360 (90017.6 gb)数组超过最大数组大小的偏好。创建数组超过这个极限可能需要很长时间,导致MATLAB变得反应迟钝。有关更多信息,请参见数组大小限制或首选项面板。
我想知道如何避免这个错误,如果那是不可能的,我应该使用哪个函数来进行聚类分析。
提前谢谢。
0评论
接受的答案
Bernhard Suhm
2018年8月6日
也许你是使用链接函数不正确。你已经成对的距离,但因为某些原因联系函数认为你把样品(X),而不是(Y)的距离。链接不应该麻烦把5000000的距离,可能仅仅是一种把距离正确的形式。