与大数据聚类

6视图(30天)
Filipa卡多佐
Filipa卡多佐 2018年7月17日
评论道: Filipa卡多佐2018年8月14日
我有一个向量与500万年距离(5000000 * 1)获得通过 pdist 功能和目的是做分层聚类分析。但是当我使用了 链接 函数得到以下错误:
错误使用链接(第240行)要求1 x12081952473360 (90017.6 gb)数组超过最大数组大小的偏好。创建数组超过这个极限可能需要很长时间,导致MATLAB变得反应迟钝。有关更多信息,请参见数组大小限制或首选项面板。
我想知道如何避免这个错误,如果那是不可能的,我应该使用哪个函数来进行聚类分析。
提前谢谢。

接受的答案

Bernhard Suhm
Bernhard Suhm 2018年8月6日
也许你是使用链接函数不正确。你已经成对的距离,但因为某些原因联系函数认为你把样品(X),而不是(Y)的距离。链接不应该麻烦把5000000的距离,可能仅仅是一种把距离正确的形式。
2的评论
Filipa卡多佐
Filipa卡多佐 2018年8月14日
我确实使用连杆函数错了因为我是移调pdist的输出函数。

登录置评。

更多的答案(0)

社区寻宝

找到宝藏在MATLAB中央,发现社区如何帮助你!

开始狩猎!