ドキュメンテーションヘルプセンター
最新のリリースでは,このページがまだ翻訳されていません。このページの最新版は英语でご覧になれます。
リンケージによる凝集型クラスターの构筑
T =集群(Z,“截止”,C)
T =簇(Z, '截止',C, '深度',d)
T =簇(Z, '截止',C, '标准',标准)
T =簇(Z, 'MaxClust',N)
Ť=簇(ž,'隔断',C)は,凝集型の阶层クラスターツリーžからクラスターを定义します。入力žは,入力データ行列Xに対する关数连锁の出力です。簇は,ツリー内のノードの不整合係数(または不符の値)のしきい値としてCを使用して,žをクラスターに分割します。出力Ťには,各観測値(Xの行)のクラスター割り当てが格纳されます。
Ť=簇(ž,'隔断',C)
Ť
ž
'隔断'
C
X
连锁
簇
不符
例
Ť=簇(ž,'隔断',C,'深度',d)は,各ノードで深さdまで调べることにより,不符の値を评価します。
Ť=簇(ž,'隔断',C,'深度',d)
'深度'
d
Ť=簇(ž,'隔断',C,'标准',标准)は,クラスターを定義するための标准として“不一致”(既定)または“距离”を使用します。簇がクラスターを定义するには,标准がC未満でなければなりません。
Ť=簇(ž,'隔断',C,'标准',标准)
'标准'
标准
“不一致”
“距离”
Ť=簇(ž,“MaxClust”,ñ)は,クラスターを定義する基準として“距离”を使用して,最大ñ个のクラスターを定义します。
Ť=簇(ž,“MaxClust”,ñ)
“MaxClust”
ñ
すべて折りたたむ
各ノードで深さ4まで不整合値を評価することにより,無作為に生成したデータに対して凝集型クラスタリングを実行します。
标本データを无作为に生成します。
rng (“默认”);%的再现性2 X = [(randn(20日)* 0.75)+ 1;2 (randn(20日)* 0.25)1);
データの散布図を作成します。
散射(X(:,1),X(:,2));标题(“随机产生的数据”);
病房连结法を使用して阶层クラスターツリーを作成します。
病房
Z =键(X,“病房”);
データの系统树プロットを作成します。
系统树图(Z)
散布図と系统树プロットでは,データに2つのクラスターがあるように见えます。
不整合系数のしきい値として3を使用し,各ノードで深さ4まで调べることにより,データをクラスター化します。生成されたクラスターをプロットします。
T =簇(Z,'隔断'3,'深度',4);gscatter(X(:,1),X(:,2),T)
簇は,データ内のクラスターを2つ识别します。
クラスターを定义する基准として“距离”を使用することにより,fisheririsデータセットに対して凝集型クラスタリングを実行します。データのクラスター割り当てを可视化します。
fisheriris
fisheririsデータセットを読み込みます。
加载fisheriris
种をグループ化変数として使用して,データの2次元散布図を可视化します0.3つの异なる种についてマーカーの色と记号を指定します。
gscatter(量(:1)量(:,2),物种,“rgb”,'做*')标题(“费舍尔的虹膜数据的实际集群”)
'平均'法と“切比雪夫”尺度を使用して階層クラスターツリーを作成します。
'平均'
“切比雪夫”
Z =连杆(量,'平均',“切比雪夫”);
“距离”基准のしきい値として1.5を使用して,データをクラスター化します。
T =簇(Z,'隔断',1.5%,'标准',“距离”)
T =150×12 2 2 2 2 2 2 2 2 2⋮
Ťには,クラスター割り当てに対応する番号が格納されます。簇が识别したクラス数を求めます。
长度(独特(T))
ANS = 3
簇は,指定された値の隔断および标准に対して3つのクラスを識別します。
隔断
Ťをグループ化変数として使用して,クラスター化の结果の2次元散布図を可视化します0.3つの异なるクラスについてマーカーの色と记号を指定します。
gscatter(MEAS(:,1),MEAS(:,2),T,“rgb”,'做*')标题(“费舍尔的虹膜数据的聚类分配”)
クラスター化により,setosaクラス(クラス2)は独立したクラスターに属するように正しく识别されますが,云芝クラス(クラス1)と锦葵クラス(クラス3)の区别は不十分です。散布図におけるクラスのラベル付けにはŤに格纳されている番号が使用されることに注意してください。
fisheririsデータセットで最大3つのクラスターを求め,花のクラスター割り当てを既知の分类と比较します。
标本データを読み込みます。
データ内のクラスターを最大3つ求めます。
T =簇(Z,'maxclust',3);
žの系統樹図を作成します。3つのクラスターを表示するため,3番目から最後までのリンクと2番目から最後までのリンクの中間点にカットオフを設定して'ColorThreshold'を使用します。
'ColorThreshold'
截留值=中间值([Z(端2,3)Z(最终1,3)]);树状图(Z,'ColorThreshold',隔断)
3つのクラスターがどのようにして1つに結合されるかを調べるため,žの最後の2行を表示します。连锁は,293番目のクラスター(青)を297番目のクラスター(赤)と结合し,1.7583というリンクで298番目のクラスターを形成します。そして,连锁は296番目のクラスター(绿)を298番目のクラスターと结合します。
1.7583
lastTwo = Z(最终1:端,:)
lastTwo =2×3293.0000 297.0000 1.7583 296.0000 298.0000 3.4445
クラスターの割り当てが3つの种类に対応していることを确认します。たとえば,クラスターの1つには,2-番目の种类の花が50本3番目の種類の花が40本含まれています。
50
40
交叉(T,物种)
ANS =3×30 0 10 0 50 40 50 0 0
20000件の観測値をもつ標本データを無作為に生成します。
rng (“默认”)%的再现性X =兰德(20000 3);
病房連結法を使用して階層クラスターツリーを作成します。このケースでは,既定により関数clusterdataの'SaveMemory'オプションが'上'に设定されます通常。は,Xの次元数と使用可能メモリに基づいて'SaveMemory'に最适な値を指定します。
clusterdata
'SaveMemory'
'上'
データを最大4つのグループにクラスター化し,結果をプロットします。
C =簇(Z,'Maxclust',4);scatter3(X(:,1),X(:,2),X(:,3),10,c)中
簇は,データ内のグループを4つ识别します。
关数连锁の出力である,凝集型の階層クラスターツリー。数値行列を指定します。行数(観測値の個数)がmである入力データ行列Xの場合,连锁は(m - 1)行3列の行列žを返します。连锁がクラスターツリーを作成する方法の説明については,žを参照してください。
例:Z =键(X)。Xは入力データ行列です。
Z =键(X)
データ型:单|双
单
双
クラスターを定义するためのしきい値。正のスカラー,または正のスカラーのベクトルを指定します。簇は,阶层クラスターツリーでクラスターを定义するための标准に応じて,ノードの高さまたは不整合係数のしきい値としてCを使用します。
クラスターを定义する基准が“距离”である場合,あるノードの高さがC未満であれば,簇はそのノードの位置以下にあるすべてのリーフをクラスターにグループ化します。
クラスターを定义する基准が“不一致”である場合,あるノードおよびそのすべてのサブノードで不符の値がC未満であれば,簇はこれらのノードをクラスターにグループ化します。簇は,クラスターツリーžのルートから出発して,不符の値がしきい値C未満であり,サブノード(子孙)の不整合系数がC未満であるノードに到达するまでツリー内を下方向に移动します。そして,簇はそのノードの位置以下にあるすべてのリーフをクラスター(ノード自体がリーフである场合はシングルトン)にグループ化します。簇は,すべてのリーフノードがクラスターに含まれるようになるまで,ツリー内のすべての分岐を探索します。
例:集群(Z,“截止”,0.5)
集群(Z,“截止”,0.5)
不整合値を计算する深さ。数値スカラーを指定します。簇は,各ノードを深さdまで调べることにより,不整合値を评価します。
例:集群(Z,“截止”,0.5,“深度”,3)
集群(Z,“截止”,0.5,“深度”,3)
クラスターを定义するための基准。“不一致”または“距离”を指定します。
クラスターを定义する基准が“距离”である場合,あるノードの高さがC未満であれば,簇はそのノードの位置以下にあるすべてのリーフをクラスター(ノード自体がリーフである場合はシングルトン)にグループ化します。ツリー内のノードの高さは,そのノードで結合されている2つのサブノードの間の距離を表します。“距离”を指定した场合,クラスターはžの系统树图プロットの水平スライスに対応します。
系统树图
クラスターを定义する基准が“不一致”である場合,あるノードおよびそのすべてのサブノードの不整合係数(不符の値)がC未満であれば,簇はそのノードおよびサブノードをクラスターにグループ化します。“不一致”という指定は,集群(Z,“截止”,C)と等価です。
集群(Z,“截止”,C)
例:簇(Z, '截止',0.5, '标准', '距离')
簇(Z, '截止',0.5, '标准', '距离')
データ型:字符|字符串
字符
字符串
形成するクラスターの最大数。正の整数,または正の整数のベクトルを指定します。簇は,クラスターを定義する基準として“距离”を使用して,最大ñ个のクラスターを构筑します。ツリー内の各ノードの高さは,そのノードで结合されている2つのサブノードの间の距离を表します。簇は,ツリーを水平に切り取るとñ个以下のクラスターが残る,最小の高さを求めます。详细については,任意のクラスターの指定を参照してください。
例:集群(Z, MaxClust, 5)
集群(Z, MaxClust, 5)
クラスター割り当て,数値ベクトルまたは行列として返されます。(m - 1)行3列の階層クラスターツリーž(入力Xに対する连锁の出力)の场合,Xのm個の行(観測値)に対するクラスター割り当てがŤに格纳されます。
Ťのサイズは,対応するCまたはñのサイズによって异なります。
Cが正のスカラーである场合,Ťは长さ米のベクトルになります。
ñが正の整数である场合,Ťは长さ米のベクトルになります。
Cが正のスカラーによる长さ升のベクトルである场合,Ťは米行升列の行列になり,各列がCの各値に対応します。
ñが正の整数による長さlのベクトルである場合,Ťは米行升列の行列になり,各列がñの各値に対応します。
入力データ行列Xがある場合,clusterdataを使用すると,凝集型クラスタリングを実行して,X内の各観测値(行)のクラスターインデックスを取得できます。关数clusterdataは必要な手順をすべて実行するので,関数pdist,连锁および簇を個別に実行する必要はありません。
pdist
clusterdata|cophenet|系统树图|不符|kmeans|连锁|pdist
cophenet
kmeans
この例の変更されたバージョンがシステム上にあります。代わりにこのバージョンを開きますか吗?
MATLABのコマンドを実行するリンクがクリックされました。
このリンクは,网络ブラウザーでは动作しません.MATLABコマンドウィンドウに以下を入力すると,このコマンドを実行できます。
选择一个网站,以获得翻译的内容,其中可看到当地的活动和优惠。根据您的位置,我们建议您选择:。
您还可以选择从下面的列表中的网站:
选择最佳的网站性能的中国网站(在中国或英文)。其他MathWorks的国家网站都没有从您的位置访问进行了优化。
联系当地办事处