我怎么能确定我的数据的特征x大多为线性判别分析的分类?

6视图(30天)
亲爱的,我想知道是否有可能知道一个数据集的特点主要为分类由线性判别分析。
使我的问题更清晰,让我们在Matlab提供的示例:费舍尔的虹膜数据。
每一行的数据集 fisheriris 包含一个示例的虹膜花和列的值:花萼长度、宽度萼片,花瓣长度,花瓣宽度。
我想知道哪些功能(花萼长度或宽度或花瓣长度)的分类中最贡献虹膜setosa或virginica示例之一。
我可以获得这个信息使用分类或fitcdiscr吗?
我希望我的问题是明确的,
谢谢你的帮助,
安德里亚
2的评论
沙子
沙子 2017年11月22日
你好,谢谢你的回复
让我们看一个具体的例子让我们假设我有两个的小组花f1和f2 = =玫瑰茉莉花。每一行代表一个样本的玫瑰花瓣大小/茉莉花和列(列2 = 1 =身高等列宽度)。
f1 = [1 2
2 3
1 - 4
2 3];
f2 = [1 7
2 9
1 10
2 8];
假设我建立了判别模型,用它来预测新样本的类x = 9 [1]。模型告诉我,新样本的类f2。从这个例子似乎特性的花瓣宽度(第2列)是最重要的类新样品。然而,当一个有200个特性(200列)或多个变得难以理解这些特性中的哪一个最有助于分类。所以我怎样才能获得这些信息。线性判别模型的系数传达这个信息?
谢谢你的帮助

登录置评。

接受的答案

Bernhard Suhm
Bernhard Suhm 2017年12月13日
系数的大小是衡量预测的重要性。与规范化培训后数据(零均值和单位方差),这种方法存储在DeltaPredictor财产。参见回答从3年前,//www.tianjin-qmedu.com/matlabcentral/answers/119122-how-can-we-know-the-most-imortant-predictor-in-discriminant-analysis

更多的答案(0)

社区寻宝

找到宝藏在MATLAB中央,发现社区如何帮助你!

开始狩猎!