我怎么能确定我的数据的特征x大多为线性判别分析的分类?

6视图(30天)

显示旧的评论

沙子 2017年11月8日

0
链接

这个问题直接联系

//www.tianjin-qmedu.com/matlabcentral/answers/365824-how-can-i-identify-the-features-of-my-data-x-that-mostly-contribute-to-the-classification-of-linear

回答: Bernhard Suhm 2017年12月13日

答:接受 Bernhard Suhm

亲爱的,我想知道是否有可能知道一个数据集的特点主要为分类由线性判别分析。

使我的问题更清晰,让我们在Matlab提供的示例:费舍尔的虹膜数据。

每一行的数据集 fisheriris 包含一个示例的虹膜花和列的值:花萼长度、宽度萼片,花瓣长度,花瓣宽度。

我想知道哪些功能(花萼长度或宽度或花瓣长度)的分类中最贡献虹膜setosa或virginica示例之一。

我可以获得这个信息使用分类或fitcdiscr吗?

我希望我的问题是明确的,

谢谢你的帮助,

安德里亚

2的评论
显示隐藏 1年长的评论

沙子 2017年11月22日

你好,谢谢你的回复

让我们看一个具体的例子让我们假设我有两个的小组花f1和f2 = =玫瑰茉莉花。每一行代表一个样本的玫瑰花瓣大小/茉莉花和列(列2 = 1 =身高等列宽度)。

假设我建立了判别模型,用它来预测新样本的类x = 9 [1]。模型告诉我,新样本的类f2。从这个例子似乎特性的花瓣宽度(第2列)是最重要的类新样品。然而,当一个有200个特性(200列)或多个变得难以理解这些特性中的哪一个最有助于分类。所以我怎样才能获得这些信息。线性判别模型的系数传达这个信息?

谢谢你的帮助

登录置评。

在回答这个问题。

接受的答案

Bernhard Suhm 2017年12月13日

1
链接

直接链接到这个答案

//www.tianjin-qmedu.com/matlabcentral/answers/365824-how-can-i-identify-the-features-of-my-data-x-that-mostly-contribute-to-the-classification-of-linear answer_295998

系数的大小是衡量预测的重要性。与规范化培训后数据(零均值和单位方差),这种方法存储在DeltaPredictor财产。参见回答从3年前,//www.tianjin-qmedu.com/matlabcentral/answers/119122-how-can-we-know-the-most-imortant-predictor-in-discriminant-analysis

0评论
显示隐藏1以上的评论

登录置评。

类别

人工智能,数据科学和统计数据统计和机器学习工具分类判别分析

找到更多的在判别分析在帮助中心和文件交换

s manbetx 845

统计和机器学习工具

社区寻宝

找到宝藏在MATLAB中央,发现社区如何帮助你!

开始狩猎!