文档

描述性统计

如果需要更高级的统计特性,可能需要使用statistics和Machine Learning Toolbox™软件。

计算描述性统计的函数

使用下面的MATLAB®函数计算数据的描述性统计信息。

笔记

对于矩阵数据,独立计算每列的描述性统计数据。

统计功能摘要

函数

描述

马克斯

最大值

的意思是

平均值

中值的

中值

最小值

模式

最频繁值

性病

标准差

变量

方差,测量值的扩散或分散

以下示例应用MATLAB函数计算描述性统计数据:

示例1-计算最大值、平均值和标准偏差

这个例子展示了如何使用MATLAB函数来计算被称为的24 × 3矩阵的最大值、平均值和标准偏差值计数.MATLAB为矩阵中的每列独立计算这些统计信息。

%加载样本数据Load count.dat%查找每列的最大值mx=max(count)%计算每列的平均值mu=MEANCE(count)%计算每列的标准偏差sigma=std(count)

结果是

Mx = 114 145 257亩= 32.0000 46.5417 65.5833 sigma = 25.3703 41.4057 68.0281

要获取每个数据列中出现最大数据值的行号,请指定第二个输出参数indx返回行索引。例如:

[mx,indx]=最大值(计数)

这些结果是

mx=114 145 257 indx=20

这里的变量mx是包含三个数据列中每个列的最大值的行向量。的变量indx包含与最大值对应的每列中的行索引。

在整个过程中查找最小值计数矩阵,使用语法将24×3矩阵转换为72×1列向量计数(:)。然后,要在单列中查找最小值,请使用以下语法:

最小(计数(:)ans=7

示例2-减去平均值

用下面的语法从矩阵的每一列减去平均值:

%获取计数矩阵的大小[n,p]=size(count)%计算每列的平均值mu=mean(count)%通过%复制n行的mu向量MeanMat=repmat(mu,n,1)%从该列x=count-MeanMat中的每个元素%中减去列平均值来创建平均值矩阵

笔记

从数据中减去平均值也称为厌恶. 有关从数据中删除平均值或最佳拟合线的详细信息,请参阅消除趋势数据.

示例:使用MATLAB数据统计

“数据统计信息”对话框帮助您使用数据计算和绘制描述性统计信息。此示例演示如何使用MATLAB数据统计来计算和绘制24×3矩阵的统计信息,该矩阵称为计数. 数据表示三条街道上通过交通计数站的车辆数量。

本节包含以下主题:

笔记

MATLAB数据统计仅适用于二维绘图。

计算和绘制描述性统计数据

  1. 加载并绘制数据:

    负载count.dat[n,p]=大小(计数);%定义x值t=1:n;%绘制数据并注释图表绘图(t,计数)图例(“站1”,《站2》,'站3 ',“位置”,“西北”)包含(“时间”) ylabel (的车辆数)

    笔记

    图中包含每个数据集的名称,由传奇功能:站1,站2,站3A.数据集指绘制的数组中的每列数据。如果不命名数据集,则会指定默认名称:数据1,数据2等等

  2. 在Figure窗口中,选择工具>数据统计.

    属性的数据统计对话框将打开并显示描述性统计信息X- - -Y-委员会的数据站1数据集。

    笔记

    “数据统计信息”对话框将显示范围,即所选数据集中的最小值与最大值之间的差值。对话框不显示绘图上的范围。

  3. 在中选择不同的数据集统计数字列表:站2.

    的统计信息XY数据的站2数据集。

  4. 选择要在图上显示的每个统计数据的复选框,然后单击保存到工作区.

    例如,求均值站2,选择的意思是复选框中的Y

    画一条水平线来表示的均值站2并更新图例以包含这一统计数据。

格式化图数据统计

数据统计对话框使用颜色和线条样式来区分数据和情节上的数据。示例的这一部分展示了如何自定义图上描述性统计信息的显示,例如颜色、线宽、线样式或标记。

笔记

在用数据绘制完所有统计信息之前,不要编辑统计信息的显示属性。如果在编辑绘图属性后添加或删除统计信息,对绘图属性的更改将丢失。

修改数据统计在绘图上的显示。

  1. 在MATLAB Figure窗口中,单击(编辑图)按钮。

    此步骤启用打印编辑。

  2. 双击要编辑其显示属性的绘图上的统计信息。例如,双击表示平均值的水平线站2.

    此步骤将打开MATLAB Figure窗口下方的属性编辑器,您可以在其中修改用于表示此统计信息的线的外观。

  3. 在属性编辑器中,指定线标记样式、大小和颜色。

    提示

    或者,右键单击图上的统计数据,从快捷菜单中选择一个选项。

将统计数据保存到MATLAB工作空间

执行以下步骤将统计数据保存到MATLAB工作区。

笔记

当您的图包含多个数据集时,请分别保存每个数据集的统计信息。要显示不同数据集的统计信息,请从统计数字“数据统计信息”对话框中的列表。

  1. 在“数据统计”对话框中,单击保存到工作区按钮。

  2. 在“将统计信息保存到工作区”对话框中,选择要为以下任一项保存统计信息的选项:X数据Y数据,或两者兼而有之。然后,输入相应的变量名。

    在本例中,仅保存Y数据。输入变量名为Loc2countstats.

  3. 点击好吧.

    这个步骤将描述性统计信息保存到一个结构中。新的变量被添加到MATLAB工作区中。

要查看新结构变量,请在MATLAB提示符下键入变量名称:

Loc2countstats
Loc2countstats = min: 9 max: 145 mean: 46.5417 median: 36 mode: 9 std: 41.4057 range: 136

生成的代码文件

示例的这一部分展示了如何生成一个包含MATLAB代码的文件,该文件使用新数据再现绘图的格式和绘制的统计数据。

  1. 在Figure窗口中,选择文件>生成代码.

    此步骤创建一个函数代码文件,并将其显示在MATLAB编辑器中。

  2. 从更改文件第一行的函数名createfigure更具体的东西,比如计数图。使用文件名将文件保存到当前文件夹countplot.m.

  3. 生成一些新的随机计数数据:

    兰特计数=300*兰特(24,3);
  4. 使用新数据和重新计算的统计数据再现绘图:

    计数图(t,randcount)

这个话题有用吗?