文档

zscore

标准化z分数

语法

Z = zscore(X)
Z = zscore(X,标志)
Z = zscore(X,flag,dim)
[Z,mu,sigma] = zscore(___

描述

例子

Z= zscore (X返回z分数对于的每个元素X这样,柱子X居中有均值0,缩放有标准差1。Z尺寸和X

  • 如果X是向量吗Z的向量z分数。

  • 如果X是矩阵吗Z矩阵的大小和X的每一列Z均值为0,标准差为1。

  • 多维数组,z分数在Z是沿着第一个非单维度X

例子

Z= zscore (X,国旗尺度X用标准差表示国旗

  • 如果国旗是0(默认值)zscore尺度X使用样本标准差,n- 1为标准差公式的分母。zscore (X, 0)zscore (X)

  • 如果国旗那么是1zscore尺度X使用总体标准差,n在标准差公式的分母中。

例子

Z= zscore (X,国旗,昏暗的标准化X沿着维度昏暗的.例如,对于一个矩阵X,如果昏暗的= 1,则zscore沿列的均值和标准差X,如果昏暗的= 2,则zscore使用的均值和标准差沿行的X

例子

(Z,μ,σ= zscore(___还返回用于居中和缩放的均值和标准差,μ而且σ,分别。您可以使用前面语法中的任何输入参数。

例子

全部折叠

计算并绘制-两个数据向量的得分,然后比较结果。

加载样例数据。

负载lawdata

两个变量加载到工作区中:平均绩点而且考试

把两个变量画在同一个坐标轴上。

情节((gpa, lsat))传说(“成绩”,“考试”,“位置”,“东”

很难比较这两种衡量标准,因为它们的尺度非常不同。

画出分数的平均绩点而且考试在相同的坐标轴上。

Zgpa = zscore(gpa);Zlsat = zscore(lsat);情节,情节传说,传说“gpa z分数”,“lsat z分数”,“位置”,“东北”

现在,你可以看到个人的相对表现平均绩点而且考试结果。例如,第三个人的平均绩点而且考试结果都比样本均值低一个标准差。第十一个人的平均绩点样本均值附近是否有考试得分几乎比样本平均值高出1.25个标准差。

检查的平均值和标准偏差-你创造的分数。

意思是([Zgpa Zlsat])
Ans = 1.0e-14 * -0.1088 0.0357
性病([Zgpa Zlsat])
Ans = 1 1

根据定义,分数的平均绩点而且考试均值为0,标准差为1。

加载样例数据。

负载lawdata

两个变量加载到工作区中:平均绩点而且考试

计算分数的平均绩点用总体公式求标准差。

Z1 = zscore(gpa,1);%总体公式Z0 = zscore(gpa,0);%样品配方disp ((Z1 Z0))
1.2554 1.2128 0.8728 0.8432 -1.2100 -1.1690 -0.2749 -0.2656 1.4679 1.4181 -0.1049 -0.1013 -0.4024 -0.3888 1.4254 1.1279 1.0896 0.1502 0.1451 0.1077 0.1040 -1.5076 -1.4565 -1.4226 -1.3743 -0.9125 -0.8815 -0.5724 -0.5530

对于总体中的一个样本,与的总体标准差公式在分母中对应于总体标准差的最大似然估计,并可能有偏差。另一方面,样本标准差公式是样本总体标准差的无偏估计量。

计算-使用沿着数据矩阵的列或行计算的平均值和标准偏差来得分。

加载样例数据。

负载流感

数据集数组流感装载在工作场所。流感对11个变量有52个观察结果。第一个变量包含日期(以周为单位)。其他变量包括美国不同地区的流感估计

将数据集数组转换为数据矩阵。

Flu2 = double(flu(:,2:end));

新的数据矩阵,flu2,为52 × 10的双数据矩阵。行对应于数据集数组中的星期,列对应于美国地区流感

标准化每个地区的流感估计flu2).

Z1 = zscore(flu2,[],1);

你可以看到-scores在变量编辑器中双击矩阵Z1在工作区中创建。

对每周的流感估计进行标准化flu2).

Z2 = zscore(flu2,[],2);

返回用于计算的平均值和标准偏差分数。

加载样例数据。

负载lawdata

两个变量加载到工作区中:平均绩点而且考试

返回的分数、平均值和标准差平均绩点

[Z,gpa amean,gpastdev] = zscore(gpa)
Z = 1.2128 0.8432 -1.1690 -0.2656 1.4181 -0.1013 -0.3888 1.3771 1.0896 0.1451 0.1040 -1.4565 -1.3743 -0.8815 -0.5530 gamean = 3.0947 gpastdev = 0.2435

输入参数

全部折叠

输入数据,指定为向量、矩阵或多维数组。

数据类型:|

用于计算的标准偏差指标z-scores,指定为0或1。

  • 如果国旗是0(默认值)zscore尺度X使用样本标准差zscore (X, 0)zscore (X)

  • 如果国旗那么是1zscore尺度X使用总体标准差

用于计算的尺寸z分数的X,指定为正整数。例如,对于一个矩阵X,如果昏暗的= 1,则zscore沿列的均值和标准差X,如果昏暗的= 2,则zscore使用的均值和标准差沿行的X

输出参数

全部折叠

z -分数,作为向量、矩阵或多维数组返回。的向量z -得分的均值为0,方差为1。

  • 如果X是向量吗Z的向量z分数。

  • 如果X是数组吗zscore是一个数组,其中每一列或行标准化为均值0和方差1(取决于昏暗的).如果昏暗的未指定,zscore标准化沿着第一个非单维度X

的意思是X用于计算z-scores,作为标量或向量返回。

  • 如果X是向量吗μ是标量。

  • 如果X是矩阵吗μ行向量是if吗zscore的列计算均值X昏暗的= 1),和列向量ifzscore的行计算平均值X昏暗的= 2)。

标准差X用于计算z-scores,作为标量或向量返回。

  • 如果X是向量吗σ是标量。

  • 如果X是矩阵吗σ行向量是if吗zscore的列计算标准差X昏暗的= 1),和列向量ifzscore的行计算标准差X昏暗的= 2)。

更多关于

全部折叠

z分数

对于一个随机变量X均值为μ,标准差为σz-一个值的得分x

z x μ σ

对于带均值的样本数据 X ¯ 还有标准差年代,z-一个数据点的得分x

z x X ¯ 年代

z-分数衡量一个数据点的距离从平均值的标准偏差。这也叫做标准化的数据。标准化数据集的均值为0,标准差为1,并保留原始数据集的形状属性(相同的偏度和峰度)。

你可以使用z在进一步分析之前,将数据放在相同的尺度上。这让您可以比较两个或多个具有不同单位的数据集。

多维数组

一个多维数组是具有两个以上维度的数组。例如,如果X是一个1 × 3 × 4的数组,那么X是一个三维数组。

第一个非单维度

一个第一个非单维度大小不等于1的数组的第一个维度。例如,如果X是一个1 × 2 × 3 × 4的数组,那么第二个维度是的第一个非单维X

样本标准差

样本标准差,年代,由

年代 1 n x X ¯ 2 n 1

年代平方根是总体方差的无偏估计量吗X是画的,只要X由独立的,相同分布的样本组成。

注意这个方差公式的分母是n- 1。

总体标准差

如果数据是所有值的总体,则可以使用总体标准差,

σ 1 n x μ 2 n

如果X这是从总体中随机抽取的样本吗μ是由样本均值估计的,和σ是总体标准差的偏最大似然估计量。

注意这个方差公式的分母是n

算法

zscore返回S表示任何包含年代。

zscore返回0S对于任何常数样本(所有值都是相同的)。例如,如果X一个向量的数值是相同的吗Z的向量0年代,如果X矩阵的一列是由相同的值组成的,那么那一列是Z0年代。

扩展功能

C/ c++代码生成
使用MATLAB®Coder™生成C和c++代码。

另请参阅

|

R2006a之前介绍

这个话题有用吗?