文档

正常化

规范化的数据

语法

N =正常化(A)
N =正常化(暗)
N =正常化(___、方法)
N =正常化(___、方法、methodtype)
N =正常化(___、“DataVariables”datavars)

描述

例子

N =正常化(一个返回vectorwisez分数的数据一个中心为0,标准差为1。

  • 如果一个是向量吗正常化作用于整个向量。

  • 如果一个那么,是矩阵、表格还是时间表呢正常化分别对每一列数据进行操作。

  • 如果一个是一个多维数组吗正常化对第一个大小不等于1的数组维进行操作。

例子

N =正常化(一个昏暗的返回z沿着维度得分昏暗的.例如,正常化(2)使每一行规范化。

例子

N =正常化(___方法为前面两种语法指定规范化方法。例如,正常化(A,“规范”)对数据进行规范化一个欧几里得范数(2-范数)

例子

N =正常化(___方法methodtype指定给定对象的规范化类型方法.例如,正常化(“规范”,正无穷)对数据进行规范化一个用无穷范数。

例子

N =正常化(___“DataVariables”datavars指定当输入数据在表或时间表中时要操作的变量。

例子

全部折叠

通过计算z-score将矢量和矩阵中的数据归一化。

创建一个向量v并计算z分数,将数据归一化,使其均值为0,标准差为1。

v = 1:5;N =正常化(v)
N =1×5-1.2649 -0.6325 0.6325 1.2649

创建一个矩阵B然后计算每一列的z分数。然后,规范化每一行。

B =魔法(3)
B =3×38 1 6 3 5 7 4 9 2
N1 =正常化(B)
N1 =3×31.1339 -1.0000 0.3780 -0.7559 0 0.7559 -0.3780 1.0000 -1.1339
N2 =正常化(B, 2)
N2 =3×30.1021 -1.1094 0.2774 -1.0000 0 1.0000 -0.2774 1.1094 -0.8321

规模一个向量一个根据它的标准差。

一个= 1:5;Ns =正常化(,“规模”
Ns =1×50.6325 1.2649 1.8974 2.5298 3.1623

规模一个所以它的值域在区间[0,1]内。

Nr =正常化(,“范围”
Nr =1×50 0.2500 0.5000 0.7500 1.0000

创建一个向量一个用1范数对其进行标准化。

一个= 1:5;Np =正常化(,“规范”, 1)
Np =1×50.0667 0.1333 0.2000 0.2667 0.3333

把数据集中在一个所以均值是0。

数控=正常化(,“中心”“的意思是”
数控=1×52 -1 1 1 2 2

创建一个包含五个人身高信息的表格。

LastName = {“桑切斯”“约翰逊”“李”“Diaz”“棕色”};身高= [71;69;64;67;64);T =表(LastName、高度)
T =5×2表姓氏高度_________ ______ 'Sanchez' 71 'Johnson' 69 'Lee' 64 'Diaz' 67 'Brown' 64

根据最大高度对高度数据进行归一化。

N =正常化(T)“规范”正,“DataVariables”“高度”
N =5×2表姓氏高度_________ _______ 'Sanchez' 1 'Johnson' 0.97183 'Lee' 0.90141 'Diaz' 0.94366 'Brown' 0.90141

输入参数

全部折叠

输入数据,指定为标量、向量、矩阵、多维数组、表或时间表。

如果一个是一个数字数组并有类型,则输出也有type.否则,输出具有类型

数据类型:||表格|时间表
复数的支持:万博1manbetx是的

要操作的维数,指定为正整数标量。

数据类型:||int8|int16|int32|int64|uint8|uint16|uint32|uint64

归一化方法,指定为以下选项之一:

方法

描述

“zscore”

z-得分,平均值为0,标准偏差为1(默认)

“规范”

2-norm(默认)

“规模”

标准偏差量表(默认)

“范围”

将数据缩放到[0,1](默认)

“中心”

中心数据的平均值为0(默认)

方法类型,指定为标量、2元素行向量或字符向量,具体取决于指定的方法:

方法

方法类型选项

描述

“zscore”

“性病”(默认)

中心和刻度有平均值0和标准偏差1

“稳健”

中心和刻度有平均值0和中位数绝对偏差1

“规范”

正数值标量(默认为2)

p规范

无穷范数

“规模”

“性病”(默认)

标准偏差比例尺

“疯了”

标度按中位数绝对偏差

“第一”

按数据的第一个元素缩放

数字标量

用数值来衡量数据

“范围”

2元素行向量(默认为[0 1])

形式间隔[b]在哪里< b

“中心”

“的意思是”

均值为0

“中值”

中值为0

数字标量

按数值移动中心

表变量,指定为逗号分隔对,由“DataVariables”以及标量、向量、单元格数组或函数句柄。的“DataVariables”Value表示对输入表中的哪一列进行操作,可以是以下任意一列:

  • 指定单个表变量名的字符向量或标量字符串

  • 字符向量或字符串数组的单元格数组,其中每个元素是表变量名

  • 由表变量指标组成的向量

  • 逻辑向量,其每个元素对应一个表变量,其中真正的包含相应的变量和不包括它

  • 接受表作为输入并返回逻辑标量的函数句柄

例子:“年龄”

例子:{“高度”,“体重”}

例子:@isnumeric

数据类型:字符|字符串|细胞|||逻辑|function_handle

更多关于

全部折叠

Z分数

对于一个随机变量X用平均μ和标准差σ表示z值的-scorex

对于具有均值的样本数据和标准偏差年代,z-数据点的得分x

z-scores用标准偏差来衡量一个数据点到平均值的距离。标准化数据集的均值为0,标准差为1,并且保留了原始数据集的形状属性(同样的偏度和峰度)。

P规范

的一般定义p向量的范数vN元素

v p k 1 N | v k | p 1 / p

在哪里p是任何正实值,,或.的一些共同价值p是:

  • 如果p为1,则得到的1范数是向量元素绝对值的和。

  • 如果p是2,那么得到的2范数就是向量的大小或者说是向量的欧氏长度。

  • 如果p,然后 v 马克斯 | v |

另请参阅

||

介绍了R2018a

这个话题有用吗?