正常化

规范化的数据

描述

例子

N =正常化(一个)返回vectorwisez分数在数据一个中心为0,标准差为1。

  • 如果一个是一个向量正常化运行在整个载体中。

  • 如果一个是一个矩阵,表,或时间表,然后正常化分别对每一列数据进行操作。

  • 如果一个是一个多维阵列中,然后正常化沿着大小不等于1的第一个数组维进行操作。

例子

N =正常化(一个,昏暗的)返回z沿着维度得分昏暗的。例如,归一化(A,2)使每一行规范化。

例子

N =正常化(___,方法)指定为任一先前语法的归一化方法。例如,正常化(A,“规范”)使数据正常化一个通过欧几里得范数(2范数)。

例子

N =正常化(___,方法,methodtype)指定正常化的类型对于给定的方法。例如,正常化(“规范”,正无穷)使数据正常化一个使用无限常态。

例子

N =正常化(___,“DataVariables”,datavars)指定当输入数据在表或时间表中时要操作的变量。

例子

全部折叠

通过计算z分数对向量和矩阵中的数据进行归一化。

创建矢量v并计算z得分,归一化数据,以具有平均为0,标准偏差为1。

v = 1:5;N =正常化(v)
N =1×5-1.2649 -0.6325 0 0.6325 1.2649

创建一个矩阵B并计算z得分对于每一列。然后,规范每一行。

B =魔法(3)
B =3×38 1 6 3 5 7 4 9 2
N1 =正常化(B)
N1 =3×31.1339 -1.0000 0.3780 -0.7559 0 0.7559 -0.3780 1.0000 -1.1339
N2 =归一化(B,2)
N2 =3×30.8321 -1.1094 0.2774 -1.0000 0 1.0000 -0.2774 1.1094 -0.8321

规模一个向量一个通过它的标准差。

一个= 1:5;Ns =正常化(,'规模')
Ns =1×50.6325 1.2649 1.8974 2.5298 3.1623

规模一个使得其范围是在区间[0,1]。

NR =归一化(A,“范围”)
Nr =1×50 0.2500 0.5000 0.7500 1.0000

创建矢量一个并通过其1-规范正常化它。

一个= 1:5;NP =归一化(A,“规范”,1)
Np =1×50.0667 0.1333 0.2000 0.2667 0.3333

将数据集中在一个所以它的均值是0。

NC =归一化(A,'中央',“的意思是”)
数控=1×5-2 -1 0 1 2

创建五人在表中的高度信息。

名字= {“桑切斯”;“约翰逊”;“李”;“迪亚兹”;'棕色'};身高= [71;69;64;67;64);T =表(LastName、高度)
T =5×2表LastName高度_____ _____桑切斯71年约翰逊69年李64年“Diaz”67“棕色”64

在最大高度规范化的高度数据。

N =正常化(T)“规范”正,“DataVariables”,'高度')
N =5×2表LastName高度____ ____“桑切斯”1“约翰逊”0.97183“李”0.90141“Diaz”0.94366“棕色”0.90141

输入参数

全部折叠

输入数据,指定为一个标量,矢量,矩阵,多维数组,表或时间表。

如果一个是一个数值数组,并且具有类型,则输出也具有类型。否则,输出的类型

正常化忽略了价值观一个

数据类型:||表格|时间表
复数的支持:万博1manbetx

要操作的维度,指定为正整数标量。

数据类型:||int8|INT16|INT32|Int64的|UINT8|UINT16|UINT32|uint64

归一化方法,指定为以下选项之一:

方法

描述

“zscore”

z均值为0,标准偏差为1 -score

“规范”

2-norm

'规模'

标准偏差标度

“范围”

数据缩放范围为[0,1]

'中央'

中心数据有均值0

方法类型,指定为一个标量,一个2元素行向量,或字符向量,根据指定的方法:

方法

方法类型选项

描述

“zscore”

“性病”(默认)

中心和尺度的均值为0,标准差为1

“稳健”

中心和规模的中值0和值绝对偏差1

“规范”

正数的标量(默认值是2)

p-规范

天道酬勤

∞范

'规模'

“性病”(默认)

标准偏差标度

'狂'

按绝对偏差的中位数计算

“第一”

按数据的第一个元素进行缩放

数字标

按数字值缩放数据

“范围”

2个元素的行向量(默认为[0 1])

形式的间隔[b]在哪里< b

'中央'

“的意思是”

中心具有平均值为0

“中值”

中间值为0

数字标

按数值转移中心

表变量,指定为逗号分隔的一对组成的“DataVariables”和一个标量,矢量,单元阵列,功能句柄,或表vartype下标。的“DataVariables”值指示哪个输入表的变量来操作,并且可以是以下之一:

  • 字符向量或标量字符串,指定一个单一的表的变量名

  • 由字符向量或字符串数组组成的单元格数组,其中每个元素是表变量名

  • 表变量索引的向量

  • 逻辑向量,其每一个对应元素的表的变量,其中真正的包含相应的变量和它排除

  • 的功能句柄,是以表作为输入,并返回一个逻辑标

  • 一个表vartype下标

例:“年龄”

例:{'身高体重'}

例:@isnumeric

例:vartype(数字)

更多关于

全部折叠

Z-得分了

对于一个随机变量X以平均失水率和标准差为基准,计算z-一个值的分数x z = ( x μ ) σ 对于具有均值的样本数据 X ¯ 和标准偏差年代,z-score数据点的x z = ( x X ¯ ) 年代

z-分数以标准差的形式度量数据点与平均值的距离。标准化后的数据集均值为0,标准差为1,保留了原始数据集的形状属性(偏度和峰度相同)。

P-规范

的一般定义p范数的矢量的vN元素

v p = ( k = 1 N | v k | p ] 1 / p ,

在哪里p是任何正实数,天道酬勤,或。一些共同的价值p是:

  • 如果p是1,则所得到的1范数是向量元素的绝对值的总和。

  • 如果p是2,然后得到的2范数给出了向量的大小或欧几里得长度。

  • 如果p天道酬勤,然后 v = 马克斯 ( | v ( ) | )

扩展功能

C / C ++代码生成
使用MATLAB®Coder™生成C和c++代码。

另请参阅

||

介绍了R2018a