文档

CompactLinearModel类

超类:

紧凑线性回归模型类

描述

CompactLinearModel是一个紧凑的线性回归模型对象。它比完整的拟合线性回归模型消耗更少的内存(LinearModel模型),因为它不存储用于适应模型的数据。因为紧凑模型不存储输入数据,所以不能使用它执行某些任务。但是,您可以使用紧凑的线性回归模型来预测使用新输入数据的响应。

建设

compactMdl=紧凑(mdl)返回一个紧凑的线性回归模型compactMdl从完全拟合的线性回归模型mdl.有关更多信息,请参见紧凑的

输入参数

全部展开

完全的,拟合的线性回归模型,指定为LinearModel对象。

属性

全部展开

系数估计的协方差矩阵,存储为P——- - - - - -P数值矩阵。P是拟合模型中的系数数。

系数名称,存储为字符向量的单元数组,包含每个系数的标签。

系数值,存储为表。系数每个系数有一行和以下列:

  • 估计-估计系数值

  • SE-估计的标准误差

  • tStatT系数为零的测试的统计信息

  • pValueP价值的T统计

要获得这些列中的任何一列作为向量,请使用点表示法对属性进行索引mdl估计的系数向量为

β= mdl.Coefficients.Estimate

使用coefTest对系数进行其他测试。

误差自由度(残差),等于观测数减去估计系数数,存储为正整数值。

模型信息,存储为LinearFormula反对或NonLinearFormula对象。如果你符合一个线性或广义线性回归模型,那么公式是一个LinearFormula对象。如果你符合非线性回归模型,那么公式是一个NonLinearFormula对象。

响应值处模型分布的对数似然,存储为数值。平均值由模型拟合,其他参数作为模型拟合的一部分进行估计。

模型比较标准,存储为具有以下字段的结构:

  • 艾克-赤池信息准则。AIC = -2 *logL + 2*m,在那里logL是对数可能性和M为估计参数的个数。

  • AICc-赤池信息标准修正的样本量。AIC = AIC + (2*m*(m+1))/(n-m-1),在那里N为观察次数。

  • 比克-贝叶斯信息准则。BIC = -2 *logL + m*log(n)

  • 中安集团经贸-一致的赤池信息准则。CAIC = -2 *logL + m*(log(n)+1)

信息标准是模型选择工具,您可以使用它来比较适合同一数据的多个模型。这些标准是基于可能性的模型拟合度量,其中包括对复杂性的惩罚(特别是参数的数量)。不同的信息标准通过惩罚的形式来区分。

当比较多个模型时,信息准则值最低的模型是拟合最好的模型。最佳拟合模型可以根据模型比较所用的标准而变化。

要以标量形式获得任何标准值,请使用点表示法对属性进行索引。例如,在模型中mdl, AIC值艾克是:

aic = mdl.ModelCriterion.AIC

均方误差(残差),存储为数值。均方误差计算为均方误差=上交所/DFE,在那里均方误差为均方误差,上交所是误差平方和,和DFE是自由度。

存储为正整数的模型系数数。NumCoefficients包括当模型项缺少秩时设置为零的系数。

模型中估计系数的数目,存储为正整数。NumEstimatedCoefficients不包括当模型项缺乏等级时被设为零的系数。NumEstimatedCoefficients是回归的自由度。

观测数拟合中使用的拟合函数,存储为正整数。这是原始表、数据集或矩阵中提供的观测数减去任何排除的行(使用被排除在外名称-值对)或缺少值的行。

用于拟合模型的预测变量数,存储为正整数。

输入数据中存储为正整数的变量数。NumVariables为原始表或数据集中的变量数,或预测器矩阵和响应向量中基于这些数组进行拟合时的列总数。它包括不用作预测器或响应的变量(如果有的话)。

用于拟合模型的预测器的名称,存储为字符向量的单元数组。

响应变量名,存储为字符向量。

均方根误差(残差),存储为数值。均方根误差(RMSE)等于RMSE=√均方误差),在那里均方误差是均方误差。

鲁棒拟合信息,存储为具有以下字段的结构:

领域 描述
WgtFun 鲁棒加权函数,例如“bisquare”(见robustfit)
曲调 为调整参数指定的值(可以是[])
砝码 鲁棒拟合最终迭代所用的权值向量。该字段在压缩时为空CompactLinearModel模型。

这个结构是空的,除非菲特姆用稳健回归建立模型。

模型的r平方值,存储为一个结构。

对于线性或非线性模型,Rsquared是一个包含两个字段的结构:

  • 普通的-普通(未调整)r平方

  • 调整-调整系数数量的R平方

对于广义线性模型,Rsquared是一个包含五个字段的结构:

  • 普通的-普通(未调整)r平方

  • 调整-调整系数数量的R平方

  • LLR-对数似然比

  • 异常——异常

  • 形容词-调整广义r平方

r平方值是模型所解释的总平方和的比例。一般的r平方值与苏维埃社会主义共和国风场属性:

Rsquared = SSR/SST = 1 - SSE/SST

若要以标量形式获取这些值中的任何一个,请使用点表示法对属性进行索引mdl

r2=mdl.Rsquared.Adjusted

平方误差(残差)之和,存储为数值。

毕达哥拉斯定理暗示

SST = sse + SSR

回归平方和,存储为一个数值。回归平方和等于拟合值离均值的方差平方和。

毕达哥拉斯定理暗示

SST = sse + SSR

以数字形式存储的平方和的总和。总平方和等于响应向量的偏差平方和Y平均值(y)

毕达哥拉斯定理暗示

SST = sse + SSR

包含的有关输入变量的信息变量,存储为一个表,每个模型术语和以下列对应一行。

领域 描述
字符向量给出的变量类,如“双人”
范围

单元阵列提供可变范围:

  • 连续变量-二元向量[最小值,马克斯],最小值和最大值

  • 类别变量-单元格数组的不同的变量值

InModel 逻辑向量,真正的指示变量在模型中
IsCategorical 逻辑向量,真正的表示分类变量

fit中使用的变量名,存储为字符向量的单元格数组。

  • 如果适合基于表或数据集,则此属性提供该表或数据集中的变量名称。

  • 如果拟合是基于预测矩阵和响应向量,变化无常值在VarNames拟合方法的名称-值对。

  • 否则,变量具有默认的合适名称。

方法

方差分析 线性模型的方差分析
科菲奇 线性模型系数估计的置信区间
coefTest 线性回归模型系数的线性假设检验
disp 显示线性回归模型
函数宏指令 评价线性回归模型预测
情节效应 绘制线性回归模型中各预测因子的主效应图
情节互动 线性回归模型中两个预测因子的相互作用效应
plotSlice 通过拟合的线性回归曲面绘制切片图
预测 预测线性回归模型的响应
随机的 模拟线性回归模型的响应

复制语义

价值。要了解值类如何影响复制操作,请参见复制对象(MATLAB)。

例子

全部崩溃

这个例子展示了如何通过丢弃样本数据和一些与拟合过程相关的信息来减小完整的拟合线性回归模型的大小。

将数据加载到工作区中。

负载(fullfile (matlabroot“例子”,“统计数据”,“largedata4reg.mat”))

模拟样本数据包含15,000个观测值和45个预测变量。

对数据拟合一个简单的线性回归模型。

mdl = fitlm (X, Y)
mdl =线性回归模型:y ~[45个预测因子中46项的线性公式]估算SE tStat pValue ___________ __________ ___________ ___________ (Intercept) 3.2903 1.2333e-05 2.6679e+05 0 x1 -0.0006461 5.9019e-09 -1.0947e+05 0 x2 -0.00024739 1.0256e-08 -24121 0 x3 -9.5161e-05 1.3149e-08 -7236.9 0 x4 0.00013143 1.8311e-08 7177.3 0 x5 7.163e-05 2.337e -08 3065.4 0 x6 4.5064e-06 2.6264e-08 171.58 0 x7 -2.6258e-05 3.006e-08-873.51 0 x8 6.284e-05 3.0262e-08 2076.5 0 x9 -0.00014288 3.3258e-08 -4296.1 0 x10 -2.2642e-05 3.6555e-08 -619.41 0 x11 -6.0227e-05 3.7353e-08 -1612.4 0 x12 1.1665e-05 4.0048e-08 291.27 0 x13 3.8595e-05 4.203e-08 918.26 0 x14 0.00010021 4.7592e-08 2105.5 0 x15 -6.5674e-06 4.9221e-08 -133.43 0 x16 8.5598e-06 5.0296e-08 170.19 0 x17 -3.9107e-05 5.3e-08 -737.87 0 x18 -6.5841e-06 5.5355e-08 -118.94 0 x19 -1.7053e-05 5.7431e-08 -296.94 0 x20 -3.8911e-06 6.2724e-08 -62.036 0 x21 -9.7219e-06 6.3515e-08 -153.06 0 x22 -1.8749e-06 6.5388e-08 -28.673 4.6032e-176 x23 -4.7514e-06 6.6636e-08 -71.303 0 x24 -1.7756e-05 6.8495e-08 -259.23 0 x25 -9.6673e-06 7.0054e-08 -138 0 x26 7.6237e-06 7.2442e-08 105.24 0 x27 -8.4338e-07 7.7519e-08 -10.88 1.8249e-27 x28 7.0502e-06 8.1889e-08 86.094 0 x29 -1.4703e-05 8.7126e-08 -168.75 0 x30 2.7008e-05 9.0084e-08 299.8 0 x31 6.3685e-07 9.1253e-08 6.979 3.0977e-12 x32 -1.9916e-05 1.0034e-07 -198.48 0 x33 1.7369e-05 1.019e-07 170.45 0 x34 -9.931e-06 1.0706e-07 -92.764 0 x35 -1.5195e-05 1.0858e-07 -139.94 0 x36 -1.0118e-05 1.1122e-07 -90.976 0 x37 2.4595e-06 1.1254e-07 21.856 2.9315e-104 x38 -2.2928e-06 1.1493e-07 -19.95 2.0535e-87 x39 1.1397e-05 1.1855e-07 96.136 0 x40 4.0239e-06 1.2327e-07 32.643 7.75e-226 x41 -8.6667e-06 1.2535e-07 -69.142 0 x42 -8.2932e-06 1.3095e-07 -63.334 0 x43 2.7309e-06 1.3452e-07 20.301 2.0697e-90 x44 -6.9235e-06 1.3725e-07 -50.444 0 x45 1.1165e-06 1.4021e-07 7.9633 1.7956e-15 Number of observations: 15000, Error degrees of freedom: 14954 Root Mean Squared Error: 0.00151 R-squared: 1, Adjusted R-Squared 1 F-statistic vs. constant model: 2.82e+08, p-value = 0

紧凑的模型。

compactMdl =紧凑(mdl)
compactMdl =紧凑线性回归模型:y ~[45个预测因子中46项的线性公式]估算SE tStat pValue ___________ __________ ___________ ___________ (Intercept) 3.2903 1.2333e-05 2.6679e+05 0 x1 -0.0006461 5.9019e-09 -1.0947e+05 0 x2 -0.00024739 1.0256e-08 -24121 0 x3 -9.5161e-05 1.3149e-08 -7236.9 0 x4 0.00013143 1.8311e-08 7177.3 0 x5 7.163e-05 2.337e -08 3065.4 0 x6 4.5064e-06 2.6264e-08 171.58 0 x7 -2.6258e-05 3.006e-08-873.51 0 x8 6.284e-05 3.0262e-08 2076.5 0 x9 -0.00014288 3.3258e-08 -4296.1 0 x10 -2.2642e-05 3.6555e-08 -619.41 0 x11 -6.0227e-05 3.7353e-08 -1612.4 0 x12 1.1665e-05 4.0048e-08 291.27 0 x13 3.8595e-05 4.203e-08 918.26 0 x14 0.00010021 4.7592e-08 2105.5 0 x15 -6.5674e-06 4.9221e-08 -133.43 0 x16 8.5598e-06 5.0296e-08 170.19 0 x17 -3.9107e-05 5.3e-08 -737.87 0 x18 -6.5841e-06 5.5355e-08 -118.94 0 x19 -1.7053e-05 5.7431e-08 -296.94 0 x20 -3.8911e-06 6.2724e-08 -62.036 0 x21 -9.7219e-06 6.3515e-08 -153.06 0 x22 -1.8749e-06 6.5388e-08 -28.673 4.6032e-176 x23 -4.7514e-06 6.6636e-08 -71.303 0 x24 -1.7756e-05 6.8495e-08 -259.23 0 x25 -9.6673e-06 7.0054e-08 -138 0 x26 7.6237e-06 7.2442e-08 105.24 0 x27 -8.4338e-07 7.7519e-08 -10.88 1.8249e-27 x28 7.0502e-06 8.1889e-08 86.094 0 x29 -1.4703e-05 8.7126e-08 -168.75 0 x30 2.7008e-05 9.0084e-08 299.8 0 x31 6.3685e-07 9.1253e-08 6.979 3.0977e-12 x32 -1.9916e-05 1.0034e-07 -198.48 0 x33 1.7369e-05 1.019e-07 170.45 0 x34 -9.931e-06 1.0706e-07 -92.764 0 x35 -1.5195e-05 1.0858e-07 -139.94 0 x36 -1.0118e-05 1.1122e-07 -90.976 0 x37 2.4595e-06 1.1254e-07 21.856 2.9315e-104 x38 -2.2928e-06 1.1493e-07 -19.95 2.0535e-87 x39 1.1397e-05 1.1855e-07 96.136 0 x40 4.0239e-06 1.2327e-07 32.643 7.75e-226 x41 -8.6667e-06 1.2535e-07 -69.142 0 x42 -8.2932e-06 1.3095e-07 -63.334 0 x43 2.7309e-06 1.3452e-07 20.301 2.0697e-90 x44 -6.9235e-06 1.3725e-07 -50.444 0 x45 1.1165e-06 1.4021e-07 7.9633 1.7956e-15 Number of observations: 15000, Error degrees of freedom: 14954 Root Mean Squared Error: 0.00151 R-squared: 1, Adjusted R-Squared 1 F-statistic vs. constant model: 2.82e+08, p-value = 0

紧凑模型丢弃原始样本数据和一些与拟合过程相关的信息。

比较完整模型的大小mdl和紧凑模型compactMdl

vars=谁(“compactMdl”,“mdl”);(var (1) .bytes一样,var (2) .bytes]
ans=1×283329 11410264

压缩模型比完整模型消耗更少的内存。

扩展功能

R2016a中引入

这个话题有用吗?