文档

可视化高大的数组

大型数据集可视化要求数据总结,扔进垃圾箱,或者在某种程度上减少采样点,绘制在屏幕上。在某些情况下,等功能柱状图本数据规模减少,而其他等功能情节散射使用一种更复杂的方法,避免了策划复制像素在屏幕上。问题的像素重叠的相关分析binscatter密度函数还提供了一个有效的方法来可视化模式。

可视化高数组并需要使用收集。MATLAB®立即评估和显示的可视化高数组。目前,你可以想象高数组使用这个表中的函数和方法。

函数 需要工具箱 笔记
情节 - - - - - -

这些函数的阴谋在迭代,逐步增加情节读取更多的数据。在更新期间,一个进度指示器显示数据的比例绘制。支持缩放和移动在更新过程中,阴谋之前完成。万博1manbetx停止更新过程,按进度指示器的暂停按钮。

散射 - - - - - -
binscatter - - - - - -
柱状图 - - - - - -
histogram2 - - - - - -
- - - - - -

分类数据的可视化。

binScatterPlot 统计和机器学习的工具箱™

图包含一个滑动条来控制亮度和颜色在图像细节。滑块调整的价值γ图像校正参数。

ksdensity 统计和机器学习工具

产生一个概率密度估计的数据,在100点处的单变量数据,为二元数据或900点。

datasample 统计和机器学习工具

datasample使您能够提取的子样品高数组统计声音的方式相比,简单的索引。如果数据的子集是足够小,适合在内存中,然后您可以使用绘图和拟合函数不直接支持高数组的子集。万博1manbetx

高数组绘制的例子

这个例子展示了几种不同的方式你可以想象高数组。

创建一个数据存储airlinesmall.csv数据集,其中包含行航空飞行数据。选择表的一个子集变量处理,去除含有缺失值的行。

ds =数据存储(“airlinesmall.csv”,“TreatAsMissing”,“NA”);ds。SelectedVariableNames = {“年”,“月”,“ArrDelay”,“DepDelay”,“起源”,“桌子”};T =高(ds);T = rmmissing (T)
T = Mx6高表年月ArrDelay DepDelay起源Dest ___ _____说_____ _____ 1987 10 8 12“宽松”SJC 1987年10 8 1 SJC“钻”1987年10 21 20“圣”SMF 1987年10 13 12“钻”SJC 1987年10 4 1 SMF的“宽松”59 1987 63“宽松”SJC 1987年10 3 2“圣”“旧金山”1987年10 11 1“海”“宽松”::::::::::::

饼图的航班

把数字变量的类别变量反映了月的名字。然后画一个饼图显示有多少航班每个月的数据。

T。月=分类(T.Month 1:12, {“1月”,2月的,“3”,4月的,“可能”,“君”,“7”,“8月”,“9”,“10月”,11月的,12月的})
T = Mx6高表年月ArrDelay DepDelay起源Dest ___ _____说_____ _____ 1987 10月8 12“宽松”SJC 1987年10月8日1 SJC“钻”1987年10月21日20“圣”“SMF”1987年10月13日12“钻”SJC 1987年10月4日1 SMF的“宽松”1987年10月59 63年“宽松”SJC 1987年10月3日2“圣”“旧金山”1987年10月11日1“海”“宽松”::::::::::::
派(T.Month)
评估高表达式使用当地的MATLAB会话:通过1 2:在1秒完成,通过2 2:在1秒完成评估在3秒完成

延迟的柱状图

画一个柱状图到达每个航班延误的数据。由于数据有一个长尾,限制策划区域使用BinLimits名称-值对。

直方图(T.ArrDelay“BinLimits”150年[-50])
评估高表达式使用当地的MATLAB会话:通过1 2:完成在3秒-通过2 2:在1秒完成评估在6秒完成

散点图的延迟

绘制散点图的抵达和起飞延误。你可以预期很强的相关性之间的这些变量,因为航班离开晚了也有可能迟到。

当高层数组操作,情节,散射,binscatter功能图中的数据迭代,逐步增加情节读取更多的数据。在情节的顶部有一个更新进度指示器显示多少数据被绘制。支持缩放和移动在更新之前的情节就完成了。万博1manbetx

散射(T.ArrDelay T.DepDelay)包含(“延误”)ylabel (离职的延迟)xlim(1000年[-140])ylim (1000 [-140])

进度条还包括一个暂停/恢复按钮。使用按钮停止情节更新早期一旦足够的数据显示。

健康趋势线

使用polyfitpolyval功能覆盖一个线性趋势线抵达和起飞延误的情节。

持有p = polyfit (T.ArrDelay T.DepDelay 1);x = (T.ArrDelay, 1);yp = polyval (p (x);情节(x, yp,的r -)举行

可视化密度

散点图的点会在一定程度上是有用的,但它很难破译的信息如果点重叠广泛的阴谋。在这种情况下,它有助于形象化的密度点阴谋趋势。

使用binscatter函数可视化的密度点的情节抵达和起飞延误。

binscatter (T.ArrDelay T.DepDelay,“XLimits”(-100 1000),“YLimits”1000年[-100])xlim (1000 [-100]) ylim([-100 1000])包含(“延误”)ylabel (离职的延迟)

调整这一财产的轴,这样所有本值大于150颜色相同。这可以防止几箱非常大的价值观支配的阴谋。

甘氨胆酸ax =;斧子。这一= [0 150];

另请参阅

||

相关的话题

这个主题有帮助吗?