清洁混乱的数据和定位极值使用动态编辑任务
你可以交互地使用序列预处理数据的实时编辑任务,可视化数据每一步。这个示例使用五项任务清理嘈杂的数据缺失值和异常值以确定局部最小值和最大值。现场编辑任务的更多信息,见交互式任务添加到脚本。
首先,创建和情节混乱的矢量数据,其中包含四个南
值和五个离群值。
x = 1:10 0;data = cos(2 *π* 0.05 * x + 2 *π*兰德)+ 0.5 * randn (1100);数据(20:20:80)=南;数据(10:20:90)= (-50 -45 30 35);
情节混乱的数据,打开创建图的任务。通过输入关键字开始情节
在一个代码块,然后点击创建图
当它出现在菜单。选择情节类型和输入数据画出数据。
看到这个任务生成的代码,扩展任务显示点击底部的任务参数区域。
%创建块x和数据h =情节(x)、数据“DisplayName”,“数据”);%添加包含ylabel、标题和传奇包含(“x”)ylabel (“数据”)标题(“x与数据”传说)
填补缺失的数据
来代替南
值数据和可视化结果,打开清洁缺失的数据的任务。通过输入关键字开始失踪
在一个代码块,然后点击清洁缺失的数据
当它出现在菜单。选择输入数据并自动绘制填充数据的清洗方法。
看到这个任务生成的代码,扩展任务显示点击底部的任务参数区域。
%填补缺失的数据[cleanedData, missingIndices] = fillmissing(数据,“线性”);%显示结果clf情节(cleanedData“颜色”[0 114 189]/ 255,“线宽”,1.5,…“DisplayName”,“清除数据”)举行在%的阴谋了失踪的条目情节(找到(missingIndices) cleanedData (missingIndices),“。”,“MarkerSize”12…“颜色”25,83年[217]/ 255,“DisplayName”,“填充缺失的条目”)标题(“填充缺失的条目数量:”+ nnz (missingIndices))从传说
清晰的missingIndices
填补离群值
现在您可以删除离群值从清理数据通过使用在前面的任务干净的异常数据的任务。输入关键字离群值
在一个新的代码块并单击干净的异常数据
打开任务。选择cleanedData
作为输入数据。您可以自定义的方法清洗和检测异常值和调整阈值找到更多或更少的离群值。
看到这个任务生成的代码,扩展任务显示点击底部的任务参数区域。
%填补离群值[cleanedData2, outlierIndices thresholdLow thresholdHigh] =…filloutliers (cleanedData“线性”);%显示结果clf情节(cleanedData“颜色”(77 190 238)/ 255,“DisplayName”,“输入数据”)举行在情节(cleanedData2“颜色”[0 114 189]/ 255,“线宽”,1.5,…“DisplayName”,“清除数据”)%情节异常值情节(找到(outlierIndices) cleanedData (outlierIndices),“x”,…“颜色”(64 64 64)/ 255,“DisplayName”,“局外人”)标题(许多局外人清洗:“+ nnz (outlierIndices))%的情节充满了异常值情节(找到(outlierIndices) cleanedData2 (outlierIndices),“。”,“MarkerSize”12…“颜色”25,83年[217]/ 255,“DisplayName”,“局外人”了)%情节异常阈值情节([xlim失踪xlim]、[thresholdLow *[1]南thresholdHigh * [1]],…“颜色”(145 145 145)/ 255,“DisplayName”,“离群值阈值”)举行从传说
清晰的outlierIndicesthresholdLowthresholdHigh
平滑的数据
接下来,光滑清洁的数据之前的任务通过使用平滑的数据的任务。输入关键字光滑的
当它出现并单击任务。选择cleanedData2
前面的任务的输出,输入数据。选择一个平滑方法,调整或多或少的平滑因子平滑。
看到这个任务生成的代码,扩展任务显示点击底部的任务参数区域。
%平滑输入数据smoothedData = smoothdata (cleanedData2,“高斯”,“SmoothingFactor”,0.4);%显示结果clf情节(cleanedData2“颜色”(77 190 238)/ 255,“DisplayName”,“输入数据”)举行在情节(smoothedData“颜色”[0 114 189]/ 255,“线宽”,1.5,…“DisplayName”,“平滑数据”)举行从传说
找到极值
最后,开始键入关键字极值
并点击找到当地的极值
。使用smoothedData
作为输入数据和变化极值类型找到局部极大值和局部最小值的清洗,平滑数据。你可以调整局部极值参数来找到更多或更少的最大值和最小值。
看到这个任务生成的代码,扩展任务显示点击底部的任务参数区域。
%找到当地的最大值和最小值maxIndices = islocalmax (smoothedData);minIndices = islocalmin (smoothedData);%显示结果clf情节(smoothedData“颜色”(77 190 238)/ 255,“DisplayName”,“输入数据”)举行在%的阴谋局部极大值情节(找到(maxIndices) smoothedData (maxIndices),“^”,“颜色”25,83年[217]/ 255,…“MarkerFaceColor”25,83年[217]/ 255,“DisplayName”,“最大值”)%绘制局部最小值情节(找到(minIndices) smoothedData (minIndices),“v”,“颜色”(32 237 177)/ 255,…“MarkerFaceColor”(32 237 177)/ 255,“DisplayName”,“局部最小值”)标题(“极值数量:”+ (nnz (maxIndices) + nnz (minIndices)))从传说
另请参阅
住编辑任务
功能
ismissing
|rmmissing
|fillmissing
|isoutlier
|filloutliers
|rmoutliers
|ischange
|islocalmin
|islocalmax
|smoothdata