文档

利用大数据进行模拟

带有许多时间步长和信号的模型模拟可能涉及大数据,大到无法放入计算机的RAM中。这种情况包括:

  • 测井模拟数据(信号测井、输出测井和状态测井)

  • 加载用于模拟模型的输入信号数据

  • 运行多个或并行模拟

要使用大数据进行模拟,请将数据存储在mat文件中。在模拟中使用大数据技术需要额外的步骤,而不是当数据足够小时才能放入工作空间内存中。在开发模型时,请考虑在不使用持久存储的情况下记录和加载模拟数据,除非您发现模型的大数据需求会导致内存过载。

大数据的工作流

这个示例是一个高级工作流,用于处理一个模拟生成的、另一个模拟用作输入的大数据。有关主要工作流程任务的详细信息,请参阅:

提示

这个例子使用了SimulationDatastore对象,用于将数据流输入模型。或者,您可以流DatasetRef对象直接导入模型。

  1. 配置两个型号以记录多个信号。

  2. 模拟模型,将数据记录到每个模型的持久存储中。

    sim (mdl1“LoggingToFile”“上”“LoggingFileName”“data1.mat”);sim (mdl2“LoggingToFile”“上”“LoggingFileName”“data2.mat”);

    涉及大数据的日志记录需要将数据保存为v7.3 mat文件。仅登录的数据数据集格式保存到文件中。以其他格式记录的数据,例如结构随着时间的推移,保存在内存中基本工作区中。

    您记录到持久存储的数据在模拟期间以小块的形式进行流处理,以最小化内存需求。数据存储在一个包含数据集对象的每个记录数据集(例如,logsoutxout).

  3. 创建DatasetRef对象(dsr1dsr2)用于特定的已记录信号集。然后创建SimulationDatastore对象(dst1dst2的元素的值DatasetRef对象。这个示例代码创建了SimulationDatastore的第12个元素logsout对于第一个模拟。对于第二个模拟,示例代码创建一个值为a的信号SimulationDatastore对象的第七元素logsout.可以使用花括号进行索引。

    dsr1 = 万博1manbetxSimulink.SimulationData.DatasetRef (“data1.mat”“logsout”);dsr2 = 万博1manbetxSimulink.SimulationData.DatasetRef (“data2.mat”“logsout”);dst1 = dsr1 {12};dst2 = dsr2 {7};
  4. 使用SimulationDatastore对象作为另一个模拟的外部输入。加载SimulationDatastore数据,包括它在一个数据集对象。数据存储输入是从mat文件增量加载的。第三个输入是atimeseries对象,它作为一个整体加载到内存中,而不是增量加载。

    输入= Simu万博1manbetxlink.SimulationData.Dataset;输入{1}= dst1;输入{2}= dst2;ts = timeseries(兰德(5、1),1,“名字”“RandomSignals”);输入{3}= t;sim (mdl3“ExternalInput”“输入”);
  5. 使用MATLAB®大数据分析的工作SimulationDatastore对象。创建一个时间表对象的值SimulationDatastore对象。的函数读取部分数据。的readall函数读取所有数据。

    tt = dst1.Values.read;
  6. 将MATLAB会话设置为全局执行环境(mapreduce和高个子一起工作时间表.创建一个高时间表从一个SimulationDatastore对象并读取时间表对象的内存数据。

    mapreduce (0);到达目标时间=高(dst1.Values);

提示

有关如何处理大型模拟数据的另一个示例,请参见与大数据合作

另请参阅

功能

相关的话题

这个话题有用吗?