文档

大文件和大数据

文件和大型数据集的访问和处理集合

大型数据集可以在不适合可用内存,或者需要很长的时间来处理文件大文件的形式。大型数据集也可以是许多小文件的集合。没有任何单一的方法来处理大型数据集工作,所以MATLAB®包括用于访问和处理大数据的一些工具。

通过创建可在一个时间访问数据的一小部分的数据存储开始。您可以使用数据存储管理数据的增量导入。要使用共同的MATLAB函数,如分析数据意思直方图上创建数据存储区的顶部上的高阵列。对于更复杂的问题,你可以写一个MapReduce的算法定义了分块和减少数据。

是这个主题有帮助吗?