文档

数据存储

创建数据存储大型数据集合

语法

ds =数据存储(位置)
ds =数据存储(位置、名称、值)

描述

ds=数据存储(位置)创建一个数据存储从指定的数据集合位置。数据存储是数据集的存储库装入内存太大。在创建ds,你可以阅读和处理数据。

例子

ds=数据存储(位置,名称,值)指定额外的参数ds使用一个或多个名称-值对参数。例如,您可以创建一个数据存储图像文件的指定“类型”,“图像”

例子

全部折叠

创建一个数据存储与样品相关文件airlinesmall.csv。这个文件包含航空数据从1987年到2008年。

管理的缺失数据导入数字列,使用“TreatAsMissing”名称-值对的论点。在这个例子中,指定值“NA”“TreatAsMissing”,取代所有的实例“NA”与一个在导入数据。在那里,中指定的值吗“MissingValue”数据存储的属性。

ds =数据存储(“airlinesmall.csv”,“TreatAsMissing”,“NA”)
ds = TabularTextDatastore属性:文件:{"…/猛击/棒/ Bdoc18a /构建/ matlab工具箱/ matlab /演示/ airlinesmall。csv”} FileEncoding:“utf - 8”AlternateFileSystemRoots: {} ReadVariableNames:真正的VariableNames:{“年”、“月”、“DayofMonth”……和26}文本格式属性:NumHeaderLines: 0分隔符:”、“RowDelimiter:“\ r \ n”TreatAsMissing:“NA”MissingValue:南高级文本格式属性:TextscanFormats: {% f ', ' % f ', ' % f '……和26}TextType:“字符”ExponentCharacters: eEdD CommentStyle:”空白:“\ b \ t”MultipleDelimitersAsOne:假控制表的属性返回的预览,阅读,readall: SelectedVariableNames:{“年”、“月”、“DayofMonth”……和26}SelectedFormats: {% f ', ' % f ', ' % f '……和26}ReadSize: 20000行

数据存储创建一个TabularTextDatastore

创建一个包含所有数据存储.tif在MATLAB®文件路径和它的子文件夹。

ds =数据存储(fullfile (matlabroot,“工具箱”,matlab的),“IncludeSubfolders”,真的,“FileExtensions”,“.tif”,“类型”,“图像”)
ds = ImageDatastore属性:文件:{“…\ matlab \ matlab工具箱\ \ demo \ example.tif”;matlab’……\ \ matlab工具箱\ \ imagesci \玉米。tif} ReadSize: 1标签:{}ReadFcn: @readDatastoreImage

输入参数

全部折叠

指定的文件或文件夹中包含数据存储,作为特征向量,单元阵列的特征向量,标量字符串或字符串数组。如果文件不在当前文件夹,然后位置必须全部或相对路径。指定文件夹的子文件夹内文件不会自动包含在数据存储中。

您可以使用通配符(*)时指定位置。这个字符显示所有匹配的文件或匹配的文件夹中所有文件包含在数据存储中。

如果不是本地可用的文件,文件或文件夹的完整路径必须是国际化资源标识符(IRI),等
hdfs: / / /path_to_file

使用的信息数据存储Amazon S3™, Windows Azure®Blob存储和HDFS™,看到读远程数据

KeyValueDatastore文件必须mat文件或文件生成的序列mapreduce函数。mat文件必须在一个本地文件系统或网络文件系统。序列文件可以在本地网络或HDFS文件系统。为DatabaseDatastore位置参数不需要文件。有关更多信息,请参见DatabaseDatastore

例子:“file1.csv”

例子:“. . / dir /数据/ file1.jpg”

例子:{“C: \ dir \ data \ file1.xls”,“C: \ dir \ data \ file2.xlsx”}

例子:“C: \ dir \ data \ * .mat’

例子:“hdfs: / / /数据/中”

数据类型:字符|细胞|字符串

名称-值对的观点

指定可选的逗号分隔条名称,值参数。的名字参数名称和吗价值相应的价值。的名字必须出现在单引号(' ')。您可以指定几个名称和值对参数在任何顺序Name1, Value1,…,的家

例子:FileExtensions, {“jpg”、“.tif”}包括所有扩展jpg.tif扩展为一个ImageDatastore对象。

全部折叠

类型的数据存储,指定为逗号分隔组成的“类型”和下列之一:

的价值“类型” 描述
“tabulartext” 文本文件包含表格数据。数据的编码必须ASCII或utf - 8。
“图像” 图像文件的格式,比如JPEG或PNG。可接受的文件包括imformats格式。
“表格” 电子表格文件包含一个或多个表。
“keyvalue” mat文件中包含的键-值对数据或序列生成的文件数据mapreduce
“文件” 自定义格式文件,需要指定阅读函数来读取数据。有关更多信息,请参见FileDatastore
“高” mat文件或文件产生的序列的函数数据类型。看到的更多信息,TallDatastore
“数据库” 数据存储在数据库中。需要数据库工具箱™。当使用的规范需要额外的输入参数类型参数。有关更多信息,请参见DatabaseDatastore
  • 如果有多个类型,支持的格式文件,然后使用万博1manbetx“类型”参数指定一个数据存储类型。

  • 如果你不指定一个值“类型”,然后数据存储自动确定合适的类型的数据存储创建基于文件的扩展。

数据类型:字符|字符串

包括子文件夹在一个文件夹中,指定为逗号分隔组成的“IncludeSubfolders”真正的(1)或(0)指定真正的包括每个文件夹内的所有文件和子文件夹只包括每个文件夹内的文件。

当你没有指定“IncludeSubfolders”,那么默认值是

“IncludeSubfolders”名称-值对只在创建这些对象有效:

  • TabularTextDatastore

  • ImageDatastore

  • SpreadsheetDatastore

  • FileDatastore

  • KeyValueDatastore

例子:“IncludeSubfolders”,真的

数据类型:逻辑|

扩展的文件,指定为逗号分隔组成的“FileExtensions”一个特征向量,单元阵列特征向量,标量字符串或字符串数组。当指定“FileExtensions”还,指定“类型”。您可以使用空引用代表文件没有扩展。

如果“FileExtensions”没有指定,那么数据存储自动包括所有支持文件扩展名根据数据存储类型。万博1manbetx如果你想有不支持的扩展,然后单独指定每个扩展要包括万博1manbetx。

  • TabularTextDatastore对象,包括支持扩展万博1manbetx. txt,. csv,.dat,.dlm,.asc,。text,没有扩展。

  • ImageDatastore对象,包括所有支持万博1manbetx扩展imformats扩展。

  • SpreadsheetDatastore对象,包括支持扩展万博1manbetxxls,.xlsx,.xlsm,.xltx,.xltm

  • TallDatastore对象,包括支持扩展万博1manbetx.mat.seq

“FileExtensions”名称-值对只在创建这些对象有效:

  • TabularTextDatastore

  • ImageDatastore

  • SpreadsheetDatastore

  • FileDatastore

  • KeyValueDatastore

例子:“FileExtensions”、“jpg”

例子:FileExtensions, {' . txt ', '。text '}

数据类型:字符|细胞|字符串

替代的文件系统根路径,指定为逗号分隔组成的“AlternateFileSystemRoots”和一个字符串向量或一个单元阵列。使用“AlternateFileSystemRoots”当您创建一个数据存储在本地机器上,但需要在另一台机器上访问和处理数据(可能是不同的操作系统)。另外,当使用PCTParallel计算工具箱™和处理数据MATLAB®分布式计算服务器™,数据存储在您的本地机器复制的数据在不同的平台上云或集群机器,您必须使用“AlternateFileSystemRoots”把根路径。

  • 把一组相当于一根路径,指定“AlternateFileSystemRoots”作为字符串向量。例如,

    [" Z: \数据集”、“/ mynetwork /数据集”)

  • 把多个根集数据存储路径是等价的,指定“AlternateFileSystemRoots”作为一个单元阵列包含多个行,每一行表示一组等价的根路径。指定单元阵列中的每一行作为一个字符串向量或单元阵列的特征向量。例如:

    • 指定“AlternateFileSystemRoots”作为一个字符串向量的单元阵列。

      {[Z: \“数据集”、“/ mynetwork /数据集”);…[" Y: \数据集”、“/ mynetwork2 /数据集”、“年代:\数据集”)}

    • 另外,指定“AlternateFileSystemRoots”作为一个单元阵列单元阵列的特征向量。

      {{“Z: \数据集”、“mynetwork /数据集”},…{“Y: \数据集”,“mynetwork2 /数据集”,年代:\数据集的}}

的价值“AlternateFileSystemRoots”必须满足以下条件:

  • 包含一个或多个行,每一行指定一组等价的根路径。

  • 每一行指定多个根路径和每个根路径必须包含至少两个字符。

  • 根路径都是独一无二的,没有子文件夹。

  • 包含至少一个根路径条目指向文件的位置。

有关更多信息,请参见为处理在不同的机器上或设置数据存储集群

例子:[" Z: \数据集”、“/ mynetwork /数据集”)

数据类型:字符串|细胞

输出文本变量的数据类型,指定为逗号分隔组成的“TextType”,要么“字符”“字符串”。如果输出表的,readall,或预览函数包含文本变量“TextType”指定这些变量的数据类型TabularTextDatastoreSpreadsheetDatastore只有对象。如果“TextType”“字符”,然后输出单元阵列的特征向量。如果“TextType”“字符串”,然后输出类型字符串

数据类型:字符|字符串

对进口日期和时间数据类型,指定为逗号分隔组成的“DatetimeType”这些值之一:“datetime”“文本”。的“DatetimeType”参数只适用于创建一个TabularTextDatastore对象。

价值 进口日期和时间数据类型
“datetime”

MATLABdatetime数据类型

有关更多信息,请参见datetime

“文本”

如果“DatetimeType”被指定为“文本”,然后对进口日期和时间数据类型取决于中指定的值“TextType”参数:

  • 如果“TextType”“字符”,那么数据存储返回日期的单元阵列特征向量。

  • 如果“TextType”“字符串”,那么数据存储返回日期作为一个字符串数组。

例子:“DatetimeType”、“日期时间的

数据类型:字符|字符串

从文本文件输出数据类型的时间数据,指定为逗号分隔组成的“DurationType”,要么“持续时间”“文本”

价值 对进口持续时间数据的类型
“持续时间”

MATLAB持续时间数据类型

有关更多信息,请参见持续时间

“文本”

如果“DurationType”被指定为“文本”,然后对进口持续时间数据类型取决于中指定的值“TextType”参数:

  • 如果“TextType”“字符”,那么导入函数返回时间数据的单元阵列特征向量。

  • 如果“TextType”“字符串”,那么导入函数返回时间数据作为一个字符串数组。

数据类型:字符|字符串

除了这些名称-值对,您还可以指定下列对象属性的名称-值对,除了文件属性:

输出参数

全部折叠

数据存储的数据的集合,作为其中一个返回对象:TabularTextDatastore,ImageDatastore,SpreadsheetDatastore,KeyValueDatastore,FileDatastore,TallDatastoreDatabaseDatastore。数据存储的类型取决于类型的文件或位置论点。有关更多信息,请单击下面的表中的数据存储名称:

类型 输出
文本文件 TabularTextDatastore
图像文件 ImageDatastore
电子表格文件 SpreadsheetDatastore
mat文件或文件所产生的序列mapreduce KeyValueDatastore
自定义格式文件 FileDatastore
mat文件或文件产生的序列的函数数据类型。 TallDatastore
数据库 DatabaseDatastore

对于每一个数据存储类型,文件属性是一个单元阵列的特征向量。每个字符向量是一个绝对路径的文件解决位置论点。

介绍了R2014b

这个主题有帮助吗?