创建数据存储大型数据集合
ds =数据存储(位置)
ds =数据存储(位置、名称、值)
创建一个数据存储与样品相关文件airlinesmall.csv
。这个文件包含航空数据从1987年到2008年。
管理的缺失数据导入数字列,使用“TreatAsMissing”
名称-值对的论点。在这个例子中,指定值“NA”
为“TreatAsMissing”
,取代所有的实例“NA”
与一个南
在导入数据。在那里,南
中指定的值吗“MissingValue”
数据存储的属性。
ds =数据存储(“airlinesmall.csv”,…“TreatAsMissing”,“NA”)
ds = TabularTextDatastore属性:文件:{"…/猛击/棒/ Bdoc18a /构建/ matlab工具箱/ matlab /演示/ airlinesmall。csv”} FileEncoding:“utf - 8”AlternateFileSystemRoots: {} ReadVariableNames:真正的VariableNames:{“年”、“月”、“DayofMonth”……和26}文本格式属性:NumHeaderLines: 0分隔符:”、“RowDelimiter:“\ r \ n”TreatAsMissing:“NA”MissingValue:南高级文本格式属性:TextscanFormats: {% f ', ' % f ', ' % f '……和26}TextType:“字符”ExponentCharacters: eEdD CommentStyle:”空白:“\ b \ t”MultipleDelimitersAsOne:假控制表的属性返回的预览,阅读,readall: SelectedVariableNames:{“年”、“月”、“DayofMonth”……和26}SelectedFormats: {% f ', ' % f ', ' % f '……和26}ReadSize: 20000行
数据存储
创建一个TabularTextDatastore
。
创建一个包含所有数据存储.tif
在MATLAB®文件路径和它的子文件夹。
ds =数据存储(fullfile (matlabroot,“工具箱”,matlab的),…“IncludeSubfolders”,真的,“FileExtensions”,“.tif”,“类型”,“图像”)
ds = ImageDatastore属性:文件:{“…\ matlab \ matlab工具箱\ \ demo \ example.tif”;matlab’……\ \ matlab工具箱\ \ imagesci \玉米。tif} ReadSize: 1标签:{}ReadFcn: @readDatastoreImage
位置
- - - - - -文件或文件夹中包含数据存储指定的文件或文件夹中包含数据存储,作为特征向量,单元阵列的特征向量,标量字符串或字符串数组。如果文件不在当前文件夹,然后位置
必须全部或相对路径。指定文件夹的子文件夹内文件不会自动包含在数据存储中。
您可以使用通配符(*)时指定位置
。这个字符显示所有匹配的文件或匹配的文件夹中所有文件包含在数据存储中。
如果不是本地可用的文件,文件或文件夹的完整路径必须是国际化资源标识符(IRI),等hdfs: / / /
。path_to_file
使用的信息数据存储
Amazon S3™, Windows Azure®Blob存储和HDFS™,看到读远程数据。
为KeyValueDatastore
文件必须mat文件或文件生成的序列mapreduce
函数。mat文件必须在一个本地文件系统或网络文件系统。序列文件可以在本地网络或HDFS文件系统。为DatabaseDatastore
位置参数不需要文件。有关更多信息,请参见DatabaseDatastore
。
例子:“file1.csv”
例子:“. . / dir /数据/ file1.jpg”
例子:{“C: \ dir \ data \ file1.xls”,“C: \ dir \ data \ file2.xlsx”}
例子:“C: \ dir \ data \ * .mat’
例子:“hdfs: / / /数据/中”
数据类型:字符
|细胞
|字符串
指定可选的逗号分隔条名称,值
参数。的名字
参数名称和吗价值
相应的价值。的名字
必须出现在单引号(' '
)。您可以指定几个名称和值对参数在任何顺序Name1, Value1,…,的家
。
FileExtensions, {“jpg”、“.tif”}
包括所有扩展jpg
或.tif
扩展为一个ImageDatastore
对象。
“类型”
- - - - - -类型的数据存储“tabulartext”
|“图像”
|“表格”
|“keyvalue”
|“文件”
|“高”
|……类型的数据存储,指定为逗号分隔组成的“类型”
和下列之一:
的价值“类型” |
描述 |
---|---|
“tabulartext” |
文本文件包含表格数据。数据的编码必须ASCII或utf - 8。 |
“图像” |
图像文件的格式,比如JPEG或PNG。可接受的文件包括imformats 格式。 |
“表格” |
电子表格文件包含一个或多个表。 |
“keyvalue” |
mat文件中包含的键-值对数据或序列生成的文件数据mapreduce 。 |
“文件” |
自定义格式文件,需要指定阅读函数来读取数据。有关更多信息,请参见FileDatastore 。 |
“高” |
mat文件或文件产生的序列写 的函数高 数据类型。看到的更多信息,TallDatastore 。 |
“数据库” |
数据存储在数据库中。需要数据库工具箱™。当使用的规范需要额外的输入参数类型 参数。有关更多信息,请参见DatabaseDatastore 。 |
如果有多个类型,支持的格式文件,然后使用万博1manbetx“类型”
参数指定一个数据存储类型。
如果你不指定一个值“类型”
,然后数据存储
自动确定合适的类型的数据存储创建基于文件的扩展。
数据类型:字符
|字符串
“IncludeSubfolders”
- - - - - -包括子文件夹在文件夹内真正的
或假
|0或1包括子文件夹在一个文件夹中,指定为逗号分隔组成的“IncludeSubfolders”
和真正的
(1)或假
(0)指定真正的
包括每个文件夹内的所有文件和子文件夹假
只包括每个文件夹内的文件。
当你没有指定“IncludeSubfolders”
,那么默认值是假
。
的“IncludeSubfolders”
名称-值对只在创建这些对象有效:
TabularTextDatastore
ImageDatastore
SpreadsheetDatastore
FileDatastore
KeyValueDatastore
例子:“IncludeSubfolders”,真的
数据类型:逻辑
|双
“FileExtensions”
- - - - - -扩展名的文件扩展的文件,指定为逗号分隔组成的“FileExtensions”
一个特征向量,单元阵列特征向量,标量字符串或字符串数组。当指定“FileExtensions”
还,指定“类型”
。您可以使用空引用”
代表文件没有扩展。
如果“FileExtensions”
没有指定,那么数据存储
自动包括所有支持文件扩展名根据数据存储类型。万博1manbetx如果你想有不支持的扩展,然后单独指定每个扩展要包括万博1manbetx。
为TabularTextDatastore
对象,包括支持扩展万博1manbetx. txt
,. csv
,.dat
,.dlm
,.asc
,。text
,没有扩展。
为ImageDatastore
对象,包括所有支持万博1manbetx扩展imformats
扩展。
为SpreadsheetDatastore
对象,包括支持扩展万博1manbetxxls
,.xlsx
,.xlsm
,.xltx
,.xltm
。
为TallDatastore
对象,包括支持扩展万博1manbetx.mat
和.seq
。
的“FileExtensions”
名称-值对只在创建这些对象有效:
TabularTextDatastore
ImageDatastore
SpreadsheetDatastore
FileDatastore
KeyValueDatastore
例子:“FileExtensions”、“jpg”
例子:FileExtensions, {' . txt ', '。text '}
数据类型:字符
|细胞
|字符串
“AlternateFileSystemRoots”
- - - - - -替代的文件系统根路径替代的文件系统根路径,指定为逗号分隔组成的“AlternateFileSystemRoots”
和一个字符串向量或一个单元阵列。使用“AlternateFileSystemRoots”
当您创建一个数据存储在本地机器上,但需要在另一台机器上访问和处理数据(可能是不同的操作系统)。另外,当使用PCTParallel计算工具箱™和处理数据MATLAB®分布式计算服务器™,数据存储在您的本地机器复制的数据在不同的平台上云或集群机器,您必须使用“AlternateFileSystemRoots”
把根路径。
把一组相当于一根路径,指定“AlternateFileSystemRoots”
作为字符串向量。例如,
[" Z: \数据集”、“/ mynetwork /数据集”)
把多个根集数据存储路径是等价的,指定“AlternateFileSystemRoots”
作为一个单元阵列包含多个行,每一行表示一组等价的根路径。指定单元阵列中的每一行作为一个字符串向量或单元阵列的特征向量。例如:
指定“AlternateFileSystemRoots”
作为一个字符串向量的单元阵列。
{[Z: \“数据集”、“/ mynetwork /数据集”);…[" Y: \数据集”、“/ mynetwork2 /数据集”、“年代:\数据集”)}
另外,指定“AlternateFileSystemRoots”
作为一个单元阵列单元阵列的特征向量。
{{“Z: \数据集”、“mynetwork /数据集”},…{“Y: \数据集”,“mynetwork2 /数据集”,年代:\数据集的}}
的价值“AlternateFileSystemRoots”
必须满足以下条件:
包含一个或多个行,每一行指定一组等价的根路径。
每一行指定多个根路径和每个根路径必须包含至少两个字符。
根路径都是独一无二的,没有子文件夹。
包含至少一个根路径条目指向文件的位置。
有关更多信息,请参见为处理在不同的机器上或设置数据存储集群。
例子:[" Z: \数据集”、“/ mynetwork /数据集”)
数据类型:字符串
|细胞
“TextType”
- - - - - -输出文本变量的数据类型“字符”
(默认)|“字符串”
输出文本变量的数据类型,指定为逗号分隔组成的“TextType”
,要么“字符”
或“字符串”
。如果输出表的读
,readall
,或预览
函数包含文本变量“TextType”
指定这些变量的数据类型TabularTextDatastore
和SpreadsheetDatastore
只有对象。如果“TextType”
是“字符”
,然后输出单元阵列的特征向量。如果“TextType”
是“字符串”
,然后输出类型字符串
。
数据类型:字符
|字符串
“DatetimeType”
- - - - - -进口日期和时间数据类型“datetime”
(默认)|“文本”
对进口日期和时间数据类型,指定为逗号分隔组成的“DatetimeType”
这些值之一:“datetime”
或“文本”
。的“DatetimeType”
参数只适用于创建一个TabularTextDatastore
对象。
价值 | 进口日期和时间数据类型 |
---|---|
“datetime” |
MATLAB 有关更多信息,请参见 |
“文本” |
如果
|
例子:“DatetimeType”、“日期时间的
数据类型:字符
|字符串
“DurationType”
- - - - - -输出数据类型的时间数据“持续时间”
(默认)|“文本”
从文本文件输出数据类型的时间数据,指定为逗号分隔组成的“DurationType”
,要么“持续时间”
或“文本”
。
价值 | 对进口持续时间数据的类型 |
---|---|
“持续时间” |
MATLAB 有关更多信息,请参见 |
“文本” |
如果
|
数据类型:字符
|字符串
除了这些名称-值对,您还可以指定下列对象属性的名称-值对,除了文件
属性:
ds
——数据存储的数据的集合TabularTextDatastore
|ImageDatastore
|SpreadsheetDatastore
|KeyValueDatastore
|FileDatastore
|TallDatastore
|……数据存储的数据的集合,作为其中一个返回对象:TabularTextDatastore
,ImageDatastore
,SpreadsheetDatastore
,KeyValueDatastore
,FileDatastore
,TallDatastore
或DatabaseDatastore
。数据存储的类型取决于类型的文件或位置
论点。有关更多信息,请单击下面的表中的数据存储名称:
类型 | 输出 |
---|---|
文本文件 | TabularTextDatastore |
图像文件 | ImageDatastore |
电子表格文件 | SpreadsheetDatastore |
mat文件或文件所产生的序列mapreduce |
KeyValueDatastore |
自定义格式文件 | FileDatastore |
mat文件或文件产生的序列写 的函数高 数据类型。 |
TallDatastore |
数据库 | DatabaseDatastore |
对于每一个数据存储类型,文件
属性是一个单元阵列的特征向量。每个字符向量是一个绝对路径的文件解决位置
论点。
FileDatastore
|ImageDatastore
|SpreadsheetDatastore
|TabularTextDatastore
|imformats
|javaaddpath
|mapreduce
|高
你点击一个链接对应MATLAB命令:
运行该命令通过输入MATLAB命令窗口。Web浏览器不支持MATLAB命令。万博1manbetx
你也可以从下面的列表中选择一个网站:
选择中国网站(中文或英文)最佳站点的性能。其他MathWorks国家网站不优化的访问你的位置。