文档中心 > 导入数据集
导入数据集

最近更新时间:2021-06-22

数据集创建完成后,平台会直接从设置的数据集输入位置直接同步数据。另外,您还可以通过导入数据集的操作,继续导入更多数据

当前支持从对象存储目录导入或从Manifest文件导入两种方式。

1 前提条件

  • 已经存在创建完成的数据集。

  • 需导入的数据,已存储至对象存储中。如果是Manifest方式导入,则Manifest文件也需要存储至对象存储中。

  • 确保数据存储的对象存储桶与AI开发平台在同一Region(当前只支持华北1-天津)。

2 从对象存储导入

需要导入的数据集已提前存储至对象存储目录中。此时需选择您具备权限的对象存储路径,且对象存储路径内的目录结构需满足规范,详细规范请参考从对象存储导入的规范说明。当前“图像分类”“物体检测”“文本分类”“声音分类”4种类型的数据集,都支持从对象存储目录导入数据。

在数据集列表页面,点击某个数据集名称,进入数据集详情页面。点击“导入”按钮,弹出导入数据集对话框。

配置是否必填说明
导入方式选对象存储或者Manifest文件,这里选择对象存储
存储目录选择对象存储的某个路径。

导入成功后,数据将自动同步到数据集中。您可以在“数据集”页面,点击某个数据集名称,查看详细数据并进行数据标注。

3 从Manifest文件导入

需要导入的数据集、Manifest文件已提前存储至对象存储目录中。且Manifest文件需要满足规范,详细规范请参考从Manifest文件导入的规范说明。当前“图像分类”“物体检测”“文本分类”“声音分类”4种类型的数据集,都支持从Manifest文件导入数据。

在数据集列表页面,点击某个数据集名称,进入数据集详情页面。点击“导入”按钮,弹出导入数据集对话框。

配置是否必填说明
导入方式选对象存储或者Manifest文件,这里选择Manifest文件
Manifest目录选择对象存储的某个路径下的Manifest文件。
按标签导入填写标签,将导入含有这些标签的文件。比如标签填写A和B,则导入含有标签A或B的文件
不填写标签,将导入全部文件,不论是否标注
同时导入标注勾选,将同时导入标注信息
不勾选,不导入标注信息,所有导入文件都是未标注

导入成功后,数据将自动同步到数据集中。您可以在“数据集”页面,点击某个数据集名称,查看详细数据并进行数据标注。