文档中心 > 发布数据集版本
发布数据集版本

最近更新时间:2021-06-07

在数据集管理过程中,针对同一个数据源,对不同时间标注后的数据,可以按版本进行区分,方便后续模型构建和开发过程中,选择对应的数据集版本进行使用。

数据标注完成后,可以将数据集当前状态进行发布,生成一个新的数据集版本。

1 数据集版本

  • 刚创建的数据集(未发布前),无数据集版本信息,必须执行发布操作后,才能有版本,版本可以应用于模型开发或训练。

  • 数据集版本,默认按v0001、v0002递增规则进行命名,您也可以在发布时自定义设置,以v开头+四位数字。

  • 您可以将任意一个版本设置为当前版本,即表示数据集列表中进入的数据集详情,为此版本的数据及标注信息。

  • 针对每一个数据集版本,您可以通过“存储路径”参数,获得此版本对应的Manifest文件格式的数据集。此Manifest文件可用于导入数据或者后续操作。

2 发布数据集

  • 登录紫光云控制台,选择产品与服务->人工智能->AI开发平台。

  • 在左侧菜单栏中选择“数据管理-> 数据集”,进入“数据集”管理页面。点击数据集名称,进入数据集“概览”页。在页面上方单击“发布”。

  • 弹出框中,填写“版本名称”,版本格式默认Default,然后单击”确定“。

  • “版本名称”默认按v0001、v0002递增规则进行命名。也可以设置为自定义的名称。名称只能包含字母、数字、中划线或下划线。

  • 版本发布后,您可以前往版本管理查看详细信息。系统默认将最新的版本作为当前版本

3 数据集发布后标注文件的存储位置

数据集是基于对象存储目录管理的,发布为新版本后,对应的数据集输出位置,也将基于新版本生成目录。

图像分类/文本分类/声音分类,数据集发布后,对应对象存储路径下生成,其相关文件的目录如下所示:

数据集输出位置/数据集名称/发布版本号/版本号.manifest,例如output/ds-haha/v0001/v0001.manifest

物体检测,数据集发布后,对应对象存储路径下生成,其相关文件的目录如下所示:

数据集输出位置/数据集名称/发布版本号/版本号.manifest,例如output/ds-haha/v0001/v0001.manifest