HyperAIHyperAI

数据仓库介绍

目前数据仓库下共有两个分类:

  • 数据集:除了模型相关的内容外的其他数据都可以放在这里
  • 模型:用于存放模型文件、与模型文件配合使用的代码等

数据仓库的创建

两个类型的数据仓库的创建有两个独立的入口。

创建数据集

点击数据集右边的「+」号,新建数据集。

创建模型

点击模型右边的「+」号,新建模型。

同样作为数据仓库,「模型」下和「数据集」下不能出现相同名字的项目。

数据仓库类型的切换

在「设置」页面,允许对数据仓库的类型进行切换:

选择数据类型,可切换为「模型」或「数据集」。

数据仓库之间的拷贝

为了方便用户数据集的管理,除了允许将工作目录创建为数据仓库版本外,也允许将某一个数据仓库的子目录重新创建为一个数据仓库版本:

在一个数据仓库版本的某一个目录下点击「拷贝当前目录到数据仓库」即可选择指定的数据集,选择「添加至已有数据仓库」或「新建数据集」或者「新建模型」。

  • 「添加至已有数据集」会把当前数据仓库的子目录添加到选定的已有数据集中。
  • 「新建数据集」会把当前数据目录在目标数据集下创建一个新的数据集版本。
  • 「新建模型」会把当前数据目录在目标模型下创建一个新的模型版本。 在拷贝或创建过程中新的数据集版本会标记为「正在拷贝数据」状态,完成拷贝后数据集版本会标记为「处理完毕」,即可使用。

为数据仓库添加 README.md 文件

每个模型仓库版本下可以提供一个名为 README.md 的文件,提供对该模型仓库版本的一些说明。该文件会被展示在模型仓库版本的页面中。

公开数据仓库

创建的数据仓库默认为「私有数据仓库」,在数据仓库的「设置」页面可以将整个数据仓库设置为「公开数据仓库」。所有的注册用户都可以通过 URL 访问该数据仓库。

每个人可以创建的「公开数据仓库」的个数是有限的,其限制可以在「资源使用状况」-「配额限制」-「公有数据集」查看。