Command Palette

Search for a command to run...

データ レイクデータ レイク

日付

1年前

データ レイクは、大量の生データをネイティブ形式で保存できるクラウド アーキテクチャの中心的な場所です。データ レイクは、オブジェクト ストレージを活用したフラット アーキテクチャを利用してファイルのメタデータを維持するという点で、データ ウェアハウスやサイロとは異なります。

「データレイク」という用語は2015年に提案されましたが、この概念は10年以上前から実用化されています。データ レイクは、さまざまな種類やソースの大量のファイルを後で分析できるように保存できる、スケーラブルなデータ リポジトリのニーズを満たします。

データ レイクは、ペタバイト単位のデータを元のネイティブ形式で保持できる一元化された場所と考えることができます。データをファイルやフォルダーに保存する階層型データ ウェアハウスとは対照的に、データ レイクはオブジェクトベースのストレージを備えたフラット アーキテクチャを利用します。ビッグ データ操作では、メタデータ タグと識別子を使用して、リージョン全体のデータをより簡単に、より優れたパフォーマンスで検索して取得できます。さらに、複数のアプリケーションが独自のデータ形式を利用できるようにサポートされています。

参考文献

【1】https://www.hpe.com/cn/zh/what-is/data-lake.html

AI で AI を構築

アイデアからローンチまで — 無料の AI 共同コーディング、すぐに使える環境、最適価格の GPU で AI 開発を加速。

AI 共同コーディング
すぐに使える GPU
最適価格
今すぐ始める

Hyper Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています