目を閉じて推奨、見逃せない9つの機械学習データセット

内容概要: この号では、顔認識、姿勢推定、自動運転の 3 つの分野をカバーする、HyperAI 公式 Web サイトから最近更新された 9 つのデータセットをまとめています。
キーワード:顔認識、姿勢推定、自動運転
この記事は最初に WeChat 公開アカウントから公開されました。HyperAI スーパーニューラル
最近、HyperAI 公式 Web サイトは、画像、ビデオ、オーディオ、RGB-D などのデータ モダリティを備えた 300 以上の高品質公開データ セットを更新しました。
この記事では、オンデマンドでダウンロードして利用できる代表的なデータセットを9つまとめてまとめました。
HyperAI スーパー ニューラル データ セット ポータルへの直接アクセス:

顔認識
顔認識は、コンピュータ ビジョン プロジェクトのアプリケーションの 1 つです。顔認識トレーニングでは、学習データは量が多く、品質が安定しており、「不純物」がない、非常に優れた高品質の研究用データベースです。
VGG-Face2 顔認識データセット
VGG-Face2 データセットは、顔画像データセットです。
データセット内の画像はすべて Google 画像検索からのものです。データセット内の人々は、姿勢、年齢、人種、職業が大きく異なります。
VGG-Face2 データセット
発行機関: オックスフォード大学
含まれる数量: 331万枚の画像
データ形式: 画像
データサイズ: 37.49GB
発売時期: 2017年
ダウンロードアドレス:hyper.ai/datasets/5711
ヘレンの顔データセット
HELEN データセットは、400*400 ピクセルの 2,330 個の顔画像で構成されています。データセットには 2,000 枚のトレーニング画像と 330 枚のテスト画像が含まれています。人間の顔の主要なコンポーネントに対して、高精度で詳細かつ一貫したアノテーションが付けられます。
ヘレン データセット
発行機関: イリノイ大学
含まれる数量: 400×400ピクセルの顔画像2,330枚
データ形式: 画像
データサイズ: 1.02GB
発売時期: 2012年
ダウンロードアドレス:hyper.ai/datasets/16552
FairFace の顔データセット
FairFace は、より人種的にバランスの取れた顔画像データセットです。 データセットには、7 つの異なる人種グループ (白人、黒人、インド人、東アジア人、東南アジア人、中東人、ラテン系) を表す 108,501 枚の画像が含まれています。
FairFace データセット
発行機関: カリフォルニア大学ロサンゼルス校
含まれる数量: 108,501枚の画像
データ形式: 画像
データサイズ: 2.49GB
発売時期: 2020年
ダウンロードアドレス: hyper.ai/datasets/17876
人間の姿勢推定
姿勢推定では、何らかの幾何学的モデルまたは構造を使用して、オブジェクトの構造と形状を表現します。 現在の問題には、背景が複雑で、複雑なポーズのサンプルが少ないことが含まれます。
MPI-INF-3DHP 3D 人間姿勢推定データセット
MPI-INF-3DHP は、屋内および屋外環境の画像を含む 3D 人間の姿勢推定データ セットです。 データセットには130万フレーム以上の画像が含まれており、8人の参加者の8種類のアクティビティを14のカメラアングルから記録しています。
MPI-INF-3DHP データセット
発行機関: ザールランド大学
含まれる数量: 130万フレーム以上の画像
データ形式: ビデオ
データサイズ: 21.77GB
発売時期: 2016年
ダウンロードアドレス:hyper.ai/datasets/17262
HandNetハンドジェスチャーデータセット
HandNet の手のポーズ データセットには、RealSense RGB-D カメラの前にある 10 人の参加者の手の非剛体変形深度マップが含まれています。データ セットには、202,198 のトレーニング セット、10,000 のテスト セット、2,773 の検証セットを含む、合計 214,971 の深度マップが含まれています。
ハンドネット データセット
発行機関: イスラエル工科大学
含まれる数量: 214,971枚の画像
データ形式: 画像
データサイズ: 12.85GB
発売時期: 2015年
ダウンロードアドレス:hyper.ai/datasets/19801
3DPW ポーズ データセット
3DPW は 3D Poses in the Wild の略です。これは、正確な 3D 姿勢を備えた初の屋外データセットであり、姿勢推定の問題を解決するために使用できます。 データセットには 60 のビデオ シーケンス、3D ボディ スキャン、3D キャラクター モデルが含まれています。
3DPW データセット
発行機関: ライプニッツ大学ハノーバー
含まれる数量: 60本のビデオシーケンス
データ形式: ビデオ
データサイズ: 4.55GB
発売時期: 2018年
ダウンロードアドレス: hyper.ai/datasets/16463
自動運転
自動運転では人工知能がドライバーの役割を果たすことができる。道路上で発生するさまざまな状況の情報を収集・分析・処理することで、人間の制御に代わる運用を実現します。
Comma.ai自動運転動画データセット
Comma.ai データセットは、自動運転用のビデオ データセットです。 合計 7.25 時間のビデオを含むこのデータセットには、20Hz で記録された 10 個のビデオが含まれています。データセットには、車の速度、加速度、ステアリング角度、GPS 座標、ジャイロスコープ角度などの測定値も含まれています。
Comma.ai データセット
発行機関: Comma.ai カンパニー
含まれる数量: 7.25時間のビデオ
データ形式: ビデオ
データサイズ: 44.96GB
発売時期: 2016年
ダウンロードアドレス: hyper.ai/datasets/5200
Argoverse 自動運転データセット
Argoverse データ セットには、3D トラッキングとモーション予測の 2 つの部分が含まれています。
Argoverse 3D トラッキング データセットには、113 シーンの 3D トラッキング アノテーションが含まれています。 各セグメントの長さは 15 ~ 30 秒で、合計 11319 個の追跡オブジェクトが含まれています。トレーニング セットとテスト セットの各フラグメント シーンには、5 メートル以内のすべてのオブジェクトの注釈が含まれています。これは、車の走行可能領域 (5 メートル) 内のすべてのオブジェクトを検出し、3D フレームの形式で表示されていると理解できます。このデータセットは自動運転などの分野で使用できます。
Argoverse Motion Forecasting データ セットは、動き予測モデルのデータ セットです。 327793 のシーンが含まれており、各シーンは 5 秒続き、10 Hz でサンプリングされた各追跡オブジェクトの 2D 鳥瞰図が含まれています。このデータセットは 1,000 時間以上の路上走行から得られたもので、自動運転などの分野の研究に使用できます。
アルゴバース データセット
発行機関: アルゴAI
含まれる数量: 30,000以上のシーン
データサイズ: 260.38GB
発売時期: 2019年
ダウンロードアドレス:hyper.ai/datasets/8858
Talk2Car 自動運転データセット
Talk2Car データセットはオブジェクト参照データセットです。これには自動運転車用の自然言語で書かれたコマンドが含まれており、乗客は話すことで自動運転車にコマンドを与えることができます。
Talk2Car データセットは nuScenes データセット上に構築されており、セマンティック マップ、GPS、LIDAR、レーダー、および 3D バウンディング ボックス アノテーションを備えた 360° RGB 画像など、幅広いセンサー モダリティのセットが含まれています。
Talk2Car データセット
発行機関: ルーヴェン大学、ベルギー
データ形式: 画像
データサイズ: 1.65GB
発売時期: 2019年
ダウンロードアドレス:hyper.ai/datasets/18926
データセットを検索またはダウンロードするには、次のリンクにアクセスしてください。
- 以上 -