HyperAIHyperAI

Command Palette

Search for a command to run...

18歳起業家が世界最大の工場作業視覚データセットをオープンソース化、ロボット学習の新時代へ

18歳の起業家エディ・シュウ(Eddy Xu)が率いるAI企業Build AIが、史上最大規模の第一人称視覚データセット「Egocentric-10K」をオープンソース化した。このデータセットは、2,153人の工場作業員が実際に勤務する現場で、頭戴型カメラで記録した1万時間に及ぶ動画を収録しており、合計16.4TB、10億8,000万フレーム以上にのぼる。Hugging FaceでApache 2.0ライセンスで公開され、商業利用や改変が可能。シュウ氏は「ロボット学習のデータ拡張時代が到来した」と宣言。 Egocentric-10Kは、実際の工場環境で撮影された動画のみを対象としており、部品加工、組立、検品、包装といった全工程を網羅。統計では、96.42%の作業が片手以上、76.34%が両手協働、91.66%が物体の能動的操作を含む。これは、既存データセット(Ego4DやEPIC-KITCHENS)を大きく上回る。動画はフルHD MP4形式で、工場・作業者ごとに分類され、JSON形式のメタデータとWebDataset形式で提供され、特定のデータを部分的にダウンロード・流し込み可能。 シュウ氏は、15歳でVEXロボット世界大会で32位にランクインするなど、自らの才能を早々に証明。高校時代にAPコンピュータ科学を取得し、自らの教育テック企業を3か月で売却。2025年、コロンビア大学在学中にMetaスマートグラスを活用したAIチェスシステムを開発し、注目を集めた。その後、2,500万ドル以上の株式オファーを断り、Build AIを設立。同社は9月にAbstract Ventures、Pear VC、HF0らから500万ドルの資金調達を実施。投資家には、AIチェスシステムの実用者であるチェス選手アレックス・ボテズも名を連ねる。 Build AIは、人間の第一人称視覚データを収集・拡張することで、物理的な「スーパーアイ」の実現を目指す。MetaのEgoMimicやFigure AIの「Project Go-Big」も同様の戦略を採用。Figure AIは10万以上の住宅で人間の日常行動を収集し、「ゼロショット」で人形ロボットが任務を学習できると発表。一方、Build AIは「人間の行動からロボットに学ばせる」アプローチを徹底。データの規模と質の向上を継続的に推進しており、同社は「技術的リスクは高いが、成功すれば数十億人の生活を変える」と強調。 Egocentric-10Kの全データと3万フレームの評価用サブセットは、Pythonのdatasetsライブラリで直接利用可能。このデータセットは、ロボット学習の基盤として、今後のAIと物理世界の融合を加速する可能性を秘めている。

関連リンク

18歳起業家が世界最大の工場作業視覚データセットをオープンソース化、ロボット学習の新時代へ | 人気の記事 | HyperAI超神経