HyperAI超神経

同年のこの決定により、リー・フェイフェイは AI 世界の女王としての地位を確立しました。

特色图像

ImageNet は最も古典的なデータ セットとして、コンピューター ビジョンの急速な発展を主導してきました。では、このデータセットの確立の背後にはどのような課題があり、ディープラーニングの開発にどのような影響を与え、今日の機械学習の熱い時代にどのようなインスピレーションをもたらすのでしょうか?

有名なコンピューター科学者のリー・フェイフェイは、何度も次のように述べています。人工知能は世界を変えるでしょうが、人工知能を変えるのは誰でしょうか?

リー・フェイフェイが業界で重要な役割を果たしており、彼女の発言すべてが業界に衝撃を与える可能性がある理由は、彼女の多くの重要な研究成果だけではありません。非常に重要な点は、彼女が ImageNet プロジェクトの設立を開始し、業界全体の促進に重要な役割を果たしたことです。

ImageNet: AI の開発を変えたデータセット

コンピューター ビジョンは、現時点で AI 開発の最適な方向性です。 ImageNet は、この分野では古典的なデータ セットです。ImageNet がなければ、現在の顔認識は贅沢なものになると言っても過言ではありません。

ImageNet は、Li Feifei らによって CVPR 2009 の論文で発表されました。ImageNet の量と高品質は前例のないものです。これには、22,000 のカテゴリをカバーする 1,500 万枚の注釈付き画像が含まれており、コンピューターに世界の多様性を理解させるように設計されています。

ImageNet はコンピュータ ビジョンの急速な発展を推進しました

過去 10 年間に、ImageNet に関する入門論文が出版されてきました。 ImageNet: 大規模な階層型画像データベースこの論文は現在 Google Scholar に大きな影響を与えています。11914回引用されました

別の論文では、ImageNet Data Challenge と物体認識分野における研究の進歩について説明しています。 ImageNet 大規模視覚認識チャレンジ、引用数も驚異的な数に達しています。 11056回

Google Scholar における両論文の引用数は驚くほど高いです。

ImageNet はコンピュータ ビジョン認識分野のベンチマークとなり、また業界を高品質データ セットの時代に導きました。2010 年以降、Google や Microsoft などの大手企業や複数の研究機関が導入を開始しました。高品質のデータセットを立ち上げるため。

ImageNet は、2019 年のトップカンファレンス CVPR でも時の試練に耐えました。コンピューター ビジョン イメージングに対するこの 10 年間で最も大きな影響を与えた賞を受賞——Longuet-Higgins Award は、ImageNet を掲載した新聞社に何の不安も持たずに授与されました。

10 年前、彼女はデータの重要性を予見しました

2009 年当時、業界の主流の考え方はまだ、理論的で手作業でコード化された機械学習で具体化され、一般的な問題を解決するために数学的手法を使用するモデルに関するものでした。

そして、インタビューの後半で彼女が語ったように、リー・フェイフェイは非常に「オルタナティブ」なことをしました。「研究を行うときは、長期的な影響を与える必要があります。現在のトレンドだけを見るのではなく、しっかりとした影響力のある研究を行うことに専念しなければなりません。」

2006 年、フェイフェイ・リーはイリノイ大学アーバナ・シャンペーン校でコンピュータ サイエンスの教授を務めていたとき、コミュニティ全体がアルゴリズムを指定するためのより良い戦略を研究しているにもかかわらず、データの役割を過小評価していることに気づきました。

冷静な分析を通じて、彼女はこれの欠点を認識しました。使用されるデータが研究のために生成され、現実世界の状況を反映できない場合は、最良のアルゴリズムであっても意味がありません。

このため、彼女はデータについて大騒ぎすることを決意しました。

10 年前のコンピューターは、まだ特徴を取得して結果を与えることでオブジェクトを認識していました。ただし、これには多くの欠点があります。たとえば、同じオブジェクトの複数の姿勢や角度の場合、コンピューターによって抽象化されたモデルは誤解を引き起こすことがよくあります。

最大の問題は、トレーニング データが単一であることです。コンピューターに 1 種類の画像のみが与えられると、画像が少し変更されると、コンピューターはそれを認識できなくなります。

Li Feifei は、この問題がコンピュータ ビジョンの最大のボトルネックになることを鋭く発見しました。

ImagNetの誕生:挑戦の連続

この問題を解決するために、李飛飛の考えは人々に戻りました。3 歳児は、目を通して多数の物体を見て、多数の画像を収集するため、物体を認識し区別することができます。

大量のラベル付き画像をコンピューターに入力すると、AI が画像の認識を学習できる可能性があります。この考えに沿って開発するために最も重要なのはデータですが、包括的なシステムをどのように確立するか?

このとき、ある男性が、 ワードネット  プロジェクトはリー・フェイフェイのビジョンに現れました。

これは、語彙分類に基づいて構築された英語アーキテクチャであり、各単語が他の単語との関係に従って表示されます。プロジェクト全体は、世界中の多数のオブジェクトの単語をカバーします。

ImageNet 階層は WordNet から派生したものです

2006 年に WordNet 研究者であるクリスティアン フェルバウム教授と会った後、リー フェイフェイはその答えを見つけました。彼女は WordNet の手法を真似て、各単語のサンプル画像を提供する大規模なデータ セットを構築することでした。

翌年、リー・フェイフェイはプリンストン大学に勤務していたときに、 イメージネット  彼らの目標は次のとおりです。完全で巨大な画像システムを構築するのに十分な量の注釈付き画像を入手します。

しかし、その作業量があまりに膨大だったので、当初はオンライン画像を検索、フィルタリング、ラベル付けしてデータセットに追加するために大学生を雇おうと考えていました。

しかし、Li Feifei はすぐに、この画像収集速度が遅すぎることに気づきました。目安として、飲まず食わずでマーキングを続けると数十年かかると言われています。

偶然にも、リー・フェイフェイは新たな転機を発見した。紹介されてから彼らは知ったAmazon Mechanical Turk のオンラインクラウドソーシング手法、このプラットフォームでは、雇用主はオンラインで多くの人を雇用して、簡単な採点を完了させることができます。

Amazon Mechanical Turk の画像分類用インターフェース

最後に、Amazonのクラウドソーシングサービスを利用することで、167ヶ国から49,000人が参加し、2年半かかりました。この巨大なプロジェクトを完了する時が来ました。

サポートがない、資金が足りない、人手不足という複数の課題にもかかわらず、彼らの粘り強さによって ImageNet は粘り強く誕生しました。

新しいこととして、ImageNet は当初注目されませんでした。2009 年のカンファレンス CVPR では、ImageNet の論文は研究ポスターとしてのみ使用され、目立たない場所に掲載されました。

この現状は、ImageNetから派生したチャレンジコンペティションによって完全に覆されました。

ILSVRC コンペティション: ImageNet をヒットに

ImageNet がリリースされてから 1 年後、Li Feifei らの努力により、 ImageNet 大規模視覚認識チャレンジ (ILSVRC) が登場

ILSVRC は ImageNet コンテストとしても知られ、2010 年に始まり、毎年開催されています。このコンテストでは、出場者は ImageNet データセットを標準として使用して、大規模な物体検出と画像分類のパフォーマンスを評価します。

ImageNet Challenge における画像分類の誤り率は年々減少しており、人間の誤り率 (5.0) を超えています。

すぐに、このイベントはスクリーニングアルゴリズムコンテストのオリンピックになりました。主要な機関は、独自のアルゴリズムの長所と短所をテストするための訓練場としてこれを使用しています。一時は、さまざまな躍進や成果も次々と生まれました。

しかし、ImageNet コンテストのハイライトは、ニューラル ネットワークとディープ ラーニングの開発を促進したことです。

2012 年の ImageNet コンテストでは、ヒントンがチームを率いて出場しました。その年、ヒントンのチームが使用したディープラーニング手法は、他のすべての手法をはるかに上回り、画像認識コンテストで最高の成績を収めました。彼らが提出した深層畳み込みニューラルネットワーク構造モデル アレックスネットは2位の結果を41%上回る10.8 %のパフォーマンスを完全に向上させました。

ディープラーニングの創始者であり、2018 年チューリング賞受賞者: ヒントン

このコンセプトは何ですか?当時、1%の性能向上は「大きな貢献」となるが、10年以上眠っていたニューラルネットワーク方式が10パーセントポイントを超え、一瞬にして激震が起きた。

当時のAlexNetのエラー率は0.16422、2位と3位は0.2617と0.2679でした。

これまで、ディープ ニューラル ネットワークではこのような大規模なデータ トレーニングは経験されていませんでした。AlexNet 以降、ディープ ニューラル ネットワークの優れた機能が ImagNet を背景に十分に実証されました。

2 年後、ImageNet Challenge のすべてのチームがディープ ラーニングを使用しました。

競争は終わり、研究は続く

8 年後の 2017 年に、ImagNet Challenge の使命は達成されました。コンピューターの認識エラー率は人間の認識エラー率よりも低くなりました。成熟した画像の識別はもはや困難ではなく、新たな旅は画像の理解に向けられているため、コンテストは成功裡に終了します。

ImageNet と課題を原動力として、オブジェクトのコンピュータ分類の精度は 71.8% から 97.3% に向上しました、人間のレベルをはるかに超えています。

ImageNet の設立過程を振り返ると、これは当時主流の仕事ではありませんでしたが、この「逆潮流」の問題は、最終的には李飛飛らの粘り強さによって AI の歴史的過程を促進しました。同時に、Li Feifei は ImageNet のおかげでコンピュータ ビジョンの分野に最も重要な足跡を残しました。

ディープラーニングにおける大規模データの重要性

データを機械学習の「ロケット燃料」に例えると、ImageNet は間違いなく最初で最も豊富な燃料です。

リー・フェイフェイのチームは次のように述べています。「最も人気のあることをする必要はありませんが、自分が信じて影響を与える何かをしなければなりません。」

参考文献:

1. AI 研究を変革したデータ、そしておそらくは世界

2.画像を理解できるようにコンピューターを再教育する方法

3. CVPR 2019 には 9,000 人の参加者が集まり、10 年後に ImageNet が受賞を発表

4. AI の画期的な進歩は 1 つだけです

5. ImageNet の出版物と引用

6.大規模視覚認識チャレンジ

- 以上 -