AIトレーニングで人間の役割は decades にわたり不可欠——データラベリング企業CEOが指摘
AIデータラベリングスタートアップ「Invisible Technologies」のCEO、マット・フィッツパトリック氏は、人工データ(シンセティックデータ)が数年以内に人間のデータ提供を代替するという見方は誤りだと断言している。先週公開された「20VC」ポッドキャストでの発言で、彼は業界の大きな誤解として、「AIの学習には2〜3年で人間のフィードバックが不要になる」という考えを指摘した。 フィッツパトリック氏は、「当初この仕事に携わった際、最もよく聞かれた反論が『合成データが支配するので、人間の関与は不要になる』というものだった」と振り返り、「原理的に考えれば、これは非常に筋が通らない」と述べた。合成データとは、人工的に生成されたデータで、プライバシー上の制約がある場合や実データが不足する状況でAIモデルの訓練に利用される。一方、人間によるフィードバックは、実際の人がAIの回答を評価・分類・訓練するプロセスを指す。 彼は、現実世界のタスクは多様で複雑であり、言語や文化的文脈を正確に捉えるには、AIが十分に学習するまでに長期間を要すると強調した。特に法律分野など、非公開情報が多数含まれる分野では、人間の知見が不可欠であり、「生成型AIの分野では、人間が長期間にわたり関与し続ける必要がある」と述べた。この認識は、徐々に業界内で共有されつつあると語っている。 フィッツパトリック氏は、マッキンゼーで量子ブラックラボを率いた経験を持つ元上級パートナー。Invisible Technologiesは2023年9月に1億ドルを調達し、20億ドルの評価額を達成。Scale AIやSurge AIといったデータラベリング企業と競合する。これらの企業は、テック大手がAIモデルを訓練するためのデータを確保しようと、億単位の資金調達を実施しており、何百万もの人間のコントラクターを雇用している。 同様に、他のデータラベリング企業の経営陣も人間の役割が続くと述べている。Mercorのブレダン・フーディ氏は「データ品質と、素晴らしい人材をいかに大切に扱うか」がビジネスの鍵だと語り、Handshakeのガレット・ロード氏は「一般知識を持つ人材ではなく、数学や科学といった専門知識を持つエキスパートが必要になっている」と指摘。AIがインターネット全体や書籍・動画を学習した現在、一般の人材では不十分だと述べている。 フィッツパトリック氏の見解は、AIの進化が急速であるものの、人間の知性と判断力が長期間にわたり不可欠であるという現実を示している。
