NVIDIAの眼差し検出技術が見守りと会話設計の壁を越える
NVIDIAが開発した「Eye Contact & Gaze Detection」技術は、会話設計と作業現場の安全を結ぶ新たなインターフェースとして注目されている。同技術の核心は、人間の視線がもつ「注意の信号」を機械が読み取ることにある。会話中、視線のやり取りは相手の関与状態を確認する基本的な手段であり、話者の発言終了や相手の注意の移動を非言語的に伝える。これと同じ原理が、重機操縦の安全にも応用可能だ。例えば、カタピラーの荷物運搬トラックの運転手が視線を逸らしていると、集中力が低下している可能性がある。この「視線=注意」の信号は、言語やキーボード、タッチスクリーンよりも古く、人間の社会的相互作用の基盤である。 しかし、現在の音声インターフェースやスマートスピーカーは、視線の動きを一切無視している。人間同士の会話では「顔の速度」で情報がやり取りされるが、機械はその非言語的なコミュニケーションチャネルを完全に失っている。このギャップが、会話の質の低下だけでなく、重機などでの事故リスクを生む要因にもなる。 NVIDIAのMaxine Eye Contact APIは、視線を補正する技術として設計されている。実際のプロトタイプでは、カメラ映像から視線のずれを検出し、視線を前方に修正した映像を出力する。この補正の大きさが、視線がどれだけ逸れていたかを示す。補正がほとんどなければ「注意集中」、大きな補正があれば「視線逸脱」と判断できる。この差分をリアルタイムで可視化し、緑・黄・赤の枠、ステータス表示、スコアバー、タイムラインチャート、安全レポートといった形で出力する。これにより、操縦者の注意状態を客観的に監視できる。 このプロトタイプは、300行程度のPythonコードで実現され、GradioでWebインターフェースを提供。映像をアップロードし、APIキーを入力するだけで、視線の集中度を評価できる。実際の現場では、視線の逸脱を早期に検知することで、事故の予防につながる。視線という「最も自然なインターフェース」をAIが読み取ることで、人間と機械の信頼関係が深化し、安全な共生が可能になる。
