HyperAIHyperAI

Command Palette

Search for a command to run...

NVIDIA Eye Contact : la détection du regard révolutionne la sécurité des opérateurs de machinerie lourde

La détection du regard et du contact visuel, technologies développées par NVIDIA via son API Maxine Eye Contact, ouvre une nouvelle dimension dans la conception des interfaces conversationnelles et la sécurité des opérateurs de machines lourdes. À première vue, ces deux domaines semblent éloignés : l’un concerne l’interaction humaine, l’autre la prévention des accidents. Pourtant, ils reposent tous deux sur une même question fondamentale : la personne est-elle attentive ? Dans une conversation, le regard est le principal indicateur de l’engagement. Des études publiées dans PNAS montrent que le contact visuel marque les moments de partage d’attention, tandis que son absence signale un déplacement de focus. Ce signal non verbal est si puissant qu’il régule même le tour de parole : les locuteurs dévient le regard au début de leur énoncé ou lorsqu’ils hésitent, puis le rétablissent à la fin pour signaler qu’ils cèdent la parole. Cette dynamique, plus subtile que les mots, est ignorée par la majorité des assistants vocaux actuels, qui fonctionnent sans visage, sans yeux, sans micro-expressions. Le concept de « face speed », proposé par Fjord, met en lumière ce manque : la conversation humaine évolue au rythme des expressions faciales, des regards, des clignements — un rythme bien plus rapide que celui des interfaces textuelles ou des chargements numériques. Un assistant vocal ne perçoit pas ces signaux, ce qui rompt le lien social et réduit la confiance. NVIDIA Maxine Eye Contact corrige le regard dans une vidéo, en redirigeant les yeux vers la caméra même si la personne regarde ailleurs. Bien que l’API ne fournisse pas directement les angles de regard, une astuce ingénieuse permet de les inférer : en comparant l’image d’origine et celle corrigée, la différence de pixels dans la zone visage/yeux reflète le degré d’attention. Une faible différence signifie un regard fixé sur la caméra ; une grande correction indique une distraction. Un prototype a été développé pour exploiter cette logique dans un contexte de sécurité. Il analyse des vidéos d’opérateurs de camions de Caterpillar, en générant une sortie annotée en temps réel : une bordure colorée (vert/jaune/rouge), une barre de score, un graphique temporel des distractions, et un rapport final avec un verdict (PASS, WARNING, FAIL). L’outil, accessible via une interface web Gradio, fonctionne avec une clé API NGC. Le code, d’environ 300 lignes, filtre les faux positifs (clignements, regards fugaces) en exigeant une différence de pixels significative et une durée minimale. Cette approche montre que la même technologie peut servir à la fois à améliorer les interfaces conversationnelles — en rendant les assistants plus humains — et à sauver des vies sur les chantiers. Enfin, la capacité à mesurer l’attention par le regard transforme une fonction de correction visuelle en outil de surveillance proactive. Des experts du secteur soulignent que cette fusion entre IA et perception humaine représente une avancée majeure, tant pour l’expérience utilisateur que pour la sécurité industrielle.

Liens associés

NVIDIA Eye Contact : la détection du regard révolutionne la sécurité des opérateurs de machinerie lourde | Articles tendance | HyperAI