AIの「おそらく」は人間の「おそらく」と違う? 確率表現の誤解がAI信頼に影響
AIが「おそらく」という言葉を使うとき、人間の意味する「おそらく」とは異なる意味を持っていることが、新たな研究で明らかになった。米国研究チームの調査によると、大規模言語モデル(LLM)であるChatGPTなどのAIは、人間が「可能性」を表現する語彙——「おそらく」「たぶん」「ほぼ確実」など——を、人間とは異なる基準で解釈している。この研究は、npj Complexityに掲載されたもので、AIの会話能力は高いものの、不確実性の表現において人間との認識のズレが生じていることを示している。 研究では、AIと人間が「可能性」を数値でどう捉えるかを比較。結果、極端な表現(例:「不可能」)では両者に大きなズレは見られなかったが、「たぶん」や「おそらく」などの中間表現では顕著な違いが確認された。たとえば、AIが「likely(おそらく)」と表現する確率は平均80%に達する一方、人間は65%程度と解釈する傾向がある。これは、人間が文脈や経験に基づいて意味を読み取るのに対し、AIは訓練データに含まれる多様な使い方を平均化しているため、解釈がずれるからだと考えられる。 さらに、性別や言語の違いも影響を与えることが分かった。プロンプトが「彼」から「彼女」に変わると、AIの確率評価がより厳格になり、性別バイアスが現れる。また、英語から中国語に変更すると、確率表現の解釈が変化し、言語ごとの不確実性の表現スタイルの違いが影響している可能性がある。 この認識のズレは、医療や政策立案、科学報道など、リスクを扱う重要な分野で深刻な問題を引き起こす。たとえば、AIが医師に「副作用は『まれ』だ」と伝えても、AIの「まれ」が人間の「まれ」とは異なる確率を意味している場合、診断や治療判断が誤るおそれがある。 現在、研究者は「思考の道筋」をAIに提示させる「チェーン・オブ・シンキング」手法の有効性を検証しているが、それでも根本的なズレを解消できないことが分かっている。今後の課題は、AIが単に次の言葉を予測するのではなく、不確実性の「重み」を正しく理解できるようにすること。そのためには、確率表現の整合性を測る新しい評価基準の構築が不可欠だ。AIが「おそらく」と言えば、人間と同じ意味で「おそらく」になる——その実現こそ、信頼できるAIとの協働の第一歩となる。
