AIの道徳的判断力を測る新ルートマップが提言される
グーグル・ディープマインドの研究チームが、人工知能(AI)の道徳的判断力の評価に向けた新たな科学的基準を提唱した。Nature誌に掲載された論文では、大規模言語モデル(LLM)が医療相談や心理的支援といった道徳的敏感な課題に直面する中で、単なる「人間の反応の模倣」にとどまらず、真正の道徳的判断能力(道徳的コンピテンス)を有しているかどうかを測定する必要性が強調されている。 現行の評価方法は「道徳的パフォーマンス」に依拠しており、回答が「正しそうに聞こえる」かどうかに焦点が当たっている。しかし、これはAIが背後にある倫理的根拠を理解しているかどうかを示すものではない。研究チームは、この評価の限界を克服するため、3つの核心的な課題を指摘している。 第一は「フェイク・マナー問題」——AIが道徳的思考の表面的な模倣にとどまり、本質的な論理を備えていない可能性があること。第二は道徳の複雑さ——公平性、誠実さ、コスト、社会的常識など複数の価値観が衝突する場面で、AIが適切にバランスを取れないこと。第三は「正解の不在」——文化的・職業的背景によって道徳基準が異なるため、普遍的な正解が存在しない点である。 こうした課題に対応するため、研究チームは道徳的コンピテンスを評価するための3段階のロードマップを提案する。第一に、訓練データにない稀な状況を提示し、AIが論理的推論を用いているか、単なるパターン認識に頼っているかを検証する。第二に、わずかな変化(例:年齢やコストの違い)を加えた類似シナリオを提示し、AIが「本質的な要因」を捉えているかを確認する。第三に、特定の文化や職業の倫理基準に従って判断を調整できるかを検証する。 研究チームは、道徳的コンピテンスの測定が、AIの安全な大規模導入に不可欠であると強調。AIが人間の意思決定を補完する未来に向けて、真の倫理的判断力を持つAIの開発と評価が、今後の鍵となる。
