AIが経済学の記述式試験を人間の採点者と同等に評価
人工知能(AI)がマクロ経済学の自由記述式試験回答の採点において、人間の採点者と同等の精度を達成したことが明らかになった。大学の経済学試験では、「高人口増加はGDPにどのような影響を与えるか」といった問いが頻出。こうした問題は専門知識に加え、経済的思考力や論理的展開力が求められるため、採点は教員や助教にとって時間と労力がかかる作業である。 米国・スタンフォード大学の研究チームは、大規模言語モデルを活用したAI採点システムを開発。このAIは、学生の自由回答文を詳細に分析し、内容の正確性、論理構成、用語の適切さなどを評価。実際の試験回答1,000件以上を対象に、AI採点と人間採点の結果を比較したところ、両者の一致度は90%以上に達した。特に、経済理論の理解度や主張の整合性を評価する点で、AIは人間の採点者とほぼ同等の判断を示した。 研究チームのリーダーである経済学者は、「AIは単なる語彙の一致ではなく、経済的因果関係の説明を正しく捉える能力を持っている」と指摘。今後、大学の教育現場でAIを活用することで、教員の負担軽減と採点の一貫性向上が期待される。 一方で、研究チームは「AIは補助ツールとしての位置づけにとどめ、最終的な採点判断は人間が行うべき」と強調。特に、複雑な政策提言や倫理的配慮を含む回答については、人間の判断が不可欠だと結論づけている。 この成果は、AIが学術評価の分野でも実用的価値を持つ可能性を示すもので、今後、教育現場におけるAI活用の拡大が見込まれる。
