HyperAIHyperAI

Command Palette

Search for a command to run...

NYU教授がAI oral examでAI書きの課題に逆襲

ニューヨーク大学(NYU)ストーン経営大学院のパノス・アイペイロティス教授は、AIが作成した課題提出物の表面的な完成度に疑問を呈し、AIを活用した口頭試験を導入して学生の真の理解度を測る試みを行った。AI生成の課題は文句なしに洗練されていたが、実際に学生が自分の提出物を説明できないケースが相次いだ。これに危機感を抱いたアイペイロティス教授は、「自分の仕事に説明できないなら、書面の成果物は本当の理解を測っているとは言えない」と指摘。この問題に対処するため、「火に火を加える」戦略として、AIを活用した口頭試験を再導入した。 彼と共同研究者らは、ElevenLabsの会話型音声技術を基にAI審査官を開発。プロンプトを設定するだけで、短時間でシステムを構築。試験は2段階で構成された。まず、学生が提出したキャップストーンプロジェクトについて、AIが意思決定の根拠や思考プロセスを追及。次に、授業で扱った事例をランダムに選んで、即座に議論を促す。9日間で36人の学生を評価、1人あたり約25分、合計コストは約15ドルと、人間のTAによる口頭試験と比べて大幅に低コストだった。 さらに、AIが試験の回答を自動評価。Claude、Gemini、ChatGPTの3モデルが独立して評価し、互いの結果を検証・修正。Claudeが「議長」として最終判断を統合。AI評価は人間より一貫性があり、厳しくも公平だったと報告。また、人間が気づきにくい授業の理解ギャップもAIが指摘した。 一方、学生の反応は分かれた。多くの学生がAI口頭試験にストレスを感じ、書面試験より負担が大きいと感じたが、その一方で、真の理解を測る手段としての有効性を認めている。アイペイロティス教授は「学びとは練習を重ねるから上達する」とし、AI活用は学習の本質に近づく可能性を示した。 この取り組みは、AI時代の教育評価の在り方を再考する一例。大学はAIの活用と倫理、評価方法の見直しに直面しており、専門家らは「AI審査官」の導入も近い将来のあり得る選択肢と見ている。

関連リンク