教育における人間-AI協働ハイブリッドエッセイのための自動境界検出へ向けて

最近の大規模言語モデル(LLM)であるChatGPTなどは、特定の指示が与えられた場合に、人間らしい自然な応答を生成する能力を備えている。技術進歩がもたらす利便性を認めつつも、教育現場では、学生がLLMを活用して課題の文章作成を代行し、それを自らのオリジナル作品であるかのように提出する可能性に懸念を抱いている。こうした懸念から、多くのAI生成コンテンツ検出に関する研究が行われてきたが、それらの多くは、テキストが完全に人間によって書かれたものか、完全にAIによって生成されたものかの二値分類問題としてモデル化しており、中間的な状態(人間とAIが共同で作成したハイブリッドテキスト)を考慮していない。本研究では、現実的ではあるがほとんど検討されていない設定、すなわち人間と生成型LLMが共同で作成したハイブリッドテキストの検出を対象にした。まず、与えられたハイブリッドテキストから人間による記述とAIによる生成の間の遷移点(境界点)を特定するという問題として検出タスクを形式化した(境界検出)。その後、以下の二段階アプローチを提案した:(1)エンコーダの学習段階で、AI生成テキストと人間によるテキストを分離する処理を実施;(2)隣接するプロトタイプ間の距離を計算し、最も距離が離れた隣接するプロトタイプの間を境界と仮定する。広範な実験を通じて、以下の主な発見を得た:(1)提案手法は、異なる実験設定においてもベースライン手法を一貫して上回る性能を示した;(2)エンコーダの学習プロセスが、提案手法の性能向上に顕著な寄与をした;(3)単一境界を持つハイブリッドエッセイの境界検出において、比較的大きなプロトタイプサイズを採用することで、提案手法の性能が向上し、ドメイン内評価で22%、ドメイン外評価で18%の改善が達成された。