異常値

Odd One Out タスクは、言語モデルが単語のセットの中で意味的関係と文脈的な環境を分析して外れ値を特定する能力を評価することを目指しています。このタスクは推論能力テストの一部であり、モデルの理解力と生成品質の向上に重要な応用価値があります。