Command Palette
Search for a command to run...
Anthony Patera Rohan Abeyaratne

要約
生成型AI、特にGPTは機械工学の解析問題に対して驚くべき解決策を提示できる一方で、ときには誤った解答を導くこともある。たとえば、基礎力学の問題において、あるGPTインスタンスでは完璧に解けるが、次のGPTインスタンスでは誤った解法を示すことがあり、正解の確率はわずか85%にとどまる。このような信頼性の欠如により、「オールインワン」型のGPTは教育現場や実務現場への導入には不適切である。そこで本研究では、機械工学の問題文に対する初期(低コスト)解析を目的とした「N-Plus-1」GPTエージェンシーを提案する。このエージェンシーは、まずN個の「Agent Solve」インスタンスを並列起動し、N個の独立した「提案される問題解決策の実現」を生成する。その後、これらのN個の提案解決策を統合・比較するため、「Agent Compare」を起動し、最終的な「推奨される問題解決策」を提示する。コンドルセの陪審員定理(Condorcet's Jury Theorem)に基づき、各「Agent Solve」の成功確率が1/2より大きく、かつNが十分に大きい場合、多数決によって選ばれる「Agent Compare」の提案解決策は、高い確率で正しい解決策となると主張する。さらに、Agent Compareは、二次的な提案解決策(例えば、問題文の異なる解釈、異なる数学モデル、または異なる解法手順)の要素も統合可能である。商用マルチエージェントモデル「Grok Heavy」との比較により、設計および性能面で類似性が認められる一方で、本エージェンシーは透明性と教育的価値に重点を置いている点で重要な差異があることが明らかになった。