Command Palette
Search for a command to run...
Anthony Patera Rohan Abeyaratne

초록
생성형 AI, 특히 GPT는 기계공학 분석 문제에 대해 놀라울 정도로 정확한 해법을 도출할 수 있지만, 때로는 오류가 있는 해법을 제시하기도 한다. 예를 들어, 단순한 역학 문제에 대해 한 번의 GPT 인스턴스에서는 완벽하게 해결하지만, 다음 번 GPT 인스턴스에서는 잘못된 해법을 제시하는 경우가 있으며, 이 경우 성공 확률은 단지 85%에 불과하다. 이러한 불확실성은 GPT를 교육 현장이나 공학 실무에 즉시 적용하기에 부적절하게 만든다. 본 연구에서는 기계공학 문제 진술의 초기(저비용) 분석을 위한 'N-Plus-1' GPT 에이전시를 제안한다. 이 에이전시는 먼저 N개의 Agent Solve 인스턴스를 동시에 실행하여 N개의 독립적인 제안된 문제 해결 방안 실현체를 생성하고, 이후 Agent Compare를 호출하여 이 N개의 제안된 해결 방안을 요약·비교하고 최종적으로 추천된 문제 해결 방안을 제시한다. 콘도르세의 여론결정 이론(Condorcet's Jury Theorem)에 기반하여, 각각의 해결 과정에서 성공 확률이 1/2를 초과하는 문제 진술에 대해 (N이 충분히 크다면) 주된(즉, Agent Compare에 의해 도출된) 제안된 해결 방안이 정확한 해결 방안과 일치할 확률이 매우 높다고 주장할 수 있다. 더 나아가, Agent Compare는 후속(Second-order) 제안된 해결 방안의 요소도 통합할 수 있으며, 특히 해당 해결 방안이 문제 진술의 다른 해석(다른 수학적 모델), 또는 다른 수학적 해법 절차를 반영하는 경우에 유용하다. 상용 다중 에이전시 모델인 Grok Heavy와의 비교를 통해, 설계 및 성능 면에서 유사성이 있음을 확인할 수 있으나, 주요 차이점은 우리의 에이전시가 투명성과 교육적 가치에 더 중점을 두고 있다는 점이다.