생각의 사슬
사고의 사슬(CoT)은 대규모 언어 모델에서 논리적 추론 능력을 강화하는 기술입니다. 이 개념은 Google Brain의 수석 연구원인 Jason Wei가 처음 제안했으며 "라는 제목의 논문에서 발표되었습니다.사고의 사슬을 자극하여 대규모 언어 모델에서 추론을 이끌어냄"에 대한 자세한 내용은 "에서 설명합니다. CoT 기술은 복잡한 문제를 단계별 하위 문제 답으로 분해하여 모델이 세부적인 추론 과정을 생성하도록 안내합니다. 이를 통해 산술 추론, 상식적 추론, 기호 추론과 같은 복잡한 작업에 대한 모델의 성능이 향상됩니다.
CoT 기술의 주요 장점은 모델의 해석성을 크게 개선하고 모델이 복잡한 논리적 추론을 수행하는 데 도움을 줄 수 있다는 점입니다. 특히 여러 사실이나 정보를 결합해야 하는 문제에서 그 효과가 큽니다. 이는 인간의 추론 과정을 모방한 것으로, 일반적으로 직접적으로 답을 얻지는 않지만 일련의 사고, 분석, 추론 단계를 거칩니다. CoT 방법은 두 가지 형태로 나뉩니다. 수동 예제 주석을 기반으로 하는 소수 샷 CoT와 수동 예제 주석이 없는 제로 샷 CoT입니다. Few-shot CoT는 적은 수의 예를 제공하여 추론 과정을 보여주는 반면, Zero-shot CoT는 추가 예제가 필요 없이 특정 프롬프트(예: "단계별로 생각해 봅시다")를 통해 모델이 추론 체인을 생성하도록 자극합니다.