하루 전
ChemDFM-R: 원자화된 화학 지식으로 강화된 화학 추론 기능을 갖춘 대규모 언어 모델
Zihan Zhao, Bo Chen, Ziping Wan, Lu Chen, Xuanze Lin, Shiyang Yu, Situo Zhang, et al

초록
대규모 언어 모델(LLM)은 놀라운 진전을 이뤘지만, 화학과 같은 과학 분야에의 응용은 여전히 깊이 있는 도메인 이해 부족과 제한된 추론 능력으로 인해 어려움을 겪고 있다. 본 연구에서는 화학 분야에 초점을 맞추어 화학 추론 전용 대규모 언어 모델인 ChemDFM-R을 개발한다. 먼저, 화학의 기본 원리와 논리적 구조에 대한 모델의 이해를 강화하기 위해 원자화된 지식 포인트로 구성된 포괄적인 데이터셋을 구축한다. 이후, 전문가가 정제한 지식과 일반 도메인 추론 능력을 통합하는 혼합 소스 증류 전략을 제안하고, 도메인 특화 강화 학습을 통해 화학 추론 능력을 향상시킨다. 다양한 화학 기준 평가에서의 실험 결과는 ChemDFM-R이 최첨단 성능을 달성하면서도 해석 가능한, 근거 기반의 출력을 제공함을 보여준다. 추가적인 사례 연구를 통해 명시적인 추론 체인의 활용이 실제 인간-AI 협업 환경에서 모델의 신뢰성, 투명성 및 실용성을 크게 향상시킬 수 있음을 입증한다.