Discord에서 논의하기

5달 전

Shalini Maiti Amar Budhiraja Bhavul Gauri Gaurav Chaurasia Anton Protopopov Alexis Audran-Reiss Michael Slater Despoina Magka Tatiana Shavrina Roberta Raileanu

초록

대규모 언어 모델(Large Language Models, LLMs)은 다양한 분야에서 놀라운 성능을 보여주고 있으나, 여전히 막대한 계산 자원과 시간이 소요되는 훈련 과정을 필요로 하며, 훈련 절차의 정교한 조율 또한 요구된다. 동일한 아키텍처를 가진 다수의 모델 가중치를 평균화하는 '모델 수프(Model Souping)' 기법은 재훈련에 드는 비용 없이 성능을 향상시킬 수 있는 유망한 사전 및 사후 훈련 기법으로 부상하고 있다. 본 논문에서는 벤치마크 구성 기반의 체계적인 접근 방식을 도입한 '분야 전문가의 수프(Soup Of Category Experts, SoCE)'를 제안한다. SoCE는 최적의 모델 후보를 식별하기 위해 벤치마크의 구성 특성을 활용하고, 성능을 극대화하기 위해 비균일 가중 평균을 적용한다. 기존의 균일 가중 평균 방식과 달리, 본 연구는 벤치마크 분야 간 모델 성능 간 상관관계가 낮은 경향이 있음을 관찰하고, 이를 바탕으로 서로 약한 상관관계를 보이는 분야 군집에 대해 각각의 '전문가 모델(Expert Models)'을 식별한 후, 균일한 가중치가 아닌 최적화된 가중 평균을 통해 이를 결합한다. 실험을 통해 제안한 방법이 다국어 처리, 도구 호출, 수학 문제 해결 등 다양한 영역에서 성능과 견고성(로버스트성)을 향상시킴을 입증하였으며, 버클리 도구 호출 리더보드(Berkeley Function Calling Leaderboard)에서 최신 기준(SOTA, State-of-the-Art) 성능을 달성하였다.

AI로 AI 구축

아이디어에서 출시까지 — 무료 AI 코코딩, 즉시 사용 가능한 환경, 최적의 GPU 가격으로 AI 개발을 가속화하세요.

AI 협업 코딩

바로 사용 가능한 GPU

최적의 가격

시작하기 가격 보기

HyperAI Newsletters

최신 정보 구독하기

한국 시간 매주 월요일 오전 9시 에 이번 주의 최신 업데이트를 메일로 발송합니다

이메일 서비스 제공: MailChimp

Discord에서 논의하기

5달 전

Shalini Maiti Amar Budhiraja Bhavul Gauri Gaurav Chaurasia Anton Protopopov Alexis Audran-Reiss Michael Slater Despoina Magka Tatiana Shavrina Roberta Raileanu

초록

대규모 언어 모델(Large Language Models, LLMs)은 다양한 분야에서 놀라운 성능을 보여주고 있으나, 여전히 막대한 계산 자원과 시간이 소요되는 훈련 과정을 필요로 하며, 훈련 절차의 정교한 조율 또한 요구된다. 동일한 아키텍처를 가진 다수의 모델 가중치를 평균화하는 '모델 수프(Model Souping)' 기법은 재훈련에 드는 비용 없이 성능을 향상시킬 수 있는 유망한 사전 및 사후 훈련 기법으로 부상하고 있다. 본 논문에서는 벤치마크 구성 기반의 체계적인 접근 방식을 도입한 '분야 전문가의 수프(Soup Of Category Experts, SoCE)'를 제안한다. SoCE는 최적의 모델 후보를 식별하기 위해 벤치마크의 구성 특성을 활용하고, 성능을 극대화하기 위해 비균일 가중 평균을 적용한다. 기존의 균일 가중 평균 방식과 달리, 본 연구는 벤치마크 분야 간 모델 성능 간 상관관계가 낮은 경향이 있음을 관찰하고, 이를 바탕으로 서로 약한 상관관계를 보이는 분야 군집에 대해 각각의 '전문가 모델(Expert Models)'을 식별한 후, 균일한 가중치가 아닌 최적화된 가중 평균을 통해 이를 결합한다. 실험을 통해 제안한 방법이 다국어 처리, 도구 호출, 수학 문제 해결 등 다양한 영역에서 성능과 견고성(로버스트성)을 향상시킴을 입증하였으며, 버클리 도구 호출 리더보드(Berkeley Function Calling Leaderboard)에서 최신 기준(SOTA, State-of-the-Art) 성능을 달성하였다.

AI로 AI 구축

아이디어에서 출시까지 — 무료 AI 코코딩, 즉시 사용 가능한 환경, 최적의 GPU 가격으로 AI 개발을 가속화하세요.

AI 협업 코딩

바로 사용 가능한 GPU

최적의 가격

시작하기 가격 보기

HyperAI Newsletters

최신 정보 구독하기

한국 시간 매주 월요일 오전 9시 에 이번 주의 최신 업데이트를 메일로 발송합니다

이메일 서비스 제공: MailChimp

서퍼모델: 간단한 산술이 최첨단 LLM 성능을 여는 비결 | 문서 | HyperAI초신경