Discord에서 논의하기

7달 전

감독된 미세조정

다중 작업 학습

Jamison Meindl Yunsheng Tian Tony Cui Veronika Thost Zhang-Wei Hong Jie Chen Wojciech Matusik Mina Konaković Luković

초록

비용이 높고 도함수 정보를 제공하지 않는 블랙박스 함수의 전역 최적화는 극도로 높은 샘플 효율성을 요구한다. 베이지안 최적화(Bayesian Optimization, BO)와 같은 기존의 방법은 효과적일 수 있으나, 보통 각 응용 분야에 맞춰 신중한 하이퍼파라미터 조정이 필요하다. 한편, 대규모 언어 모델(Large Language Models, LLM)은 광범위한 능력을 보여주고 있으나, 최신 LLM은 여전히 연속형 블랙박스 최적화 문제를 해결하는 데 한계를 보인다. 본 연구에서는 LLM이 연속형 블랙박스 최적화 능력을 갖출 수 있도록 설계한 GPTOpt를 제안한다. 다양한 BO 하이퍼파라미터 설정에서 유도된 방대한 합성 데이터셋을 기반으로 LLM을 미세조정함으로써, GPTOpt는 LLM의 사전 학습된 지식을 활용하여 다양한 최적화 과제 간에 일반화할 수 있다. 다양한 블랙박스 최적화 벤치마크에서 GPTOpt는 기존의 최적화 기법들을 뛰어넘으며, LLM이 고도의 수치적 추론 능력을 가질 수 있음을 입증하고, 하이퍼파라미터 조정 없이도 유연하게 전역 최적화를 수행할 수 있는 프레임워크를 제시한다.

AI로 AI 구축

아이디어에서 출시까지 — 무료 AI 코코딩, 즉시 사용 가능한 환경, 최적의 GPU 가격으로 AI 개발을 가속화하세요.

AI 협업 코딩

바로 사용 가능한 GPU

최적의 가격

시작하기 가격 보기

HyperAI Newsletters

최신 정보 구독하기

한국 시간 매주 월요일 오전 9시 에 이번 주의 최신 업데이트를 메일로 발송합니다

이메일 서비스 제공: MailChimp

Discord에서 논의하기

7달 전

감독된 미세조정

다중 작업 학습

Jamison Meindl Yunsheng Tian Tony Cui Veronika Thost Zhang-Wei Hong Jie Chen Wojciech Matusik Mina Konaković Luković

초록

비용이 높고 도함수 정보를 제공하지 않는 블랙박스 함수의 전역 최적화는 극도로 높은 샘플 효율성을 요구한다. 베이지안 최적화(Bayesian Optimization, BO)와 같은 기존의 방법은 효과적일 수 있으나, 보통 각 응용 분야에 맞춰 신중한 하이퍼파라미터 조정이 필요하다. 한편, 대규모 언어 모델(Large Language Models, LLM)은 광범위한 능력을 보여주고 있으나, 최신 LLM은 여전히 연속형 블랙박스 최적화 문제를 해결하는 데 한계를 보인다. 본 연구에서는 LLM이 연속형 블랙박스 최적화 능력을 갖출 수 있도록 설계한 GPTOpt를 제안한다. 다양한 BO 하이퍼파라미터 설정에서 유도된 방대한 합성 데이터셋을 기반으로 LLM을 미세조정함으로써, GPTOpt는 LLM의 사전 학습된 지식을 활용하여 다양한 최적화 과제 간에 일반화할 수 있다. 다양한 블랙박스 최적화 벤치마크에서 GPTOpt는 기존의 최적화 기법들을 뛰어넘으며, LLM이 고도의 수치적 추론 능력을 가질 수 있음을 입증하고, 하이퍼파라미터 조정 없이도 유연하게 전역 최적화를 수행할 수 있는 프레임워크를 제시한다.

AI로 AI 구축

아이디어에서 출시까지 — 무료 AI 코코딩, 즉시 사용 가능한 환경, 최적의 GPU 가격으로 AI 개발을 가속화하세요.

AI 협업 코딩

바로 사용 가능한 GPU

최적의 가격

시작하기 가격 보기

HyperAI Newsletters

최신 정보 구독하기

한국 시간 매주 월요일 오전 9시 에 이번 주의 최신 업데이트를 메일로 발송합니다

이메일 서비스 제공: MailChimp

GPTOpt: 효율적인 LLM 기반 블랙박스 최적화를 향해 | 문서 | HyperAI초신경