DualSG: 이중 스트림 명시적 의미 지도형 다변량 시계열 예측 프레임워크

다변량 시계열 예측(Multivariate Time Series Forecasting)은 다양한 응용 분야에서 핵심적인 역할을 수행한다. 최근 연구에서는 대규모 언어 모델(Large Language Models)을 사용하여 MTSF(Multivariate Time Series Forecasting)에 접근하여 그들의 추론 능력을 활용하려는 시도가 이루어졌다. 그러나 많은 방법들은 LLM을 종단간 예측 모듈로만 간주하여, 이는 종종 수치적 정밀도의 손실을 초래하고 LLM이 의도하지 않은 패턴을 처리하도록 강요하게 된다. 반면, 텍스트와 시계열 모달리티를 잠재 공간(latent space) 내에서 일치시키려는 접근법은 종종 일치의 어려움을 겪는다. 본 논문에서는 LLM을 독립적인 예측 모듈로 보는 대신, 이중 스트림(dual-stream) 프레임워크 내의 의미적 지침 모듈로 활용하는 방법을 제안한다. 우리는 DualSG라는 이중 스트림 프레임워크를 제안하며, 이는 명시적인 의미적 지침을 제공하는 구조를 갖는다. DualSG에서는 LLM이 기존의 전통적인 예측을 대체하는 것이 아니라, 보완하는 의미적 가이드(Semantic Guides)로 작동한다. DualSG의 일부로, 우리는 시계열 데이터의 추세 패턴을 자연어로 요약하고 LLM에게 해석 가능한 맥락을 제공하는 명시적 프롬프트 형식인 Time Series Caption을 도입한다. 이는 잠재 공간 내에서 텍스트와 시계열 간의 암시적 일치에 의존하는 대신, 명시적 문맥 제공을 통해 이루어진다. 또한, 우리는 캡션을 기반으로 한 통합 모듈을 설계하여, 변수 간의 상호작용을 명시적으로 모델링하면서 동시에 노이즈와 계산량을 줄인다. 다양한 분야에서 수집된 실제 데이터셋에 대한 실험 결과는 DualSG가 15개의 최첨단 기준 모델을 꾸준히 넘어서고 있음을 보여주며, 수치적 예측과 의미적 지침을 명시적으로 결합하는 것이 가치 있음을 입증한다.