대기 물리학 연구소에서 개발한 CoTCN 모델은 1일 SST 예측 오차를 단 0.2°C로 낮추어 전 세계 해수면 온도 예측의 정확도를 크게 향상시켰습니다.

2025년 CCF 글로벌 고성능 컴퓨팅 학술대회에서 중국과학원 대기물리학연구소의 린펑페이 연구원이 이끄는 팀은 중요한 연구 결과를 보고했습니다.이 팀은 Transformer와 CNN 프레임워크를 결합한 CoTCN 딥러닝 모델을 성공적으로 개발했습니다.단기적인 전 세계 해수면 온도 예측 분야에서 획기적인 진전이 이루어졌으며, 해양 환경 예측에 중요한 기술 지원을 제공했습니다.
HyperAI는 린펑페이 연구원의 심도 있는 발표 내용을 원문의 의도를 훼손하지 않고 편집 및 요약했습니다. 다음은 발표 내용 전문입니다.
혁신적인 아키텍처는 다중 규모 모델링 과제를 해결합니다.
해수면 온도의 변화는 대기 순환, 육지 강수량 등과 밀접한 관련이 있으며, 해상 운송 안전, 해양 어업 생태, 해양 환경 모니터링에 중요한 영향을 미칩니다.그러나 기존의 동적 예측 모델은 느린 작업 속도와 불편한 배포와 같은 문제점을 안고 있으며, 단일 아키텍처 인공지능(AI) 모델은 지역적 세부 정보 부족이나 글로벌 종속성 모델링의 어려움과 같은 한계에 직면합니다.특히 쿠로시오 해류나 걸프 스트림과 같은 활동적인 중규모 와류 영역에서 와류 활동 영역에서 기존 동적 예측 및 AI 예측의 해수면 온도 오차가 전 지구 평균보다 최소 40% 높은 것으로 나타났습니다.
* 예를 들어, 과거에 개발된 장단기 메모리(LSTM) 네트워크는 SST의 시계열 진화 특성을 효과적으로 포착하고, 기존 신경망의 기울기 소멸 문제를 극복하며, 빠르고 정확한 예측을 달성할 수 있습니다. 그러나 이 방법은 아직 물리적 설명이 부족하며, 극단적인 사건에 대한 예측은 훈련 데이터의 적용 범위에 따라 달라집니다.
도이: 10.3878/j.issn.1006-9895.2302.22128
이 연설에서는 새로 구성된 CoTCN 모델을 보고했습니다.CoTCN은 듀얼 브랜치 병렬 아키텍처를 채택합니다.이는 Transformer의 글로벌 모델링 기능과 CNN의 로컬 기능 추출 장점을 교묘하게 결합한 것입니다.
지점 1은 Swin Transformer를 기반으로 다중 스케일 기능 피라미드를 구축합니다.해상도는 720×1440에서 45×90으로 점진적으로 다운샘플링되고, 다양한 크기의 정보는 스킵 연결을 통해 통합됩니다.
브랜치 2는 공간적 연속성과 지역적 세부 정보를 유지하는 데 특화된 CNN 인코더-디코더 구조를 사용합니다.두 가지 분기는 채널 주의 메커니즘을 통해 적응적으로 융합되며, 모델은 다양한 해역과 규모에서 전역적 정보에 더 의존할지, 아니면 지역적 세부 정보에 더 의존할지를 자동으로 판단할 수 있습니다.
두 가지 분야는 CNN과 Transformer의 장점을 강조하고 예측 정확도를 높이기 위해 함께 작동합니다.

성능은 모든 면에서 기존 모델을 능가합니다.
이 연구는 1982년부터 2022년까지 40년간의 시계열을 다루는 NOAA OISST v2 전 세계 해양 데이터를 사용하여 완전히 검증되었습니다. 국내 DCU 컴퓨팅 플랫폼에서 실시한 테스트 결과, CoTCN이 ConvLSTM, ConvGRU, AFNO, PredRNN, SwinLSTM과 같은 주류 모델에 비해 상당한 이점을 보였다는 것이 입증되었습니다.
예측 정확도 측면에서 CoTCN의 1일 평균제곱근 오차(RMSE)는 약 0.2°C이며, 10일 예측의 상관계수는 0.8 이상을 유지합니다. 예측 지표를 비교했을 때, CoTCN은 평균제곱근 오차(RMSE), 평균절대오차(MAE), 상관계수(ACC), 구조적 유사성 지수(SSIM)와 같은 평가 지표에서 안정적인 성능을 보입니다. 더욱 중요한 것은, 이 모델이 복잡한 수역에서 특히 우수한 성능을 보인다는 것입니다.쿠로시오 해류, 걸프 스트림 등 와류 활동 영역의 예측 오차가 15-60%만큼 감소했습니다.반면, 열대 태평양과 대서양과 같이 비교적 고요한 해역에서는 모델의 성능이 비교적 비슷합니다.

국내 컴퓨팅 파워로 효율적인 교육 지원
본 연구는 학습 및 검증을 위해 국내 DCU만을 사용하였고, 32개의 DCU와 16GB 메모리의 단일 카드를 이용한 테스트 환경에서 다수의 주류 모델과의 비교 실험을 완료하였습니다.훈련 효율성 측면에서 CoTCN은 좋은 성과를 보였으며, 68M 매개변수 규모에서 단 5.93시간 만에 훈련을 완료했습니다.1억 6백만 개의 매개변수를 가진 AFNO 모델은 8.33시간이 소요된 반면, ConvGRU와 PredRNN 모델은 RNN 시퀀스 제한으로 인해 각각 11.28시간과 25.04시간이 소요되었습니다. 이는 CoTCN 모델의 진보된 특성을 입증할 뿐만 아니라, 단순히 매개변수 수를 늘리는 것보다 아키텍처 설계가 더욱 중요함을 보여줍니다. 또한 최첨단 과학 연구를 지원하는 데 있어 국내 고성능 컴퓨팅 플랫폼의 중요한 역할을 보여줍니다.
연구원 Lin Pengfei 소개
린펑페이는 중국과학원 대기물리연구소 연구원입니다. 그는 주로 해양 모델 개발 및 응용에 종사하고 있습니다. 그는 국내 전 지구 해양 순환 모델 LICOM과 그 결합 모델을 개발했습니다. 전 지구 해양 모델은 최대 1km의 수평 해상도를 가지고 있습니다. 그는 LICOM을 기반으로 고해상도 해양 환경 예보 시스템을 구축하고 인공지능과 결합한 지능형 동적 통합 예보 연구를 수행했습니다. 그는 국내 기후 시스템 모델을 사용하여 국내 자체 슈퍼 앙상블 시뮬레이션 실험을 수행하고 기후 시스템의 10년 간 변화에 대한 심층 연구를 수행했습니다. 그는 Nature Communications 및 Science Bulletin과 같은 저널에 제1저자 또는 교신저자로 50편 이상의 논문을 발표했습니다. 그는 국가 중점 연구개발 계획 프로젝트와 중국과학원 시범 프로젝트를 주관했으며 국가자연과학기금 통합 프로젝트 및 주요 프로젝트에 참여했습니다. 그는 중국컴퓨터학회의 2024년과 2025년 슈퍼컴퓨팅 연간 최우수 응용 프로그램을 수상했습니다. 그는 2024년 중국 10대 기상 과학기술 발전과 중국 해양 및 호수 10대 과학기술 발전에 선정되었습니다.
논문 정보:
1. 결합 변압기-CNN 네트워크: 해수면 온도 예측 정확도 향상. IEEE 지구과학 및 원격탐사 저널, 63, 1–14.
https://doi.org/10.1109/TGRS.2025.3574990
2. 단기 전 지구 해수면 온도 예측을 위한 새로운 변압기 네트워크: 에디의 중요성. 원격탐사, 17(9), 1507.
https://doi.org/10.3390/rs17091507
3. 장단기 기억 네트워크(LSTM)를 이용한 적도 태평양 해수면 온도 단기 예측. 대기과학 저널, 48(2), 745–754.
https://doi.org/10.3878/j.issn.1006-9895.2302.22128
2023년부터 2024년까지 AI4S 분야의 고품질 논문과 심층 해석 기사를 클릭 한 번으로 받아보세요⬇️
