Google DeepMind가 최초로 주문형으로 생성된 세계 지도인 AlphaEarth Foundations를 출시했습니다.

위성 기술의 발전으로 인간은 거의 실시간으로 지구를 관측할 수 있게 되었습니다. 하지만 방대한 규모의 다중 모드 원격 탐사 데이터는 풍부한 정보를 제공하지만, 데이터 출처가 분산되어 있고, 형식이 다양하며, 사용법이 복잡하다는 새로운 과제도 안겨줍니다. 이처럼 분산된 정보를 어떻게 지구에 대한 일관되고 활용 가능한 관점으로 통합할 것인가는 과학자와 정책 입안자들이 직면한 주요 과제가 되었습니다. 구글 딥마인드(DeepMind)의 최신 버전인 알파어스 파운데이션(AlphaEarth Foundations)은 이러한 과제에 공식적으로 대응합니다. 이 모델은 "가상 위성"으로 볼 수 있습니다.PB 수준의 지구 관측 데이터를 통합하여이 혁신적인 기술은 컴퓨팅 시스템에서 효율적으로 처리할 수 있는 디지털 지구 임베딩을 생성합니다. 농업 모니터링, 환경 보호, 도시 확장, 수자원 관리와 같은 핵심 문제에 대한 전례 없는 글로벌 관점을 제공합니다.
* 논문 링크:
매우 컴팩트한 데이터로 저장 공간을 줄입니다.
AlphaEarth Foundations의 핵심 혁신은이는 원격 감지 데이터의 두 가지 핵심 문제를 해결합니다. 하나는 정보 과부하이고, 다른 하나는 데이터 불일치입니다.이를 위해 이 모델은 광학 위성 이미지, 레이더 데이터, 3D 레이저 스캐닝, 기후 시뮬레이션 등 수십 개의 공공 데이터 소스의 정보를 모아 이러한 다중 소스 데이터를 통합하고 분석하여 10m x 10m 단위로 전 세계 육지 및 해안 지역에 대한 고정밀 모델링을 수행합니다.
이 시스템의 핵심 혁신은 다른 AI 시스템에 비해 저장 공간이 1/16에 불과하여 각 칸에 대한 매우 압축적인 요약을 생성하는 기능에 있으며, 이를 통해 행성 수준 분석 비용을 크게 줄일 수 있습니다.
다시 말해, 이 모델은 최초로 "주문형 글로벌 지도 생성"을 달성했습니다. 연구자들은 특정 위성이 상공을 지나갈 때까지 기다리거나 구름 덮개와 같은 전통적인 어려움에 직면할 필요가 없습니다. AlphaEarth Foundations의 임베딩 벡터를 통해 명확하고 체계적이며 일관된 지구 지도를 즉시 얻을 수 있습니다.
모든 면에서 다른 모델보다 성능이 앞서 있습니다.
AlphaEarth Foundations의 작동 원리는 아래 그림과 같습니다. 이 시스템은 비디오 시퀀스에서 불균일하게 샘플링된 프레임을 추출하여 특정 시점을 색인화합니다. 이를 통해 모델은 방대한 측정 데이터를 해석하는 동시에 해당 위치에 대한 연속적인 뷰를 구성할 수 있습니다.

연구팀은 AlphaEarth Foundations의 성능을 검증하기 위해 엄격한 비교 테스트를 수행했습니다. 실험 결과, 이 모델은 토지 이용 식별이나 지표 속성 추정 등 다양한 기간과 작업에서 우수한 성능을 보였습니다. 특히, AlphaEarth Foundations는 레이블이 지정된 데이터가 없는 상황에서도 뛰어난 학습 효율을 보였습니다.평균 오류율은 다른 모델보다 24% 낮습니다.
이러한 장점은 이 시스템을 과학 연구 및 공공 서비스 분야에서 대체 불가능한 도구로 만듭니다. 예를 들어, 에콰도르에서 이 모델은 다년생 구름층을 투과하여 다양한 농경지의 개발 단계를 세밀하게 묘사할 수 있습니다. 남극 대륙에서는 위성 영상 빈도가 매우 낮은 지역에서도 이 모델은 지표 구조를 안정적으로 복원할 수 있습니다. 캐나다에서는 육안으로 볼 수 있는 것보다 훨씬 더 세부적으로 농지 이용의 차이를 묘사할 수 있습니다.

각 임베딩에는 64차원 구의 좌표에 해당하는 64개의 구성 요소가 포함되어 있습니다.
현재 사용 가능한 가장 큰 AI Earth 임베딩 데이터 세트 중 하나
더 폭넓은 도입을 촉진하기 위해 Google은 AlphaEarth Foundations에서 Google Earth Engine 플랫폼에 생성한 연간 임베딩 벡터 컬렉션을 "위성 임베딩 데이터세트"로 공개했습니다. 이 데이터세트는 매년 전 세계적으로 1조 4천억 개 이상의 임베딩 지점을 포괄하며, 현재 이용 가능한 가장 큰 규모의 AI Earth 임베딩 데이터세트 중 하나입니다.
지난 한 해 동안 학계, 정부, 비영리 단체를 포함한 50개 이상의 기관이 이 데이터 세트를 시범 운영했습니다. 대표적인 사례인 지구 생태계 지도(Global Ecosystems Atlas)는 세계 생태계에 대한 최초의 체계적인 분류 자료를 구축하는 것을 목표로 합니다. AlphaEarth 데이터를 활용하여 이전에는 분류되지 않았던 생태 지역을 "해안 관목지"와 "초건조 사막"과 같은 범주로 성공적으로 분류하여 각국이 보존 및 복원 노력을 최적화할 수 있는 과학적 근거를 제공했습니다.
제임스쿡 대학의 글로벌 생태학 연구소 소장인 닉 머레이는 "이 데이터 세트는 지도에 표시되지 않은 생태계에 대한 우리의 이해에 혁명을 일으키고 있으며, 보호 구역의 우선순위를 정하는 데 매우 중요합니다."라고 말했습니다.
브라질의 환경 단체 MapBiomas는 이 데이터 세트를 활용하여 특히 아마존과 같은 주요 생태 지역의 농지 이용과 환경 변화를 심층적으로 조사하고 있습니다. 프로젝트 설립자인 타소 아제베두는 "이 도구를 통해 지도 제작의 정확도, 속도, 그리고 적용 범위가 비약적으로 향상되었습니다. 이전에는 불가능했던 일들을 할 수 있게 되었습니다."라고 말했습니다.
앞으로 이 기술은 정적 지도뿐만 아니라 실시간 재난 경보, 기후 변화 시뮬레이션, 식량 안보 관리 및 기타 글로벌 이슈에도 활용될 수 있습니다. Google은 또한 모델을 지속적으로 최적화하고 데이터셋 크기와 적용 범위를 확장할 것이라고 밝혔습니다.