HyperAI초신경

UMass는 컴퓨터 모델링과 eBird 데이터 세트를 사용하여 조류 이동을 성공적으로 예측했습니다.

特色图像

새의 이주는 매혹적인 자연 현상이다.전 세계 조류 종의 약 5분의 1이 번식과 월동을 위해 정기적으로 이동하는 것으로 알려져 있습니다. 생태학에서 조류의 이동 경로와 같은 생태 법칙을 연구하는 것은 멸종 위기에 처한 조류 종을 보호하고, 생태적 균형을 유지하고, 전염병 확산을 예방하는 데 매우 중요합니다.

최근 몇 년 동안 지구 기후 변화와 인간 활동 등의 요인으로 인해 조류 이동을 예측하는 것이 점점 더 어려워졌습니다. 최근 매사추세츠 대학교 애머스트 캠퍼스 대학원생인 미구엘 푸엔테스와 코넬 대학교의 벤자민 M. 반 도렌은 Methods in Ecology and Evolution 저널에 새로운 확률적 모델인 BirdFlow를 발표했습니다.이 모델은 컴퓨터 모델링과 eBird 데이터 세트를 사용하여 철새의 비행 경로를 정확하게 예측합니다.

본 연구 결과는 Methods in Ecology and Evolution에 게재되었습니다.

서류 주소:

https://besjournals.onlinelibrary.wiley.com/doi/full/10.1111/2041-210X.14052

연구자들은 eBird Status & Trends 프로젝트에서 생성된 상대적 풍부도 추정치를 사용하여 조류 이동을 시뮬레이션했지만, 문제가 하나 있었습니다. 과거의 상대적 풍부도 정보는 주별 새들의 위치 범위만 보여줄 수 있고, 개별 개체를 추적할 수는 없습니다. 따라서 본 연구에서 연구진은 이 문제를 해결하는 데 집중했습니다.주요 프로세스는 아래 그림과 같습니다.

그림 1: 데이터 준비 및 모델링 프로세스

* 데이터 전처리: 상대적 풍부도 추정치를 전처리하여 주간 인구 분포를 생성합니다.

* 손실 함수: 주간 분포와 에너지 비용 대리 변수를 사용하여 잠재적 모델을 평가하는 손실 함수를 지정합니다.

* 모델 구조: 모델 구조를 선택하세요.

* 훈련된 모델: 수치적 프로세스를 통해 손실 함수를 최적화하여 최상의 모델 매개변수를 선택합니다.

* 검증: 훈련된 모델의 유효성을 검증하기 위해 실제 새의 평균 로그 가능도와 PIT 값을 계산합니다.

BirdFlow 모델링 개요

연구자들은 사용합니다 ebird R은 eBird Status & Trends에서 11종의 조류에 대한 상대적 풍부도 추정치를 다운로드했습니다.그리고 이 11종의 조류에 대한 GPS나 위성 추적 데이터를 이용할 수 있었습니다.

eBird 현황 및 추세:

https://science.ebird.org/zh-CN/status-and-trends

표 1: 사용된 11종 조류의 GPS 추적 데이터

다음으로 연구자들은 손실 함수를 정의했습니다.손실 함수는 eBird Status & Trends에서 파생된 주간 인구 분포, 위치 간 새 이동의 에너지 비용, 엔트로피 정규화 항목을 기반으로 합니다.

손실 함수를 최적화하기 전에 모델 구조를 지정해야 합니다. 이 연구에서 연구자들은 최적화 과정을 마르코프 체인에서만 검색하는 것으로 제한하는 것이 합리적임을 증명했습니다. 그래서 그들은 새들의 움직임을 마르코프 모델로 모델링하고 최적화했습니다.마르코프 체인 매개변수화 및 최적화 알고리즘을 사용합니다.

위의 단계를 거쳐 연구자들은 훈련된 모델을 얻었습니다.그리고 관련 검증이 수행되었습니다.

BirdFlow 검증 프로세스

검증 과정은 세 부분으로 나뉩니다.하이퍼파라미터 그리드 탐색, 엔트로피 보정, k-주 예측,구체적인 과정과 시험 결과는 다음과 같습니다.

하이퍼파라미터 그리드 검색 

연구자들은 모델의 타당성을 검증하기 위해 하이퍼매개변수 그리드 검색을 수행하고 검색 결과를 사용하여 두 가지 질문을 연구했습니다.

먼저, 연구자들은 절제 연구를 실시했습니다.엔트로피 정규화 항목과 거리 지수가 모델 품질에 미치는 영향을 살펴보았습니다.절제 연구의 결과는 아래 그림에 나와 있습니다. 모든 BirdFlow 모델이 조류의 상대적 풍부함만을 포함하는 기준 모델보다 더 나은 성과를 보이는 것을 확인할 수 있습니다.

그림 2: 모델 유형 절제 연구

두번째,연구자들은 두 가지 초매개변수 선택 방법을 사용하여 초매개변수 선택에 대한 모델의 민감도를 탐구했습니다.결과는 아래 그림과 같습니다. 대부분의 조류 종의 경우, 다른 조류 종의 검증 추적 데이터를 사용하여 선택된 LOO 매개변수를 사용하는 모델은 조정된 매개변수(해당 조류 종의 검증 추적 데이터를 사용)를 사용하는 모델만큼 좋은 성능을 보입니다. 성과는 1주일 전환의 평균 로그 우도로 측정됩니다.

그림 3: 매개변수 민감도

엔트로피 보정 

아래 그림은 엔트로피 정규화가 모델 보정에 미치는 영향을 보여줍니다.다양한 엔트로피 가중치에서 미국 우드콕 모델의 5가지 버전에 대한 무작위 확률 적분 변환(PIT) 히스토그램은 훈련된 모델이 일주일 동안 미국 우드콕의 동서 위치를 어떻게 예측하는지 보여줍니다.

보시다시피 히스토그램은 거의 일관성을 유지하며, 이는 모델이 잘 보정되었음을 나타냅니다.

그림 4: 모델 교정에 대한 엔트로피 정규화의 효과

주당 예보 

그림 5와 6은 다양한 예측 시점(주 단위)에서의 모델 성능을 보여줍니다. 연구자들은 하이퍼파라미터 그리드 검색을 통해 가장 성능이 좋은 모델을 식별하고 1주에서 17주까지의 기간에 걸쳐 이를 평가했습니다.이 최적 모델이 기준 모델과 비교해서 어떤 성능을 보이는지 보여줍니다.

그림 5(a)는 각 조류 유형에 대한 결과를 보여줍니다.시간이 지남에 따라 각 새에 대한 최적 모델의 성능이 기준 모델에 점점 더 가까워지는 것을 볼 수 있습니다.그림 5(b)는 Woodcock-tuned 모델, LOO 모델 및 기준 모델 간의 갭 비교를 보여줍니다.예측 기간 동안 튜닝된 모델과 LOO 모델의 성능이 기준 모델보다 우수한 것을 확인할 수 있습니다.

그림 5: 예측 성능 그래프
그림 6: 작은 송충이 모델의 추론 결과

연구자들은 위 실험을 통해 BirdFlow가 eBird의 주간 상대 풍부도 추정치를 사용하여 개별 새의 이동 경로를 정확하게 추론할 수 있음을 발견했으며 그 결과는 다음과 같습니다.BirdFlow는 기준 모델보다 훨씬 더 나은 결과를 예측합니다.

연구진은 이 결과를 바탕으로 새의 이동이라는 자연 현상을 연구하는 것 외에도BirdFlow 모델은 다른 현상을 연구하는 데에도 사용될 수 있습니다.예를 들어, 새들의 중간기착 행동과 지구 변화에 대한 반응입니다.

그러나 BirdFlow 모델의 성과에도 불구하고 북미와 유럽의 일부 연구자들은 조류 관찰이 데이터를 수집하는 엄격한 방법이 아니라고 주장하며 eBird 데이터베이스 사용에 의문을 제기했습니다. 이와 관련해 BirdFlow 연구원들은 다음과 같이 말했습니다.팀은 더 많은 데이터를 통합하는 것을 고려하고 있습니다.예를 들어, 새의 위치를 추적하는 위성이나 GPS 데이터 등이 있습니다.

AI가 자연의 수호자가 될 수도

BirdFlow 모델의 등장은 인간이 조류 이동과 관련된 연구에서 머신 러닝을 활용할 수 있는 지름길을 열었다는 것을 의미합니다. 아직 초기 단계이고 자연보호와 같은 실제 응용 분야에 적용되기까지는 아직 갈 길이 멀지만, 이 연구는 의심할 여지 없이 중요한 추세를 보여줍니다.AI는 자연보호 분야에서 널리 활용되고 있습니다.

카네기 멜론 대학의 연구자들이 개발한 PAWS는 경찰이 밀렵꾼을 추적할 수 있는 순찰 경로를 생성할 수 있습니다. 코넬 대학에서 개발한 멀린은 새의 노래와 이미지를 기반으로 종을 식별할 수 있습니다. Resolve가 개발한 TrailGuard AI는 밀렵으로 의심되는 사람의 이미지를 식별하고 경보를 발령하여 야생 동물을 보호할 수 있습니다.

자연 생태계가 인간에게 중요하다는 것은 자명한 사실이며, 생태계를 보호하는 것은 시급한 일입니다. 시간이 지나면서,AI는 어떤 새로운 역할을 할 것인가?누구나 자유롭게 생각하고 댓글로 토론할 수 있습니다.