AI "조류 조사", 코넬대, 딥러닝 활용해 북미 참새류 분포 분석

세계자연기금(WWF)의 통계에 따르면, 1970년부터 2016년까지 전 세계 대표종의 개체 수는 68% 감소했으며, 생물다양성은 계속해서 감소했습니다.
생물다양성을 보호하려면 현지 생태적 상황을 정확하게 분석하고 합리적인 생태 보호 정책을 수립해야 합니다. 그러나 생태학적 데이터는 너무 복잡하고 통계적 기준을 통일하기 어려워 대규모 생태학적 분석을 수행하기 어렵습니다.
최근 코넬 대학의 연구진은 딥러닝을 사용하여 900만 세트의 조류 데이터를 분석하고 북미 숲 참새의 분포 데이터를 얻었으며, 이를 통해 생태 데이터 분석의 새로운 장을 열었습니다.
저자 | 쉐차이
편집자 | 세 마리 양, 철탑
본 기사는 HyperAI WeChat 공개 플랫폼에 처음 게재되었습니다~
세계자연기금(WWF)에 따르면,1970년부터 2016년까지 전 세계적으로 4,392종 20,811개 개체군의 평균 개체수가 681% 감소했습니다., 전 세계의 생물다양성이 감소하고 있습니다.

그림 1:1970년부터 2016년까지 전 세계적으로 4,392종이 나타났습니다.20,811종의 평균 개체수 변화
생물다양성을 보호하려면 관련 지역의 종 분포에 대한 정확하고 대규모적인 분석이 필요합니다.하지만,엄청난 양의 데이터와 통일된 통계 방법의 부족으로 인해연구자들은 현재 특정 지역의 생물다양성(종 풍부도, 개체군 규모 등)과 생물학적 구성 데이터(지역 생태계에서 종의 상태)를 정확하게 계산할 수 없습니다.
전통적인 종 풍부도 통계는 모델링 및 예측을 위해 다양한 종의 분포 지도를 중첩하거나 거시생태학적 모델을 통해 직접 예측하는 것이 필요합니다. 어느 쪽이든,추론 결과는 모델의 정확도에 영향을 받습니다., 전자는 지도 정확도에도 영향을 받습니다.
그리고,이 예측 방법의 시간적 해상도는 좋지 않습니다.계절에 따른 종 분포의 변화에 대한 정확한 판단은 불가능하며, 종 간의 연관성을 연구하는 것은 더욱 불가능하여 생태 보호 정책 수립에 도움이 되지 않습니다.
딥러닝은 생물다양성에 대한 대규모 시공간적 연구를 위한 효과적인 수단을 제공합니다. 미국 코넬 대학의 연구진은 딥 추론 네트워크(DRN)와 딥 다변수 프로빗 모델(DMVP)을 결합하여 DMVP-DRNets 모델을 개발했습니다.북미의 워블러의 시간적, 공간적 분포는 9,206,241개 eBird 데이터 세트를 통해 분석되었습니다.그리고 휘파람새와 그 주변 환경, 그리고 다른 종들 사이의 연관성을 추론했습니다. 관련 결과는 "Ecology"에 게재되었습니다.

이 결과는 Ecology에 게재되었습니다.
논문 링크:
https://esajournals.onlinelibrary.wiley.com/doi/10.1002/ecy.4175
실험 절차
데이터 세트: 공변량을 포함한 eBird
연구진은 2004년 1월 1일부터 2019년 2월 2일까지 서경 170°-60°, 북위 20°-60° 사이의 eBird 데이터를 이 연구의 데이터 세트로 사용했습니다. 중복된 데이터를 제외한 후,eBird 데이터 세트는 9,206,241개입니다.각 eBird 데이터 세트에는 시간, 날짜, 위치, 관찰된 모든 조류 종이 포함됩니다.

그림 2: 긴꼬리딱새 무리의 eBird 데이터
연구자들은 또한 72개의 공변량을 도입했습니다.관찰자와 관련된 활동 상태, 관찰자 수, 관찰 시간 등 5개의 공변량을 포함합니다. 시간과 관련된 3가지 공변량은 주로 서로 다른 시간대 간의 편차를 메우는 데 사용됩니다. 고도, 해안선, 섬 등 지형과 관련된 64개 변수
모델 프레임워크:디코더 + 잠재 공간
본 연구에서는 DMVP 기반 DRN을 사용하여 데이터 분석 및 예측을 수행했습니다.이 모델은 입력 특징의 상관관계를 분석하는 3개 계층의 완전 연결 네트워크 디코더와 종 간, 종과 환경 간의 연관성을 나타내는 2개의 구조화된 잠재 공간으로 구성됩니다.

그림 3: DMVP-DRNets 모델 결과의 개략도
마지막으로, DMVP-DRNets 모델은 해석 가능한 잠재 공간을 통해 생태학적으로 관련성 있는 세 가지 결과를 출력합니다.
1. 환경 관련 특성: 다양한 환경 공변량 간의 연결과 상호 작용을 반영합니다.
2. 종 관련 특성: 잔여 상관 행렬을 통해 서로 다른 종 간의 연결을 반영합니다.
3. 생물다양성 관련 특성: 종의 풍부함과 분포와 같은 것.
모델 평가: HLR-S와의 비교
DMVP-DRNets 모델을 대규모로 사용하기 전에,연구자들은 먼저 이를 공간 가우시안 과정에 기반한 HLR-S 모델과 비교했습니다.. HLR-S는 생태학에서 여러 종의 공동 분포를 연구하는 데 가장 일반적으로 사용되는 모델 중 하나입니다.
먼저, 두 모델은 10,000개의 eBird 데이터 세트를 사용하여 훈련되었습니다. HLR-S 모델은 훈련하는 데 24시간 이상 걸리는 반면, DMVP-DRNets 모델은 1분도 걸리지 않습니다.

표 1:DMVP-DRNets 모델과 HLR-S 모델 간의 성능 비교
이후, 다양한 규모의 eBird 데이터가 분석되었습니다.DMVP-DRNets 모델은 11가지 평가 기준에서 HLR-S 모델보다 우수한 성능을 보입니다.HLR-S 모델보다 종 풍부도 보정 손실 면에서만 뒤처졌습니다.
실험 결과
유통 지역:애팔래치아 산맥
eBird 데이터를 분석한 후, DMVP-DRNets 모델은 2.9km의 공간 해상도를 출력합니다.2 북미 숲 참새의 월별 분포 지도. 북미에서 다양한 종의 워블러가 분포하는 방식은 매우 역동적이며, 매달 분포 핫스팟이 달라집니다. 월별 분포도를 중첩한 후,연구자들은 애팔래치아 산맥이 숲 참새류 종의 다양성이 가장 높은 지역이라는 것을 발견했습니다.

그림 4:북미 숲 참새류 분포도
a: 북미 전역의 숲 참새류 최대 종 풍부도 분포
b: 북미 숲참새의 주요 분포 지역
동시에 연구진은 다양한 이동 기간 동안 산림 참새의 분포가 가장 활발한 지역을 발견했습니다. 번식 전 이동 기간 동안 숲 참새는 주로 오하이오주, 웨스트버지니아주, 펜실베이니아주의 애팔래치아 산맥 근처에서 발견됩니다. 번식기 이후 북부 애팔래치아 산맥은 워블러가 가장 많이 서식하는 지역입니다.

워블러-환경:물, 땅, 계절 선호도
그림 5: 번식 전 이동 기간(a)과 번식 후 이동 기간(b) 동안의 숲 참새류 분포
또한 연구진은 DMVP-DRNets 모델을 사용하여 미국 북동부 지역의 워블러와 환경 간의 상호 작용을 분석했습니다.
첫 번째,연구자들은 다양한 휘파람새의 수생 및 육상 환경에 대한 선호도를 대략적으로 구별할 수 있었습니다.그 다음에,연구진은 다양한 종의 휘파람새가 번식기 동안 환경을 선호하는 방식이 다르다는 것을 발견했습니다.물을 좋아하는 청날개 참새, 북방 참새, 노랑목 참새는 번식기 동안 더 가까운 곳에 둥지를 틀고, 소나무 참새는 갈색머리 딱따구리, 붉은머리 딱따구리 등 소나무 숲에 서식하는 다른 종과 더 가까이 지냅니다.
다양한 참새류의 분포는 계절에 따라 달라집니다.대부분의 휘파람새는 번식 후 이동 기간 동안 무리 지어 둥지를 틀지만, 야자휘파람새는 가을 후반에 이동을 선택합니다. 소나무 참새와 노랑엉덩이흰목찌르레기는 미국 북동부에 일년 내내 서식합니다.

그림 6: 번식기 동안의 휘파람새와 환경 및 다른 종 간의 상관 관계

그림 7: 번식 후 이동 중 휘파람새와 환경 및 다른 종 간의 상관 관계
종간 협회:경쟁과 협력
휘파람새는 번식기, 비번식기, 철새기 동안 다른 종들과 다른 관계를 보인다.
번식기 동안 숲 참새는 주로 자신의 서식지를 방어하며 다른 종과의 관계는 약합니다.비슷한 서식지에 살면서도 더 공격적인 종들, 예를 들어 검은목윌슨워블러와 주황꼬리워블러 사이에도 음의 상관관계가 있습니다.
이주 기간 동안 대부분의 휘파람새는 서로 간에 그리고 숲의 다른 종들과 강력한 양의 상관관계를 보였습니다.이는 숲 참새가 붉은눈녹색뻐꾸기나 검은관박새 등 다른 종과 혼합된 이동 집단을 형성한다는 관찰 결과와 일치합니다.
이 기간 동안 휘파람새는 큰날개매, 줄무늬매, 닭매, 붉은어깨매 등의 포식자와 관계가 좋지 않았으며, 두 포식자 간의 음의 상관 계수가 높았습니다.

그림 8: 번식기(a)와 번식 후 이동기(b) 동안 휘파람새와 다른 종 간의 상관 계수
위의 결과는 다음을 보여줍니다.DMVP-DRNets 모델은 다양한 기간의 휘파람새 분포에 대한 정확한 판단을 내릴 수 있으며, 휘파람새와 환경 및 다른 종 간의 연관성을 추론하여 생태 정책을 수립하는 기반을 제공할 수 있습니다.
AI "조류 개체수 조사"
데이터 분석 외에도 데이터 수집 역시 생태학 연구의 중요한 부분입니다.식물과 달리 새는 매우 경계심이 강하고 빠르게 움직이며, 어떤 종은 작아서 정확하게 관찰하기 어렵습니다.
전통적인 방법은 먼 거리에서 새를 관찰하기 위해 망원 카메라, 고배율 망원경, 고정 카메라를 사용했습니다.이 방법은 새들을 방해하지 않으면서도 많은 인력과 물질적 자원이 필요하며, 관찰자는 생태학과 분류학에 대한 상당한 지식을 가지고 있어야 합니다.
딥 신경망을 통해AI는 효율적인 이미지 및 사운드 인식을 수행하여 조류 관찰을 위한 새로운 방법을 제공합니다.새들의 주요 활동 구역에는 오디오 및 비디오 녹화 장비가 배치되어 있습니다. 이 장비는 녹화된 데이터를 서버에 업로드한 후 AI를 통해 데이터를 분석하여 오디오와 비디오에서 정보를 추출하고 최종적으로 해당 지역의 조류 분포를 알아냅니다. 이 방법은 국가산림청과 초원청에서 공원, 습지, 생태 보호구역에서 널리 사용되었습니다.

그림 9: 황하 삼각주에 배치된 조류 스마트 모니터링 시스템
동시에 AI의 이러한 기술은 과학 연구자들의 업무 부담을 줄여줄 수도 있습니다. AI는 배경과 노이즈로 인한 간섭을 제거하고, 이미지의 특징에 초점을 맞추고, 생태학자가 판단하기 어려운 문제를 빠르게 해결할 수 있습니다.예를 들어, 아래 사진에서 새에 대한 지식이 없다면 복잡한 깃털로 인해 새끼의 수를 빠르게 파악하기 어렵습니다.

그림 10: 병아리 둥지 사진. 사진 속에 병아리가 몇 마리 있는지 알 수 있나요?
AI는 조류 활동 모니터링 및 조류 분포 분석에 널리 활용되고 있으며, 하향식 조류 연구를 위한 완벽한 시스템을 구축하고 특정 지역의 "조류 조사"를 실현하고 있습니다.저는 AI의 도움으로 우리가 생태계를 더욱 철저히 이해하고, 지역 상황에 더욱 부합하는 생태 정책을 수립하고, 지구의 생물다양성을 점진적으로 회복하고, 우리의 고향 행성을 보호할 수 있을 것이라고 믿습니다.
참조 링크:
[1]https://www.worldwildlife.org/publications/living-planet-report-2020
[2]https://phys.org/news/2023-09-ai-birds-easier.html
[3]https://www.forestry.gov.cn/main/586/20230118/094644604451331.html
본 기사는 HyperAI WeChat 공개 플랫폼에 처음 게재되었습니다~