KI unterstützt Überwachung und Schutz gefährdeter Ökosysteme
Ein neuer Ansatz namens „Consensus-Driven Active Model Selection“ (CODA), entwickelt von MIT-Doktorand Justin Kay und Kollegen aus dem CSAIL-Labor und der University of Massachusetts Amherst, soll die Analyse von Biodiversitätsdaten durch künstliche Intelligenz erheblich effizienter machen. Mit über 3.500 Tierarten, die nach einer Studie der Oregon State University vom Aussterben bedroht sind, ist der Druck auf Wissenschaftler, präzise und schnelle Erkenntnisse über Wildtierpopulationen zu gewinnen, größer denn je. Kay, Forscher in der Gruppe von Sara Beery am MIT, setzt dabei auf Computer Vision und maschinelles Lernen, um beispielsweise Lachse im Nordpazifik zu überwachen – eine Schlüsselart, die Nährstoffe in Ökosysteme einbringt und die Nahrungskette stabilisiert. Die Herausforderung: In der HuggingFace-Modelle-Plattform gibt es bereits fast 1,9 Millionen vortrainierte KI-Modelle, die für diverse Aufgaben eingesetzt werden können. Doch die Auswahl des besten Modells für eine spezifische Datensammlung ist bisher zeitaufwändig und erfordert oft umfangreiche manuelle Annotationen. CODA löst dieses Problem durch eine interaktive, aktive Modellauswahl: Statt eine große Testmenge vorab zu etikettieren, leitet das System den Nutzer gezielt zu den informativsten Beispielen in den Rohdaten. So reichen oft nur 25 Annotationen aus, um das beste Modell zu identifizieren. Der Erfolg von CODA beruht auf dem Prinzip der „Weisheit der Menge“: Statt einzelne Modelle zu bewerten, nutzt es die Konsens-Prädiktionen mehrerer Modelle, um eine zuverlässige Vorhersage über die korrekten Labels zu generieren. Zudem schätzt CODA für jedes Modell eine Verwechslungsmatrix (Confusion Matrix) ab, die angibt, wie wahrscheinlich es ist, dass ein Modell ein Objekt falsch klassifiziert. Diese statistischen Beziehungen zwischen Modellen, Klassen und unlabelten Daten ermöglichen es, fundierte Entscheidungen über die nächste zu etikettierende Instanz zu treffen. Diese Methode ist besonders nützlich in der Wildtierüberwachung, wo Datensätze aus Hunderttausenden von Bildern von Wildkameras stammen. Statt Stunden damit zu verbringen, einzelne Bilder zu klassifizieren, können Forscher mit CODA schnell das geeignete Modell finden und so ihre Arbeit beschleunigen. Darüber hinaus sehen die Forscher Potenzial, das System weiterzuentwickeln – etwa durch Einbeziehung fachlicher Expertise oder durch Erweiterung auf komplexere Aufgaben wie mehrstufige Vorhersagepipelines oder die Integration ökologischer Modelle. Kay und sein Team arbeiten auch an anderen Projekten: von der Überwachung von Korallenriffen mit Drohnen über die Identifizierung einzelner Elefanten bis hin zur Fusion von Satelliten- und Bodendaten. Ein weiteres Kernproblem ist die sogenannte Domain Adaptation – wenn sich die Datenverteilung ändert, etwa durch neue Kameras, verschlechtert sich die Leistung von Modellen. Daraufhin entwickelten sie ein neues Anpassungsframework, das auch in anderen Bereichen wie autonomen Fahrzeugen und Raumfahrt Anwendung findet. Zusammenfassend betont Kay, dass künstliche Intelligenz zwar vielversprechend ist, aber ihre Entwicklung und Bewertung kritisch und im Kontext der tatsächlichen ökologischen Fragen erfolgen muss. Denn letztlich geht es nicht um präzise Bounding Boxes, sondern um Antworten auf drängende Fragen wie: Welche Arten leben hier? Wie verändern sich Ökosysteme? CODA ist ein Schritt hin zu schnelleren, intelligenteren und menschenzentrierten Lösungen für den Naturschutz.
