KI bewertet Daten nicht nach subjektivem Geschmack
Die Entwickler der virtuellen Laufplattform In the Long Run haben erfolgreich ein System zur automatischen Generierung und Einblendung von Sehenswürdigkeiten entlang internationaler Laufstrecken implementiert. Ziel war die Anreicherung der interaktiven Karten der App mit geografisch relevanten Points of Interest, um Läufer langfristig zu motivieren und die Erkundung fremder Regionen zu unterstützen. Für die Datenaufbereitung wurde auf die lizenzierte GeoNames-Datenbank zurückgegriffen. Der technische Workflow nutzt Python in Kombination mit Apache Parquet als Speicherformat und DuckDB als Abfrageschicht. Nach einer Vorfilterung nach Kategorien wie Naturparks, historischen Stätten und Bergen sowie einer Distanzprüfung zu den konkreten Routenkoordinaten verblieben etwa 725.000 relevante Einträge weltweit. Um die Relevanz zu steigern, wurden Wikipedia-Links und Wikidata-Einträge als Proxies für internationale Bekanntheit integriert. Ein zentraler Schritt bestand in der Anbindung des LLM Anthropic Haiku zur Generierung von Bewertungen. Der ursprüngliche Plan, das Modell auch für die Erstellung von Beschreibungen zu nutzen, wurde aufgrund von Halluzinationen bei Ortszuordnungen und Fakten wie Bevölkerungszahlen verworfen. Stattdessen wird die KI nun ausschließlich zur Berechnung eines subjektiven Interessensindex eingesetzt, der zusammen mit Wikipedia-Zählern in die finale Gewichtung einfließt. Für die textlichen Darstellungen greift das System weiterhin auf lizenzkonforme Wikipedia-Zusammenfassungen zurück. Bei der Routenvalidierung zeigten sich erhebliche Verzerrungen im Datensatz. Der Fokus auf englischsprachige Wikipedia-Einträge führte dazu, dass stark besiedelte Regionen überproportional dargestellt wurden. Um diesem Bias zu begegnen, wurden streckenspezifische Parameter eingeführt. Diese ermöglichen dynamische Filterungen nach Bevölkerungsdichte, Gewichtungen zwischen objektiven Bekanntheitswerten und dem KI-Rating sowie räumliche Verteilungsalgorithmen, die Sehenswürdigkeiten gleichmäßiger über Stadt- und Länderräume verteilen. Der Entwicklungsprozess unterstreicht die aktuelle Limitierung generativer KI bei qualitativen Daten. Während Automatisierung und Skalierung verbessert wurden, bleibt die finale Auswertung von Sehenswürdigkeiten subjektiv. Für kulturelle oder ästhetische Relevanz existieren keine objektiven Validierungsmetriken. Die Lösung erfordert weiterhin manuelle Feinanpassungen. Die Version 1 des Features ist ab sofort für ausgewählte Strecken auf InTheLongRun.app aktiv. Das Projekt demonstriert einen pragmatischen Ansatz zur Integration von KI in Datenpipelines. Die Technologie dient hier nicht als Allheilmittel, sondern als ergänzendes Werkzeug innerhalb eines klar strukturierten Datenverarbeitungswerkzeugs, das Robustheit und faktische Korrektheit priorisiert.
