HyperAI
Back to Headlines

5 Tipps für die Erstellung von AI-Grundlagenmodellen

vor 4 Tagen

Viele Unternehmen beginnen gerade erst, die Auswirkungen der Künstlichen Intelligenz (KI) zu verstehen, während andere bereits seit über einem Jahrzehnt maschinelles Lernen (ML) und andere aufstrebende Technologien nutzen. Manish Jethwa, Chief Technology Officer (CTO) von Ordnance Survey (OS), dem britischen nationalen Vermessungsdienst, hat als Vorrangiges Ziel, die langjährige Erfahrung seiner Organisation im Bereich KI und ML mit aktuellen Fortschritten im Bereich der generativen KI zu kombinieren, um die riesigen Datenbestände zu verfeinern, zu verteilen und anzuwenden. Jethwa erläuterte in einem Interview mit ZDNET, wie Sprachmodelle (LLMs) dabei helfen, Nutzern von OS bei der Suche und Abfrage von Geodaten zu unterstützen. Ein wesentlicher Bestandteil ist das Erstellen von Fundamentmodellen für KI, die als Basis für spezialisierte Anwendungen dienen. 1. Entwickeln Sie einen starken Anwendungsfall Jethwa betonte, dass OS Fundamentmodelle entwickelt, um Umwelteigenschaften in einer urheberrechtsfreundlichen Weise zu extrahieren und zu analysieren. "Viele der bestehenden Modelle, die von großen Technologieunternehmen trainiert wurden, basieren auf kommerziell erhältlichen Daten," sagte er. OS profitiert von einer langen Tradition der Hochpräzisionsdatensammlung, die die KI-Entwicklung der Organisation fördert. "Wenn wir bestimmte Eigenschaften extrahieren, bauen wir die Fundamentmodelle von Grund auf auf. Das bedeutet, wir definieren den gesamten Trainingsdatensatz mit den internen, gekennzeichneten Daten, die wir haben," erklärte Jethwa. Diese Modelle können auch als Basis für Datenanalysen in anderen Bereichen verwendet werden. So könnten sie zum Beispiel Informationen über Dachmaterialien, Grünflächen oder Biodiversität liefern, ohne dass mehrere separate Modelle trainiert werden müssen. 2. Etappenweise Methoden etablieren Jethwa betonte die Bedeutung von fokussierter Ausbildung, um die Kosten beim Aufbau von Fundamentmodellen zu reduzieren. "Wir müssen sichergehen, dass wir die Modelle mit klar definierten Zielen trainieren, da der Lernaufwand viele Ressourcen verbraucht," sagte er. Die Ausführung dieser Modelle beansprucht deutlich weniger Energie und Ressourcen als der eigentliche Trainingsprozess. OS füttert seine Modelle in kleinen Portionen mit Trainingsdaten. "Das Aufbauen von Label-Daten kostet viel Zeit. Man muss Daten aus dem ganzen Land sammeln, die eine Vielzahl von Klassen umfassen, die man lernen möchte – etwa eine Mischung aus städtischen und ländlichen Gebieten," erläuterte Jethwa. Zunächst wird ein kleines Modell mit wenigen hundert Beispielen erstellt, um die Kosten zu begrenzen und sicherzustellen, dass der richtige Weg eingeschlagen wird. "Dann bauen wir langsam den gekennzeichneten Datensatz auf. Inzwischen sind wir bei Hunderttausenden gekennzeichneten Beispielen. Typischerweise werden diese Modelle mit Millionen von gekennzeichneten Datensätzen trainiert," sagte er. Trotz der geringeren Größe erzielen OS-Modelle beeindruckende Ergebnisse, da sie auf einer breiteren Palette von Bildern trainiert werden. 3. Andere LLMs für das Feinjustieren nutzen Obwohl OS eigene Fundamentmodelle entwickelt, ignoriert die Organisation bekannte große Sprachmodelle nicht, wie Jethwa betonte: "Wir bauen auf vorhandenen Modellen auf und führen das Feinjustieren unter Berücksichtigung unserer Dokumentation durch." OS nutzt die gesamte Palette kommerziell verfügbarer LLMs, einschließlich Microsoft Azure Machine Learning-Modelle, Python-basierte Tools und andere Spezialfähigkeiten. Zudem erforscht die Organisation Partnerschaften mit externen Organisationen wie IBM und anderen Technologieanbietern, um gemeinsame Lösungen für datengeführte Herausforderungen zu finden. "Es ist ein Versuch, rational zu handeln. Intern geht es darum, langsam aufzubauen und sicherzustellen, dass das angestrebte Ziel erreichbar ist und man Ressourcen nicht sinnlos verschwendet," sagte Jethwa. 4. Überlegen Sie zur Vermarktung Nun, da OS damit begonnen hat, Fundamentmodelle zu bauen und zu verfeinern, könnte es sich lohnen, diese Technologien anderen Organisationen zur Verfügung zu stellen oder sie zu verkaufen, glaubt Jethwa. Ein wichtiger Punkt dabei ist das Kronurheberrecht, eine Form des Urheberrechts, die auf Vermögensgegenstände zutrifft, die von britischen öffentlichen Sektorangestellten geschaffen wurden. "Ich denke, es wird Chancen geben, diese Fundamentmodelle im Laufe der Zeit zu teilen, aber das Kronurheberrecht macht uns vorsichtig," sagte Jethwa. "Diese Vermögensgegenstände sind wertvoll und wir müssen sicherstellen, dass sie nicht ohne Nutzen für die britischen Steuerzahler kommerzialisiert werden." Die Organisation bemüht sich, ihre Daten zu schützen, gleichzeitig aber so viel Wert wie möglich für das Vereinigte Königreich zu schaffen. 5. Den Blick auf die Zukunft gerichtet halten Jethwa glaubt, dass die Arbeit an Fundamentmodellen gezeigt hat, wie generative KI den Zugang zu tiefgreifenden Erkenntnissen erleichtern kann. "Bisher war der Zugang immer etwas außer Reichweite, wenn es darum ging, wie man die Interaktion, den Zugriff auf die Daten und die Verfeinerung der Anfragen gestaltet," sagte er. Er skizzierte, wie der Ansatz von OS in den nächsten zehn Jahren weiterentwickelt werden könnte. "Man kann sich eine Schnittstelle vorstellen, bei der ein Kartenbild dargestellt wird und man sagen kann: 'Ich interessiere mich für diesen Bereich,' und man kann hineinzoomen. Dann fragt die KI: 'Was genau suchen Sie?' Wenn man 'Schulen' sagt, fragt die KI nach den Schultypen, und man kann dieses Dialog über die Schnittstelle führen." Längssichtiger Erfolg liegt darin, APIs und Daten zu nutzen, um präzise Antworten auf Anfragen zu generieren, die auf vertrauenswürdigen Quellen basieren, einschließlich OS-Informationen und externen Quellen. "KI-Modelle sind großartig für die Aggregation und die probabilistische Sicht, aber in unserem Beispiel will man wissen, wo die tatsächlichen Schulen sind. KI muss eine echte Anfrage verarbeiten, zu einer autoritativen Quelle zurückkehren, die OS ist, und die Daten abrufen, um die Ausgabe zu liefern." Industrieexperten loben die strategische Herangehensweise von OS an die Entwicklung und Anwendung von Fundamentmodellen. Sie sehen darin ein Vorbild für andere Organisationen, die ihre eigenen KI-Modelle aufbauen möchten. Ordnance Survey hat sich seit mehr als 200 Jahren auf die genaue Vermessung und Datenverarbeitung spezialisiert und nutzt nun moderne KI-Technologien, um fortgeschrittene geografische Analysen bereitzustellen. Die Organisation zeigt, dass es möglich ist, hohe Präzision und Effizienz zu erreichen, indem man bestehende Modelle und eigene Daten kombiniert, ohne dabei die Ressourcen zu überbeanspruchen.

Related Links