Hugging Face: Open-Source-Report 2026
Die Analyse der Open-Source-KI-Landschaft im Frühjahr 2026 offenbart einen fundamentalen Wandel im Ökosystem von Hugging Face. Im Jahr 2025 verdoppelten sich die Nutzerzahlen auf elf Millionen, die Anzahl öffentlicher Modelle stieg über zwei Millionen und die Datensaätze erreichten mehr als 500.000. Dieser Anstieg markiert nicht nur wachsendes Interesse, sondern einen Paradigmenwechsel hin zu aktiver Teilhabe. Nutzer erstellen vermehrt abgeleitete Artefakte wie Fine-Tunes und Adapter, anstatt nur vorgefertigte Systeme zu konsumieren. Trotz dieses Wachstums bleibt das Ökosystem konzentriert: Fast die Hälfte der Modelle hat weniger als 200 Downloads, während die 0,01 Prozent meistdownloadeten Modelle fast die Hälfte aller Downloads ausmachen. Dennoch bilden sich spezialisierte Gemeinschaften um bestimmte Domänen, die eine nachhaltige Wertschöpfung auch bei niedriger Gesamtnutzung sicherstellen. Ein entscheidender Aspekt ist der geografische Machtwechsel. Während die USA und Großbritannien traditionell führten, hat China die Führung bei den monatlichen Downloads übernommen und stellt mit 41 Prozent die größte Download-Pluralität dar. Nach dem viralen Erfolg von DeepSeek R1 im Januar 2025 wandten sich chinesische Giganten wie Baidu, ByteDance und Tencent massiv dem Open Source zu. Baidu steigerte seine Veröffentlichungen auf dem Hub von null auf über 100 in einem Jahr. Im Gegensatz dazu dominieren US-Firmen wie Meta und Google weiterhin bei der reinen Anzahl der veröffentlichten Repositorien, während unabhängige Entwickler und kleine Kollektive weltweit von 17 auf 39 Prozent des Downloads vorgezogen sind. Die Strategie der Souveränität hat an Bedeutung gewonnen. Regierungen in Südkorea, der Schweiz und der EU fördern nationale Open-Source-Initiativen, um Abhängigkeiten von ausländischer Cloud-Infrastruktur zu verringern. Open-Weight-Modelle ermöglichen es Ländern, Systeme lokal zu fine-tunen und an nationale Rechtsrahmen anzupassen. Südkorea hat beispielsweise mit der "National Sovereign AI Initiative" heimische Unternehmen gestärkt, deren Modelle nun international konkurrenzfähig sind. Parallel dazu verschiebt sich der Fokus von reinen Sprachmodellen hin zu spezialisierten Anwendungen. Die Robotik-Community wächst exponentiell; Robotik-Datensätze sind von der viertgrößten auf die größte Kategorie aufgestiegen. Auch die wissenschaftliche Forschung nutzt zunehmend Open Source für Proteinfaltung und Wirkstoffentwicklung. Technologisch dominiert der Trend zu kleineren, effizienteren Modellen. Obwohl der Durchschnitt der Parametergröße gestiegen ist, bleiben Modelle mit ein bis neun Milliarden Parametern aufgrund von Kosten und Latenz die bevorzugte Wahl für den praktischen Einsatz. Die Nutzungsdauer neuer Modelle beträgt durchschnittlich nur sechs Wochen, weshalb kontinuierliche Updates und schnelle Iterationen entscheidend für den Erfolg sind. Die Infrastruktur entwickelt sich ebenfalls weiter; während NVIDIA weiterhin führend ist, expands die Unterstützung für AMD-Hardware und chinesische lokale Chips. Insgesamt zeigt das Ökosystem, dass Open Source der zentrale Treiber für die praktische Entwicklung, Anpassung und Bereitstellung von KI-Systemen ist, wobei die Zusammenarbeit zwischen Industrie, unabhängigen Entwicklern und staatlichen Institutionen die Zukunft prägt.
