Umarmungsgesicht Vergleichen? GitHub Models Fügt OpenAI O1/llama 3.2 Usw. Hinzu Und Neue Funktionen Unterstützen Den Direkten Vergleich Von Modellen

„Open Source kann dafür sorgen, dass mehr Menschen auf der Welt von der Entwicklung der KI profitieren und Chancen daraus ziehen können“, schrieb Zuckerberg in einem langen Artikel anlässlich der Veröffentlichung von Llama 3.1 und erläuterte darin die Bedeutung von Open Source.Tatsächlich hat die Popularität von Open Source mit der rasanten Entwicklung der KI in den letzten Jahren weiter zugenommen. Die Beiträge der Entwickler zur Open-Source-Community spiegeln nicht nur ihre persönliche technische Einstellung wider, sondern demonstrieren in gewissem Maße auch ihre Erfolge bei der Erforschung modernster Technologien.
Während dieses Prozesses erzielten auch die beiden großen Open-Source-Projekt-Hosting-Plattformen GitHub und Hugging Face ein schnelles Wachstum.
Im Jahr 2023 gab GitHub bekannt, dass die Anzahl der Plattformbenutzer 100 Millionen erreichte und damit zur weltweit größten Open-Source-Code-Hosting-Plattform wurde.GitHub brauchte 15 Jahre, um von 0 auf 100 Millionen zu wachsen.Hugging Face gab vor zwei Monaten bekannt, dass seine Benutzerbasis 5 Millionen erreicht habe.Hugging Face brauchte 8 Jahre, um diesen Sprung zu schaffen.

Heute hat Hugging Face mehr als 1,07 Millionen vorab trainierte Modelle und 234.000 Datensätze freigegeben, die Bereiche wie NLP, Computer Vision, Sprache, Zeitreihen, Biologie, bestärkendes Lernen usw. abdecken, und ist als „GitHub im Bereich des maschinellen Lernens“ bekannt.
Als aufsteigender Stern ist die Gesamtzahl der Benutzer von Hugging Face nicht so groß wie die von GitHub, aber dank der Dynamik großer Modelle und der Nutzung ebenso umfangreicher Open-Source-Ressourcen war das Wachstum in den letzten Jahren nicht aufzuhalten, was die Internetnutzer unweigerlich zu Spekulationen veranlasst: Wird Hugging Face angesichts der beschleunigten Entwicklung der KI GitHub allmählich ersetzen und zu einem bei Entwicklern beliebteren Treffpunkt werden? Wie wird GitHub als Open-Source-Projekthosting-Plattform reagieren, die früher gestartet ist und über eine stärkere Benutzerbasis verfügt?
Eine Reihe neuer Entwicklungen, die GitHub-CEO Thomas Dohmke auf dem gerade zu Ende gegangenen GitHub Universe 2024 angekündigt hat, könnten diese Frage beantworten:GitHub Models ist jetzt verfügbar,Neue Modelle wurden hinzugefügt: OpenAI o1, Meta Llama 3.2, Microsoft Phi 3.5 usw.

Benchmarking-Modell-Hub? GitHub Models bringt neue Funktionen
Wie wir alle wissen, hat sich Hugging Face zu einem globalen Open-Source-Vertriebszentrum für große Modelle entwickelt. Darüber hinaus bietet der Bereich „Spaces“ Entwicklern durch die sofort einsatzbereite Erfahrung großen Komfort. Speziell,Bereits 2020 hat Hugging Face Model Hub ins Leben gerufen.Dies ist eine offene Plattform zum Teilen von KI-Modellen.Benutzer können verschiedene NLP-Modelle hochladen, freigeben und herunterladen, was die Wiederverwendung und Erweiterung von KI-Modellen erheblich fördert und allmählich zum „GitHub für ML-Modelle“ für KI-Entwickler wird. Die Plattform verfügt derzeit über 1.076.375 Open-Source-Modelle (Stand Redaktionsschluss).
Im Gegensatz dazu war GitHub bei der Integration von Open-Source-KI-Modellen etwas langsam und hat den Bereich „GitHub Models“ erst im August dieses Jahres gestartet.Das Ziel bestand damals darin, die Entwicklungsarbeit zu vereinfachen, die Schwelle für die Entwicklung von KI-Anwendungen zu senken und jedem Entwickler mit den richtigen Tools und der richtigen Ausbildung die Möglichkeit zu geben, ein KI-Ingenieur zu werden.
Jetzt, nach 3 Monaten, ist GitHub Models offiziell geöffnet und hat eine Reihe von Updates und Upgrades durchlaufen. Entwickler können über Playgrounds, APIs und andere Methoden auf KI-Modelle zugreifen.
Zunächst die neuen Funktionen:
* Vereinfachen Sie den Bereitstellungsprozess – Mithilfe von Azure-Produktionsschlüsseln können Sie Anwendungen schnell von Entwicklungsumgebungen in Produktionsumgebungen verschieben.
* Neue Modellvoreinstellungen hinzugefügt, um Eingabeaufforderungen, Parameter und Nachrichten in Echtzeit zu speichern.
* Multimodale Supportfunktion hinzugefügt, die Bildunterstützung für Modelle mit multimodalen Fähigkeiten in Betriebsszenarien bieten kann.
* Eine Nebeneinander-Vergleichsfunktion wurde hinzugefügt, mit der Sie die Ausgabe zweier Modelle für dieselbe Eingabeaufforderung in Echtzeit vergleichen können.

Die zweite ist die Modellerweiterung durch Hinzufügen von OpenAI o1, Meta Llama 3.2, Microsoft Phi 3.5, Cohere Command R-Serie 08-2024 und A21 Jamba 1.5.Einschließlich der Originalmodelle Llama 3.1, GPT-4o, Phi 3, Mistral Large 2 und anderer Modelle stehen Entwicklern derzeit insgesamt 35 Modelle zum Ausprobieren zur Verfügung. In ähnlicher Weise bietet GitHub Benutzern auch einen Gleitpfad, wo Benutzer in Codespaces und VS Code-Entwicklerumgebungen entwickeln können.

Zusammenfassend lässt sich sagen, dass sowohl Hugging Faces Model Hub als auch GitHub Models Entwicklern eine Plattform bieten, um schnell hochmoderne Open-Source-Modelle kennenzulernen. Allerdings zielt GitHub derzeit auf das Open-Source-Basismodell großer Technologieunternehmen ab und hat andere hochwertige Modelle, die auf seiner Plattform als Open Source bereitgestellt wurden, noch nicht berücksichtigt. Im Gegensatz dazu ist Hugging Face GitHub hinsichtlich der Anzahl der Modelle und der abgedeckten Anwendungsbereiche weit überlegen.
Es ist erwähnenswert, dass zur weiteren Beschleunigung der Arbeit der Forscher,Hugging Face und arXiv „durchbrechen“ die Plattformbarrieren. Aktivieren Sie einfach die Schaltfläche „Hugging Face“ unter der Registerkarte „Code, Daten, Medien“ auf der arXiv-Seite, und Sie können mit einem Klick direkt zu den relevanten Hugging Face-Papieren, -Modellen und -Datensätzen gelangen.Dieser Schritt könnte das Wachstum der Benutzerzahl auf der Plattform weiter fördern.
Wird es, hervorgegangen aus GitHub, das GitHub der „Software 2.0“-Ära?
Es besteht kein Zweifel, dass GitHub als „Wegbereiter“ in der Open-Source-Community im Vergleich zu Hugging Face eine ziemlich große Benutzerbasis hat.Auf der GitHub Universe 2024 wurde bekannt gegeben, dass es derzeit über 100 Millionen Benutzer hat. Insbesondere in diesem Jahr haben Entwickler weltweit fast eine Milliarde Beiträge zu Open Source- und öffentlichen Repositories auf GitHub geleistet.

Auch der Blick auf die Entwicklungsgeschichte der beiden Plattformen ist voller Geschichten.
GitHub wurde 2008 von vier Programmierern gegründet: Tom Preston-Werner, Chris Wanstrath, PJ Hyett und Scott Chacon.Vielleicht lag es gerade daran, dass der Gründer ein reiner Programmierer war und keine Erfahrung in der Unternehmensführung hatte, dass GitHub 2016 einen gemeinsamen Beschwerdebrief mehrerer Personen erhielt, die sich über die chaotische Verwaltung der Plattform beschwerten. Zwei Jahre später gab Microsoft die Übernahme von GitHub für 7,5 Milliarden US-Dollar bekannt, die dem Unternehmen zusätzliche Ressourcen verschaffte und seine strategische Ausrichtung vorgab. Seitdem befindet sich GitHub in einer Phase stetiger Entwicklung.
Mittlerweile ist auch Hugging Face startklar.
Im Jahr 2016 gründete Clement Delangue zusammen mit Julien Chaumond und Thomas Wolf Hugging Face.Das Unternehmen entwickelte zunächst Konversationsroboter, kam jedoch wie viele Startups, die damals ähnliche Dinge versuchten, nie richtig in Gang. Im Jahr 2019, im ersten Jahr nach der Übernahme von GitHub durch Microsoft, erlebte Hugging Face eine Wende.
Um die NLP-Fähigkeiten (Natural Language Processing) des Chatbots zu trainieren, hat Hugging Face eine Transformers-Bibliothek auf GitHub als Open Source bereitgestellt. Dieses Open-Source-Projekt erfreute sich in der Community für maschinelles Lernen rasch großer Beliebtheit und entwickelte sich zum am schnellsten wachsenden KI-Projekt in der Geschichte von GitHub.
Im Jahr 2020 hat Hugging Face die offene KI-Modell-Sharing-Plattform Model Hub und das umfangreiche Open-Source-Datensatzverwaltungstool Datasets Library eingeführt. Im Jahr 2021 veröffentlichte Hugging Face Spaces, wodurch Benutzer KI-Modelle über Tools wie Streamlit und Gradio bereitstellen und anzeigen können.
Derzeit ist Hugging Face die am schnellsten wachsende Community und die am weitesten verbreitete Plattform für maschinelles Lernen.Clement Delangue, der damalige CEO des Unternehmens, sagte einmal in einem Interview, dass KI ein neues Paradigma für Software sei, nämlich „Software 2.0“, und diese Ansicht wurde auch von Andrej Karpathy, einem bekannten Forscher auf dem Gebiet der KI, anerkannt.
Er schrieb einmal:Traditionelle manuelle Programmierung gehört zu „Software 1.0“, und GitHub ist ein sehr erfolgreiches „Software 1.0“-Codecenter.Die Ära der „Software 2.0“ wird mit neuronalen Netzwerken programmiert und während dieses Übergangsprozesses werden Schwergewichtsplattformen wie GitHub entstehen.Hugging Face strebt danach, das GitHub der „Software 2.0“-Ära zu werden.
Ruhm und Reichtum erlangen: Ein Vergleich der Gewinnmodelle von GitHub und Hugging Face
Der Effekt von 1+1>2 wurde auf GitHub verifiziert. Nach der Übernahme durch Microsoft äußerten viele Entwickler Bedenken, ob GitHub weiterhin Open Source bleiben könne. Dies ist jedoch nicht der Fall und GitHub konzentriert sich weiterhin darauf, eine entwicklerzentrierte Plattform zu sein.
Laut einschlägigen Medienberichten betrug der jährlich wiederkehrende Umsatz (ARR) von GitHub lediglich 200 bis 300 Millionen US-Dollar, als Microsoft GitHub im Jahr 2018 übernahm. Im Jahr 2022 stieg der ARR von GitHub auf 1 Milliarde US-Dollar. Im Jahr 2023 wird der ARR von GitHub nach Branchenprognosen 1,4 Milliarden US-Dollar erreichen, die genauen Zahlen wurden von offizieller Seite jedoch nicht bekannt gegeben.
Derzeit verfügt GitHub über ein relativ vollständiges Gewinnmodell, und seine Gewinnmethoden umfassen hauptsächlich drei Typen:Abonnementpläne und kostenpflichtige Dienste, Enterprise-Dienste und Marktplatzdienste, wobei Enterprise-Dienste die größte Einnahmequelle von GitHub darstellen.
Das Gewinnmodell von Hugging Face ähnelt dem von GitHub und seine kostenpflichtigen Projekte umfassen ebenfalls drei Typen:Kostenpflichtige Mitgliedschaft, Datenhosting und Enterprise-Dienste.

Im Gegensatz zu GitHub ist Hugging Face jedoch nicht auf einen großen Baum angewiesen, sondern hauptsächlich auf externe Investitionen, sodass es möglicherweise einem Gewinndruck durch Investoren ausgesetzt ist. Vor 2021 hatte Hugging Face kein Einkommen und war vollständig darauf angewiesen, das Geld der Investoren zu „verbrennen“, um den normalen Betrieb der Community aufrechtzuerhalten. Erst nach 2021 begann Hugging Face, die Kommerzialisierung in Betracht zu ziehen und erreichte die Gewinnphase. Laut Forbes erzielte das Unternehmen im Jahr 2021 einen Umsatz von 10 Millionen US-Dollar und erzielt nun einen Jahresumsatz zwischen 30 und 50 Millionen US-Dollar.
Im Juli dieses Jahres verkündete Clement Delangue, Mitbegründer und CEO von HuggingFace, in den sozialen Netzwerken die Rentabilität der Plattform und feierte die 220 Mitglieder des Teams.

Am 23. August letzten Jahres schloss Hugging Face eine Finanzierungsrunde der Serie D in Höhe von 235 Millionen US-Dollar (derzeit ca. 1,675 Milliarden RMB) ab, mit einer Bewertung von 4,5 Milliarden US-Dollar (derzeit ca. 32,088 Milliarden RMB).Zu den Investoren zählen Google, Amazon, Nvidia, Salesforce, AMD, Intel, IBM und Qualcomm – eine hochkarätig besetzte Liste. Dies zeigt in gewissem Maße auch, dass die Branche das Entwicklungspotenzial von Hugging Face erkennt.
KI-Entwickler könnten die größten Gewinner sein
Es ist erwähnenswert, dass Hugging Face auch nicht untätig war, während GitHub seine jährliche Veranstaltung abhielt. Dessen Mitbegründer Clement Delangue kündigte in den sozialen Medien an, dass am 30. Oktober (Pacific Daylight Time) eine „Enterprise Hugging Face Hub“-Konferenz stattfinden werde, allerdings später als GitHub. Dies lässt die Leute auch fragen, wie Hugging Face dieses Mal reagieren wird.

Quellen:
1.https://originality.ai/blog/huggingface-statistics
2.https://karpathy.medium.com/software-2-0-a64152b37c35
3.https://mp.weixin.qq.com/s/0JNZPBCmLvRYHn4tcOTIrA
4.https://mp.weixin.qq.com/s/0JNZPBCmLvRYHn4tcOTIrA
5.https://www.shidaox.com/observation/440.html
6.https://github.blog/news-insights/octoverse/octoverse-2024/