Comparer Un Visage Câlin ? GitHub Models Ajoute OpenAI O1/llama 3.2, Etc., Et De Nouvelles Fonctionnalités Prennent En Charge La Comparaison Côte À Côte Des Modèles

« L'open source peut garantir que davantage de personnes dans le monde puissent bénéficier et saisir les opportunités du développement de l'IA », a écrit Zuckerberg dans un long article lors de la sortie de Llama 3.1, expliquant l'importance de l'open source.En effet, avec le développement rapide de l’IA ces dernières années, la popularité de l’open source n’a cessé de croître. Les contributions des développeurs à la communauté open source ne représentent pas seulement leurs attitudes techniques personnelles, mais démontrent également dans une certaine mesure leurs réalisations dans l'exploration des technologies de pointe.
Au cours de ce processus, les deux principales plateformes d’hébergement de projets open source, GitHub et Hugging Face, ont également connu une croissance rapide.
En 2023, GitHub a annoncé que le nombre d'utilisateurs de la plateforme a atteint 100 millions, devenant ainsi la plus grande plateforme d'hébergement de code open source au monde.Il a fallu 15 ans à GitHub pour passer de 0 à 100 millions.Hugging Face a annoncé il y a deux mois que sa base d'utilisateurs avait atteint 5 millions.Il a fallu 8 ans à Hugging Face pour faire ce saut.

Aujourd'hui, Hugging Face a partagé plus de 1,07 million de modèles pré-entraînés et 234 000 ensembles de données, couvrant des domaines tels que le PNL, la vision par ordinateur, la parole, les séries chronologiques, la biologie, l'apprentissage par renforcement, etc., et est connu comme le « GitHub dans le domaine de l'apprentissage automatique ».
En tant qu'étoile montante, le nombre total d'utilisateurs de Hugging Face n'est pas aussi important que celui de GitHub, mais profitant de l'élan des grands modèles et s'appuyant sur des ressources open source tout aussi riches, il a été imparable ces dernières années, ce qui conduit inévitablement les internautes à spéculer - face au développement accéléré de l'IA, Hugging Face remplacera-t-il progressivement GitHub et deviendra-t-il un lieu de rassemblement plus privilégié par les développeurs ? En tant que plateforme d'hébergement de projets open source qui a démarré plus tôt et qui dispose d'une base d'utilisateurs plus solide, comment GitHub réagira-t-il ?
Une série de nouveaux développements annoncés par le PDG de GitHub, Thomas Dohmke, lors du GitHub Universe 2024 qui vient de se terminer pourraient répondre à cette question :Les modèles GitHub sont désormais disponibles,De nouveaux modèles ont été ajoutés : OpenAI o1, Meta Llama 3.2, Microsoft Phi 3.5, etc.

Plateforme de modèles d'analyse comparative ? GitHub Models apporte de nouvelles fonctionnalités
Comme nous le savons tous, Hugging Face est devenu un centre mondial de distribution de modèles open source à grande échelle. De plus, l’expérience prête à l’emploi offerte par sa section Espaces offre une grande commodité aux développeurs. Spécifiquement,Dès 2020, Hugging Face a lancé Model Hub.Il s’agit d’une plateforme ouverte de partage de modèles d’IA.Les utilisateurs peuvent télécharger, partager et télécharger divers modèles NLP, ce qui favorise grandement la réutilisation et l'expansion des modèles d'IA, et devient progressivement le « GitHub des modèles ML » pour les développeurs d'IA. La plateforme compte actuellement 1 076 375 modèles open source (au moment de la mise sous presse).
En revanche, GitHub a été un peu lent à intégrer les modèles d’IA open source et n’a lancé la section Modèles GitHub qu’en août de cette année.L’objectif à l’époque était de simplifier le travail de développement, d’abaisser le seuil de développement d’applications d’IA et de permettre à chaque développeur de devenir un ingénieur en IA avec les bons outils et la bonne formation.
Maintenant, après 3 mois, GitHub Models est officiellement ouvert et a subi une série de mises à jour et de mises à niveau. Les développeurs peuvent accéder aux modèles d’IA via des terrains de jeux, des API et d’autres méthodes.
Tout d’abord, les nouvelles fonctionnalités :
* Simplifiez le processus de déploiement - À l’aide des clés de production Azure, vous pouvez rapidement déplacer des applications des environnements de développement vers les environnements de production.
* Ajout de nouveaux préréglages de modèle pour enregistrer les invites, les paramètres et les messages en temps réel.
* Fonction de support multimodal ajoutée, qui peut fournir un support d'image pour les modèles dotés de capacités multimodales dans les scénarios d'exploitation.
* Ajout d'une fonctionnalité de comparaison côte à côte qui vous permet de comparer la sortie de deux modèles pour la même invite en temps réel.

La deuxième est l'extension du modèle, ajoutant OpenAI o1, Meta Llama 3.2, Microsoft Phi 3.5, Cohere Command R series 08-2024 et A21 Jamba 1.5.En incluant les modèles originaux Llama 3.1, GPT-4o, Phi 3, Mistral Large 2 et d'autres, un total de 35 modèles sont actuellement inclus pour que les développeurs puissent les essayer. De même, GitHub fournit également aux utilisateurs un chemin de glissement, où les utilisateurs peuvent développer dans les environnements de développement Codespaces et VS Code.

En résumé, le Model Hub et les modèles GitHub de Hugging Face offrent tous deux aux développeurs une plate-forme pour expérimenter rapidement des modèles open source de pointe. Cependant, GitHub cible actuellement le modèle de base open source des grandes entreprises technologiques et n'a pas encore pris en compte d'autres modèles de haute qualité qui ont été open source sur sa plateforme. En revanche, Hugging Face est bien supérieur à GitHub en termes de nombre de modèles et de domaines d’application qu’il couvre.
Il convient de mentionner que pour accélérer davantage l’avancement des travaux des chercheurs,Hugging Face et arXiv « brisent » les barrières de la plateforme. Activez simplement le bouton Hugging Face sous l'onglet « Code, Données, Médias » sur la page arXiv, et vous pourrez accéder directement aux articles, modèles et ensembles de données Hugging Face pertinents en un seul clic.Cette initiative pourrait favoriser davantage la croissance du nombre d’utilisateurs sur sa plateforme.
Né de GitHub, deviendra-t-il le GitHub de l'ère du « Logiciel 2.0 » ?
Il ne fait aucun doute qu'en tant que « pionnier » dans la communauté open source, la base d'utilisateurs de GitHub est assez avantageuse par rapport à Hugging Face.Il a été révélé lors du GitHub Universe 2024 qu'il comptait actuellement plus de 100 millions d'utilisateurs. Cette année en particulier, les développeurs du monde entier ont apporté près d’un milliard de contributions aux référentiels open source et publics sur GitHub.

En repensant à l’histoire du développement des deux plateformes, on constate qu’elle est également riche en histoires.
GitHub a été fondé en 2008 par quatre programmeurs : Tom Preston-Werner, Chris Wanstrath, PJ Hyett et Scott Chacon.C'est peut-être précisément parce que le fondateur était un pur programmeur et manquait d'expérience en gestion d'entreprise qu'en 2016, GitHub a reçu une lettre de plainte conjointe de plusieurs personnes, se plaignant de la gestion chaotique de la plateforme. Deux ans plus tard, Microsoft a annoncé l’acquisition de GitHub pour 7,5 milliards de dollars, ce qui lui a apporté des ressources supplémentaires et déterminé son orientation stratégique. Depuis lors, GitHub est entré dans une phase de développement constant.
Pendant ce temps, Hugging Face est également prêt à partir.
En 2016, Clément Delangue fonde Hugging Face avec Julien Chaumond et Thomas Wolf.L'entreprise a initialement développé des robots conversationnels, mais comme de nombreuses startups faisant des choses similaires à l'époque, elle n'a jamais décollé. En 2019, la première année après l'acquisition de GitHub par Microsoft, Hugging Face a connu un revirement de situation.
Afin de former les capacités NLP (traitement du langage naturel) du chatbot, Hugging Face a open-source une bibliothèque Transformers sur GitHub. Ce projet open source est rapidement devenu populaire dans la communauté de l'apprentissage automatique et est devenu le projet d'IA à la croissance la plus rapide de l'histoire de GitHub.
En 2020, Hugging Face a lancé la plateforme ouverte de partage de modèles d'IA Model Hub et l'outil de gestion d'ensembles de données open source à grande échelle Datasets library. En 2021, Hugging Face a publié Spaces, permettant aux utilisateurs de déployer et d'afficher des modèles d'IA via des outils tels que Streamlit et Gradio.
Actuellement, Hugging Face est devenue la communauté à la croissance la plus rapide et la plateforme d’apprentissage automatique la plus utilisée.Clément Delangue, alors PDG de l'entreprise, a déclaré un jour dans une interview que l'IA est un nouveau paradigme pour les logiciels, à savoir le « logiciel 2.0 », et ce point de vue a également été reconnu par Andrej Karpathy, un chercheur bien connu dans le domaine de l'IA.
Il a écrit un jour :La programmation manuelle traditionnelle appartient au « Logiciel 1.0 », et GitHub est un centre de code « Logiciel 1.0 » très réussi ;L'ère du « logiciel 2.0 » sera programmée avec des réseaux neuronaux, et au cours de ce processus de transition, des plateformes lourdes telles que GitHub émergeront.Hugging Face aspire à devenir le GitHub de l'ère du « Logiciel 2.0 ».
Gagner à la fois gloire et fortune : une comparaison des modèles de profit de GitHub et Hugging Face
L'effet de 1+1>2 a été vérifié sur GitHub. Après avoir été acquis par Microsoft, de nombreux développeurs ont exprimé des inquiétudes quant à la possibilité pour GitHub de continuer à être open source. Mais ce n’est pas le cas, et GitHub reste concentré sur le fait d’être une plateforme centrée sur les développeurs.
Selon les médias concernés, lorsque Microsoft a acquis GitHub en 2018, le revenu annuel récurrent (ARR) de GitHub n'était que de 200 à 300 millions de dollars américains. En 2022, l'ARR de GitHub a atteint 1 milliard de dollars américains. En 2023, les prévisions de l'industrie concernant l'ARR de GitHub atteindraient 1,4 milliard de dollars américains, mais les chiffres précis n'ont pas été divulgués par le responsable.
À l’heure actuelle, GitHub a formé un modèle de profit relativement complet, et ses méthodes de profit comprennent principalement trois types :Plans d'abonnement et services payants, services d'entreprise et services de marché, parmi lesquels les services d'entreprise constituent la principale source de revenus de GitHub.
Le modèle de profit de Hugging Face est similaire à celui de GitHub, et ses projets rémunérés incluent également trois types :Adhésion payante, hébergement de données et services Entreprise.

Cependant, contrairement à GitHub, Hugging Face ne s'appuie pas sur un grand arbre, mais s'appuie principalement sur des investissements externes, il peut donc faire face à la pression des bénéfices de la part des investisseurs. Avant 2021, Hugging Face n'avait aucun revenu et dépendait entièrement de la « combustion » de l'argent des investisseurs pour maintenir la communauté en activité normalement. Ce n’est qu’après 2021 que Hugging Face a commencé à explorer la commercialisation et est entré dans la phase de profit. Selon Forbes, la société a réalisé un chiffre d'affaires de 10 millions de dollars en 2021 et réalise désormais un chiffre d'affaires annuel compris entre 30 et 50 millions de dollars.
En juillet de cette année, le cofondateur et PDG de HuggingFace, Clément Delangue, a annoncé la rentabilité de la plateforme sur les réseaux sociaux et a célébré les 220 membres de l'équipe.

Le 23 août de l'année dernière, Hugging Face a finalisé un tour de financement de série D de 235 millions de dollars américains (actuellement environ 1,675 milliard de RMB), avec une valorisation de 4,5 milliards de dollars américains (actuellement environ 32,088 milliards de RMB).Parmi les investisseurs figurent Google, Amazon, Nvidia, Salesforce, AMD, Intel, IBM et Qualcomm, ce qui constitue une liste prestigieuse. Cela montre également dans une certaine mesure que l’industrie reconnaît le potentiel de développement de Hugging Face.
Les développeurs d’IA pourraient devenir les plus grands gagnants
Il convient de mentionner que pendant que GitHub organisait son événement annuel, Hugging Face n'était pas non plus inactif. Son cofondateur Clément Delangue a annoncé sur les réseaux sociaux qu'il organiserait une conférence « Enterprise Hugging Face hub » le 30 octobre (heure d'été du Pacifique), mais plus tard que GitHub. Cela amène également les gens à se demander comment Hugging Face réagira cette fois-ci ?

Références :
1.https://originality.ai/blog/huggingface-statistics
2.https://karpathy.medium.com/software-2-0-a64152b37c35
3.https://mp.weixin.qq.com/s/0JNZPBCmLvRYHn4tcOTIrA
4.https://mp.weixin.qq.com/s/0JNZPBCmLvRYHn4tcOTIrA
5.https://www.shidaox.com/observation/440.html
6.https://github.blog/news-insights/octoverse/octoverse-2024/