[Sous-forum De La Conférence OSCAR Open Source Industry] Où Va Le Grand Modèle Open Source ?

Dans deux mois, ChatGPT fêtera son premier anniversaire. En tant que premier modèle d’IA en son genre, ChatGPT est comme une injection de stimulant qui transperce le système nerveux central de milliers d’industries, déclenchant une course aux armements de l’IA sans précédent dans le monde entier.
Au cours de l'année écoulée, nous avons vu GPT-3.5 évoluer vers le GPT-4 multimodal, et Google PaLM, qui prétend avoir 562 milliards de paramètres, s'est dirigé vers PaLM 2, qui a une échelle de paramètres plus petite et est plus efficace. Nous avons vu Meta ouvrir le code source de son grand modèle Llama et engendrer un certain nombre de modèles moins coûteux et à plus petite échelle, notamment Alpaca, Vicuna, Koala et Falcon. Famille d'alpagas…
En quelques mois seulement, la communauté des grands modèles open source s'est épanouie et montre des signes de concurrence avec le code source fermé, choquant même Google et le faisant craindre de ne pas avoir de « fossé ».En juillet, Meta a publié Llama 2, une version open source gratuite pour un usage commercial et dont les performances sont comparables à celles de GPT-3.5, ce qui bouleverse directement le paysage des grands modèles.Il a tué certains grands modèles à source fermée dont le niveau de développement personnel n'était pas aussi bon que Llama 2.
En conséquence, de nombreuses personnes ont crié que « le temps viendra où tout le monde aura un grand modèle d'Android ». Mais nous devrions également voir queSous l’image lumineuse du grand modèle open source, il existe également une série de défis tels que le talent, l’organisation, les données et les restrictions commerciales ;À l’étranger, il existe des modèles open source aussi puissants que Llama 2. Quand les grands modèles open source nationaux seront-ils capables de les suivre ? Où le débat entre open source et closed source mènera-t-il finalement le grand modèle ?
Auteur | Tour
Rédacteur | Sanyang
Le 21 septembre, l'Académie chinoise des technologies de l'information et de la communication et l'Association chinoise des normes de communication ont organisé conjointement Conférence de l'industrie Open Source OSCAR 2023Lors du forum « Open Source Big Model » organisé à Pékin, conjointement par Segmentfault et HyperAl,Des experts des communautés de la recherche scientifique, de l'industrie et de l'investissement se sont engagés dans des échanges et des discussions complets et multi-angles sur les « opportunités et les défis du développement de grands modèles open source ».
Les trois invités de cette table ronde sont :Wang Wei, professeur à l'École de science et d'ingénierie des données de l'Université normale de Chine de l'Est et directeur de l'Open Source Society ; Sha Jian, expert technique senior du groupe Ant ; Xu Kaiyong, directeur général adjoint d'une institution d'investissement bien connue ; et l'hôte est Wang Chenhan, fondateur et PDG d'OpenBayes Bayesian Computing.

De gauche à droite :
Modérateur : Fondateur et PDG d'OpenBayes Bayesian Computing Wang Chenhan
Professeur à l'École de science et d'ingénierie des données, Université normale de Chine orientale, directeur de l'Open Source Society Wang Wei
Expert technique senior du groupe Ant Épée de sable
Directeur général adjoint d'une institution d'investissement renommée Xu Kaiyong
Cliquez sur le lien ci-dessous pour accéder directement au forum ☟
Sans violer l’intention initiale, nous avons résumé les points saillants de cette conversation et les avons énumérés ci-dessous. Rejoignez-nous maintenant pour écouter les merveilleux points de vue des experts.
Discussion sur les dernières avancées des grands modèles open source

Depuis le lancement de ChatGPT l'année dernière jusqu'à aujourd'hui, nous avons vu la sortie de GPT-4 à l'international, le suivi de Claude Anthropic et la mise à jour rapide de la famille Llama dans la communauté open source. Un certain nombre d'entreprises modèles localisées ont émergé en Chine, et la communauté open source est également en compétition pour la beauté. Tout cela indique que le développement de grands modèles est assez rapide. Les trois enseignants présents ici sont issus respectivement du milieu de la recherche scientifique, de l’industrie et de l’investissement. Nous aimerions demander à chacun d’évaluer la situation actuelle et les tendances de développement futures dans le domaine des grands modèles sous différents angles. Q1 : Quelle est l’ampleur de l’écart entre la communauté open source globale et GPT-4 ? Existe-t-il un point de basculement où la somme des réalisations de la communauté open source dépasse le niveau le plus avancé de toute entreprise commerciale ?
Wang Wei :Les gens utilisent souvent l’open source et le closed source comme deux approches opposées.Mais je pense personnellement que ces deux approches représentent en réalité des stratégies commerciales différentes.Même les entreprises open source doivent investir d’énormes ressources. Les entreprises en retard peuvent rattraper les leaders grâce à l’open source, et les entreprises leaders peuvent également obtenir des perspectives multidimensionnelles grâce à l’open source.
Du point de vue du développement à long terme, la commercialisation est très importante. Au-delà de la commercialisation, l’open source offre d’énormes avantages si nous voulons étendre l’écosystème ou la communauté de développeurs à court terme. Depuis que Llama 2 a été rendu open source en 2023, il a non seulement attiré un grand nombre de développeurs, mais également de nombreux professionnels des chaînes d'outils, des industries et des évaluations, ce qui a mis une certaine pression sur OpenAI.
Le plus grand avantage de l’open source est qu’il permet à chacun de voir ce qu’il veut faire et comment il compte le faire.Du point de vue des écoles, l’open source offre un canal de recherche pratique aux universitaires, générant ainsi des résultats de recherche précieux, qui à leur tour favorisent le développement de la technologie open source.J’ai toujours pensé que l’open source était une bonne stratégie commerciale.
Épée de sable :Du point de vue de l’industrie, les grands modèles se sont développés rapidement au cours des deux dernières années. S'il n'y a pas de vague ou de percée technologique majeure,En fait, la structure du modèle elle-même a eu tendance à être unifiée.
Pour les entreprises commerciales, d’une part, les modèles open source sont propices à accroître leur propre influence et à accélérer l’itération technologique ; En revanche, du point de vue des effets du modèle, le modèle est davantage lié aux données de formation et aux méthodes de formation, et les entreprises à source fermée peuvent avoir de nombreuses caractéristiques uniques dans ces aspects.
Mais en regardant en arrière sur la longue histoire,Nous croyons toujours qu’aucune fermeture technologique n’entravera le progrès de l’histoire.Il ne sera finalement plus nécessaire que la technologie des entreprises à code source fermé reste cachée.
Xu Kaiyong :De l’avis de la communauté des investisseurs,L'open source rattrapera certainement le closed source, mais il est difficile d'estimer le moment précis où cela se produira.Mais je pense personnellement que l’open source pourrait rattraper le closed source dans les 2 à 3 prochaines années, car en termes de modèle lui-même, le closed source n’a pas beaucoup d’avantage en tant que premier arrivé.
Les avantages du premier arrivé se répartissent généralement en deux catégories :Par exemple, lorsque la fabrication de puces passe de 7 nanomètres à 3 nanomètres, les retardataires doivent également suivre un chemin fixe pour se développer ; mais le grand modèle lui-même ne suit pas ce chemin. Le grand modèle comprend deux aspects importants :L’un concerne les données et l’autre les méthodes de formation.
Bien que les méthodes de formation soient actuellement entre les mains d'entreprises à code source fermé avancées comme OpenAI, une fois que la communauté trouvera une meilleure solution, ou que les employés des entreprises à code source fermé quitteront et rejoindront la communauté open source, les méthodes open source gagneront rapidement en force. Par conséquent, le grand modèle lui-même ne présente pas trop de barrières en matière de premier entrant. C'est le premier point.
Le deuxième point est l’effet réseau.Par exemple, les applications d’achat groupé comptent de nombreux commerçants et utilisateurs, elles ont donc un effet de réseau. Cependant, le grand modèle lui-même ne présente pas de telles caractéristiques, de sorte que les entreprises de grands modèles à source fermée ne bénéficient pas de l'avantage de barrière des effets de réseau.
Je pense donc que l’open source surpassera certainement le closed source, mais le calendrier dépendra de l’état actuel et des progrès.
On peut constater que le domaine des grands modèles open source en Chine a montré deux directions de développement. Il s’agit de suivre les traces des grands modèles internationaux avancés. Par exemple, certaines personnes effectuent le travail de localisation de Llama. L’autre consiste à diriger des équipes comme Baichuan Intelligence pour publier leurs propres grands modèles chinois. Dans l’ensemble, le développement de grands modèles dans le domaine chinois est en plein essor, mais du point de vue de l’évaluation des données, il existe encore un certain écart entre l’activité de la communauté chinoise et celle de la communauté internationale. Q2 : Aux yeux des experts, quel est l'état d'avancement actuel de l'open source dans le domaine des grands modèles chinois ? S'agit-il de rattraper son retard sur les sources fermées ou d'apporter des contributions originales ? Quelles sont les proportions respectives ? Quelle est l’atmosphère open source en Chine dans le domaine des grands modèles ?
Wang Wei :Nous comparons souvent inconsciemment l’environnement et l’atmosphère open source de la Chine avec ceux de l’Occident.En fait, l’open source lui-même est un phénomène mondial.Cela signifie qu’il peut être consulté, diffusé et modifié partout dans le monde.
L'open source est né en Europe et aux États-Unis, et des décennies se sont écoulées depuis la construction des fondations de Linux et d'Apache. En revanche, les grandes conférences open source comme OSCAR commencent tout juste à émerger en Chine, mais malgré cela, nous avons fait de grands progrès, comme le montrent les différentes réalisations publiées chaque année dans les salles de conférence. De plus, l’attention du pays à l’open source augmente également de jour en jour, et actuellement, de plus en plus de personnes en Chine contribuent à l’open source mondial.
En outre,Le modèle chinois est une innovation unique au monde.Parce que le chinois est une langue unique et riche avec un large éventail de locuteurs. Notre création du modèle chinois n’est pas une confrontation ou une compétition, mais un reflet de la diversité culturelle. Il existe également de nombreuses évaluations et applications multilingues à l'échelle internationale, et nous avons également des cours et des projets tels que le chinois international, qui ont une large valeur d'application dans le cadre du grand modèle.
Si nous voulons évaluer l’ampleur spécifique du grand modèle chinois, je pense personnellement que nous devrions examiner les résultats finaux de l’application. La raison pour laquelle ce cycle d'AIGC déclenché par ChatGPT est si populaire est qu'il présente des avantages significatifs dans la génération de texte et de graphiques. Si le grand modèle chinois peut être mis en œuvre dans de meilleurs scénarios d’application tels que l’éducation et les échanges internationaux, alors son influence et son avancement se refléteront naturellement.
Épée de sable :Tout d’abord, en termes d’évaluation, il y avait des évaluations multilingues dans les premiers ChatGPT-4. En fait, il peut être multilingue, mais il peut être plus performant dans les langues courantes et moins performant dans les langues impopulaires.
À ce stade, la nécessité pour de nombreuses institutions chinoises de développer des modèles chinois réside dans :Du point de vue du pays et de l’entreprise, tous espèrent maîtriser les technologies de base.Même comparé à un appel direct aux services d'autres personnes, le coût plus élevé ne signifie pas nécessairement de meilleurs résultats pour le moment.
Deuxièmement, du point de vue de la communauté, l’atmosphère de l’ensemble de la communauté chinoise, y compris la communauté open source, n’est en effet pas aussi bonne que celle de l’Occident. Mais en réalité, de nombreuses fondations occidentales, dont Apache et Linux Foundation, créent désormais des succursales chinoises. Ces fondations étrangères et succursales chinoises bien connues devraient stimuler la communauté chinoise. Nous espérons réellement voir des fondations locales influentes développer leurs propres communautés.
Xu Kaiyong :Je pense qu’il y a encore un certain écart entre le grand modèle chinois et les grands modèles étrangers. Les grands modèles étrangers prennent en charge plusieurs langues, tandis que le développement national est plus lent. En outre, peu d’étudiants en Chine utilisent le modèle de la grande langue chinoise pour faire leurs devoirs, rédiger des dissertations ou résoudre des problèmes de mathématiques, mais ce phénomène est en réalité très courant à l’étranger.
Cela est dû en partie au fait que les grands modèles nationaux font parfois des erreurs et que les utilisateurs ont tendance à les taquiner davantage.Je pense donc que les grands modèles chinois ont encore un long chemin à parcourir, mais le chinois a ses propres caractéristiques linguistiques, et il existe encore de nombreuses opportunités pour la survie et le développement des grands modèles nationaux.
Désormais, en plus du grand modèle lui-même, les gens commencent à accorder de plus en plus d'attention à d'autres projets dans l'ensemble de l'écosystème de construction de grands modèles, y compris les ensembles de données, les méthodes de formation, les bases de puces, les logiciels liés aux clusters de puces et les écosystèmes logiciels liés à l'inférence. Q3 : Enseignants, prêtez-vous attention à d’autres composants d’outils ou à d’autres sociétés commerciales dans le domaine des grands modèles open source ?
Wang Wei :En plus de l'écologie,Je me concentre également sur les questions juridiques, réglementaires et de conformité.
Du point de vue de l’école, l’impact social d’une entreprise est plus important que son développement. Surtout pour les grands modèles, nous parlons souvent de questions telles que la gouvernance, la conformité et l’éthique. Les grands modèles ne sont plus une simple technologie appartenant exclusivement à une industrie. Tout le monde peut l'utiliser pour générer du texte et des images. Cependant, compte tenu de son énorme influence, il existe également des problèmes de sécurité potentiels.
Ces questions seront mises en correspondance avec des données et des outils techniques.Par exemple, la qualité des données, la confidentialité et la sécurité de votre modèle de formation nécessitent non seulement les efforts des ingénieurs, mais également le soutien solide de professionnels tels que des avocats.Construisons ensemble cette fondation. Sur cette base, nous nous concentrerons sur la couche puce, le logiciel et les autres contenus ci-dessus.
Sur le plan technique, je suis plus préoccupé par la chaîne d’outils de base.Ces chaînes d’outils n’ont peut-être pas de valeur commerciale directe comme les entreprises commerciales, et les universités auront davantage d’opportunités de faire ces choses. À l’heure actuelle, de nombreuses universités, comme l’Université Fudan, développent des logiciels de base, ce qui fait également défaut à notre pays. Bien que ces chaînes d’outils n’aient pas en elles-mêmes une grande valeur commerciale, elles constituent des éléments fondamentaux et essentiels. Par conséquent, du point de vue de l’école, nous accordons plus d’attention à ces questions de conformité éthique et à celles mentionnées précédemment.
Épée de sable :Je parlerai de son écologie et de son impact sur l'amont et l'aval des grands modèles du point de vue du logiciel et du matériel.
Il existe de nombreuses interprétations d’un grand modèle. Aux yeux des développeurs d’algorithmes, un grand modèle est un modèle d’algorithme qui résout des tâches générales. D’un point de vue technique, un grand modèle est tout simplement grand. La puissance de calcul, les données et le nombre de paramètres déterminent la limite supérieure des capacités du modèle.Mais aujourd’hui, de nombreuses études se concentrent sur l’allègement des grands modèles, non pas parce que de nombreux paramètres ne sont pas nécessaires, mais parce que les couches logicielles et matérielles ne peuvent pas suivre.
L'ensemble du cycle historique des logiciels, du matériel et des algorithmes est en fait un processus de développement en spirale qui se renforce mutuellement, mais maintenant le grand modèle a jeté la balle, et ses coûts de logiciels, en particulier de matériel, sont très élevés.
Le plus gros problème qui affecte actuellement la commercialisation des grands modèles est le coût de l’inférence.Bien que le coût de la formation soit le premier aspect, il est réalisable même si la formation est plus lente. Après tout, ce processus est hors ligne et un modèle avec des centaines de milliards d’octets peut être produit après un mois de formation. Mais le raisonnement est différent. Par exemple, si le QPS est atteint à raison d’un toutes les quelques secondes ou d’un toutes les minutes, s’il est fourni gratuitement à des milliards de personnes à travers le pays, le coût sera trop élevé. Si le service est facturé, les utilisateurs risquent d'être perdus, ce qui constitue le plus gros problème.
Actuellement, tous les partis à travers le pays travaillent d’arrache-pied pour régler ces problèmes.Au niveau du matériel,En raison de la répression exercée par les États-Unis, les cartes que nous achetons sont essentiellement des versions castrées, et les grandes entreprises étudient également l'application de cartes nationales. D’après ce que je peux voir, les différents indicateurs de puissance de calcul des cartes produites localement sont tous bons.
Logiciel:La pile logicielle basée sur l'écosystème GPU de NVIDIA, construite sur CUDA, dispose toujours d'un fossé solide, couvrant du cadre de formation de niveau supérieur à la bibliothèque d'opérateurs sous-jacente, et constitue également une énorme montagne que les fabricants de matériel nationaux doivent gravir. Toutes les grandes entreprises de matériel informatique développent leurs propres piles logicielles et adoptent différentes stratégies.
Mais du point de vue des utilisateurs et des développeurs,J'espère toujours qu'ils pourront adapter davantage leur propre écosystème au niveau du compilateur et converger vers le framework open source grand public au niveau de l'utilisateur, afin que les utilisateurs ne puissent percevoir que l'amélioration des performances.À l’heure actuelle, cette tendance semble être la tendance dominante, mais les grandes entreprises ne parviennent certainement pas à parvenir à un consensus complet en raison de leurs propres stratégies commerciales.
Du point de vue logiciel et matériel, nous avons besoin de temps et de percées technologiques pour répondre à la demande actuelle. C’est un défi, mais aussi une grande opportunité.
Xu Kaiyong :La communauté des investisseurs accorde une attention particulière à l’amont et à l’aval du modèle et des industries qui lui sont liées.
Par exempleCouche inférieure du modèle, nous examinerons certaines opportunités dans la couche infrastructure telles que les réseaux 3D et les SGBDR ; etCouche applicationNous nous concentrerons sur les opportunités dans certaines industries verticales, telles que la lecture automatique de rapports financiers et d'annonces, ou le résumé automatique dans le secteur financier, la détection de pannes dans le secteur industriel, les entreprises disposant de bases de données exclusives et les startups fournissant des modèles privés de grande taille ou de petits modèles distillés à partir de grands modèles pour résoudre un seul problème ou une série de problèmes.
Outre l’amont et l’aval des grands modèles, les investisseurs s’intéresseront également à certaines nouvelles possibilités des grands modèles ou de l’intelligence artificielle.Par exemple, j’ai également étudié récemment les domaines liés à l’open source et à l’informatique quantique, car l’intelligence artificielle traditionnelle comprend de grands modèles, dont les performances augmentent linéairement avec le coût, alors que l’informatique quantique croît de manière exponentielle.
Au cours des 10 à 12 dernières années, de nombreuses entreprises cotées au Nasdaq aux États-Unis sont nées sur la base de technologies open source (ou sur la base de sociétés mères cotées), telles qu'Apache, Mongo DB, etc. On peut constater que ces entreprises qui ont investi dans l'open source ont obtenu une bonne valeur commerciale et de bons rendements. Mais en regardant la Chine, il y a peu d’entreprises chinoises qui investissent dans l’écosystème open source, et encore moins qui sont allées jusqu’au stade de la cotation ou de la prise de tête. Q4 : Enseignants, le modèle économique de l’écosystème open source chinois a-t-il vraiment fonctionné ? Existe-t-il un business case réussi ? Si oui, les grands modèles favorisent-ils cette tendance ? Sinon, y a-t-il une chance que des modèles plus grands fassent partie de cette tendance ?
Xu Kaiyong :Il n'existe pratiquement aucune société cotée en bourse open source en Chine, mais il existe de nombreuses sociétés cotées en bourse open source à l'étranger.Je pense que la principale différence entre les résultats des listes open source en Chine et aux États-Unis réside dans le facteur talent.Les États-Unis attirent les talents du monde entier et bénéficient d’un état d’esprit ouvert et de perspectives uniques. La plupart des initiateurs de projets open source viennent de la Silicon Valley.
Il existe également de nombreux développeurs/leaders d’opinion en Chine qui participent à l’open source. Bien qu'il n'y ait pas encore eu d'entreprise cotée en bourse open source, je pense que cela est possible à l'avenir, notamment dans le domaine des grands modèles.
Actuellement, en regardant à travers le monde, seuls la Chine et les États-Unis peuvent fabriquer de grands modèles. La concurrence à laquelle nous sommes confrontés en Chine est plus directe, mais au fil des années, nous avons également formé un grand nombre de talents informatiques, et il y a de plus en plus de participants open source.Il existe donc encore une opportunité de créer une entreprise publique dans le domaine de l’open source.
Épée de sable :Il ne semble pas y avoir de projets open source très réussis répertoriés en Chine, mais il existe certainement des projets open source et des startups bien connus.
L’atmosphère dans la Silicon Valley est effectivement meilleure. Après tout, cela se développe depuis de nombreuses années. En outre, les fondations et institutions d’investissement open source étrangères disposent d’un bon mécanisme d’incubation et d’orientation pour les projets open source potentiels, y compris la collaboration communautaire et la culture commerciale. De nombreux projets excellents n’ont peut-être pas grandi de manière spontanée. Nous avons encore besoin d’un processus de rattrapage et le pays doit continuer à investir dans ces domaines, notamment dans l’éducation.
Dans cette industrie en plein essor en Chine,Si une entreprise souhaite entrer en bourse, elle doit tout d’abord disposer d’une accumulation relativement importante de technologies et, deuxièmement, elle a besoin d’un modèle économique capable de résister à l’épreuve du temps.J'ai découvert que de nombreux excellents projets open source n'ont pas encore compris comment gagner de l'argent avec leurs produits, mais c'est en fait la chose la plus importante.
Wang Wei :Je voudrais souligner trois points. Le premier est le succès commercial.J'ai toujours pensé que le succès commercial n'avait pas nécessairement de lien avec le fait qu'il soit open source ou non.Au niveau commercial, cela dépend davantage de votre besoin sur le marché et de votre capacité à répondre aux besoins des clients, tandis que l'open source est désormais davantage un gadget publicitaire.
Le deuxième point est de savoir ce que signifie l’open source des grands modèles.Le modèle open source est différent du code logiciel open source.Une fois le modèle open source, c'est une nouvelle expérience pour nous de voir ce que les développeurs et les utilisateurs peuvent faire sur cette base. Bien que le modèle open source soit un moyen de télécharger et d'utiliser des modèles, il pose également de nouveaux problèmes et il est difficile d'appliquer la définition ou le cadre open source traditionnel. Par conséquent, la manière de construire une communauté et un écosystème basés sur ce modèle est une question totalement nouvelle.
Ce qui m’importe le plus personnellement, c’est la culture des talents, et je crois que l’open source est très propice à la culture des talents.
Tout d’abord, cela permet aux étudiants d’accéder plus rapidement aux technologies les plus avancées.Après la sortie de Llama, de nombreuses universités ont immédiatement procédé à des déploiements, l'ont peaufiné et ont ajouté du contenu lié à leurs propres domaines, le tout bénéficiant de l'open source.
Deuxièmement, le modèle collaboratif open source est plus utile pour la formation des étudiants que pour la formation purement technique.Cela améliore considérablement les compétences de communication des étudiants et nous apprend à construire des relations compétitives et coopératives avec des partenaires, ce qui est exactement ce qui manque aux étudiants chinois. La Chine manque de projets open source aussi matures que ceux à l’étranger. D’une part, cela est dû à des problèmes de langue, et d’autre part, cela peut être lié aux habitudes des Chinois : nous ne sommes pas très doués pour exprimer nos opinions en public, mais dans la communauté, nous devons exprimer nos opinions sur la base de certains faits. L’open source est donc très utile pour former les étudiants dans ce domaine.
J'encourage fortement les étudiants à participer à des projets et communautés open source, en particulier aux projets open source en Chine. J’espère également que davantage d’entreprises pourront offrir davantage d’opportunités aux étudiants qui contribuent activement à la communauté.
Grand modèle open source du point de vue de la recherche scientifique, de l'industrie et de l'investissement
Les grands modèles actuels ont la capacité de générer du code et peuvent même fournir des suggestions d’architecture d’ingénierie. Les gens disent que l’IA remplacera de nombreux emplois à l’avenir, en particulier dans le domaine informatique. Le paradigme du travail pourrait subir quelques changements en raison de l’émergence de grands modèles. Q1 : Professeur Wang Wei, en tant que pionnier de l'open source et leader académique à l'Université normale de Chine orientale, que pensez-vous des changements apportés par l'IA dans le processus de développement des talents dans le domaine informatique ? Face à la tendance de plus en plus puissante des grands modèles dans le futur, quelles compétences allez-vous privilégier pour améliorer la formation des étudiants et des talents ?

Wang Wei :Nous adoptons actuellement activement l’open source. De nombreux projets, sujets et interactions de type questions-réponses dans les cours sont mis en œuvre à l'aide de référentiels GitHub. Maintenant que le grand modèle est là, notre attitude est la même.Dans la mesure où cela peut être fait avec un grand modèle, nous encourageons les étudiants à utiliser le grand modèle.Nous encourageons également les enseignants à se joindre à ces pratiques.
Pour les étudiants et les enseignants en informatique, il ne suffit pas d’utiliser de grands modèles, mais ils doivent également comprendre les principes qui les sous-tendent afin de pouvoir mieux développer des applications et des outils. Les grands mannequins remplaceront certainement certains emplois et professions à l’avenir, mais tout comme la révolution industrielle, bien que de nombreux travailleurs aient perdu leur emploi, elle a également donné naissance à de nouvelles industries et professions.C’est pourquoi nous disons aux étudiants qu’il y aura certainement davantage de nouvelles industries et de nouveaux métiers qui émergeront à l’avenir, et qu’ils doivent s’y préparer dès leurs études, et la préparation commence par l’accepter.
Deuxièmement, le rôle des entrepreneurs est également très important. Vous êtes des organisations qui créent des emplois.Après la sortie du grand modèle, de nouveaux postes tels qu'ingénieur prompteur et ingénieur de réglage sont également apparus. Il y aura de plus en plus de nouveaux postes à l’avenir.Ce sont des opportunités créées par des entrepreneurs.
Ant a réalisé de nombreux travaux dans l'écosystème open source, comme SOFA et une série de travaux open source sur les middlewares cloud-native. On peut dire que ces travaux fournissent une très bonne base écologique pour l’ensemble du support cloud natif de l’industrie. Q2 : Professeur Sha Jian, pourriez-vous s'il vous plaît présenter l'orientation future d'Ant dans le domaine des grands modèles open source ? En même temps, en tant qu'expert technique, comment évaluez-vous le travail d'Ant dans le domaine de l'open source et quelle valeur ce travail a-t-il pour l'ensemble de l'entreprise Ant ?

Sha Jian : Ant adopte l'open source.Si le projet interne est bien incubé, l’entreprise encouragera également tout le monde à passer à l’open source. L'entreprise ne dispose pas d'indicateurs commerciaux pour cela, mais vise plutôt à renforcer l'influence de la technologie et à construire l'image d'une entreprise technologique.
La gamme dans le domaine de l'IA ou des grands modèles peut être divisée en plusieurs parties :
Tout d’abord, le plus basique est l’infra, qui équivaut à un outil de production, et le tout sera open source. Désormais, la première étape de l'infrastructure de formation de l'IA peut être entièrement publiée dans DLRover, et l'ensemble de la partie raisonnement, ainsi que la virtualisation GPU, les clusters GPU et AIDC seront progressivement publiés.
Au niveau de la couche applicative, certains grands modèles officiellement annoncés peuvent ne pas être entièrement ouverts en raison de problèmes de données, mais certains grands modèles verticaux, tels que CodeFuse, sont également progressivement ouverts au code source. Aujourd’hui, de nombreuses équipes évoluent progressivement vers l’open source.
En parlant de notre propre projet DLRover, nous réfléchissons également aux raisons pour lesquelles nous devrions ouvrir le code source ? Quels sont les cas d’utilisation potentiels de ce projet ?
Certains fournisseurs de cloud comme Alibaba Cloud et Baidu Cloud doivent vendre leurs propres services, ils développent donc leurs propres applications et matériels. Cependant, il existe encore de nombreuses institutions qui disposent de beaucoup de matériel et de chercheurs, mais qui manquent d'une équipe d'infrastructure professionnelle pour utiliser ce matériel efficacement, et c'est exactement ce que DLRover espère aider.Cela équivaut à leur donner du pouvoir ou à leur fournir un ensemble complet de solutions qui ont été vérifiées dans Ant.C'est une possibilité potentielle ; il y a aussi l'utilisateur final, comme un développeur individuel qui peut exécuter l'un de nos composants séparément. Le public est donc assez large.
Nous souhaitons construire notre projet pour ces utilisateurs, mais nous n’avons pas d’objectifs quant à la manière de le commercialiser ou s’il pourra être commercialisé à l’avenir.
Selon les observations, il existe très peu de fonds chinois en RMB investissant dans des projets open source, et auparavant, les principales forces investissant dans l'open source en Chine étaient également des fonds en dollars américains. L'institution d'investissement où travaille M. Xu est un fonds RMB représentatif en Chine et a investi directement ou indirectement dans plusieurs sociétés de puces d'IA/grands modèles. Q3 : En tant que fonds avec de bonnes performances de sortie, quelles sont les réflexions de votre organisation et de votre personnel sur l'investissement dans l'open source ? Serez-vous optimiste quant à l’investissement dans des projets open source à l’avenir ? Quelle est la raison ?

Xu Kaiyong : L’open source est une force qui ne peut être ignorée dans l’industrie du logiciel.Notre société est également présente dans le domaine de l'open source et a investi dans des logiciels technologiques, des infrastructures, des bases de données, la gouvernance des données et d'autres sociétés connexes. Personnellement, je crois aux technologies de l’information, aux logiciels et à l’open source. Je suis un bénéficiaire et un promoteur de l’open source depuis que j’ai commencé à écrire du code à l’université.
La gestion de l’ensemble de notre fonds est également très ouverte. Nous soutenons fermement l’investissement dans le domaine de l’open source et continuons à prêter attention et à promouvoir la découverte de projets open source de haute qualité. Cependant, toutes les institutions d’investissement ne sont pas aussi ouvertes d’esprit. Certains investisseurs ne comprennent pas bien l’open source et pensent que l’open source signifie gratuit, ce qui augmente également le seuil d’investissement dans l’open source.
Dans le passé, l’open source était en effet principalement investi par des fonds en dollars américains, mais aujourd’hui, ces fonds ont disparu du courant dominant.Les fonds RMB doivent également reprendre le flambeau de l’investissement dans les logiciels open source.
Perspectives d'avenir
L'open source a été inscrit pour la première fois dans le « 14e plan quinquennal » du pays en 2021. Avec son excellent modèle créatif d'égalité, d'ouverture, de collaboration et de partage, il continue de devenir un moteur important pour promouvoir l'innovation en matière de technologie numérique, optimiser les modèles de production de logiciels, permettre la transformation et la modernisation des industries traditionnelles et aider les entreprises à réduire les coûts et à accroître l'efficacité.
En tant que représentants des technologies émergentes de pointe, les grands modèles sont au stade exploratoire de leur évolution.La communauté open source peut rassembler les meilleurs talents du monde et travailler ensemble pour accélérer l'itération, l'optimisation et la mise en œuvre de grands modèles, favorisant ainsi la transformation numérique et le succès commercial dans tous les secteurs avec des produits et services de haute qualité.
Dans l’ensemble, les grands modèles open source offrent des opportunités illimitées, mais sont également confrontés à de nombreux défis.À l’heure actuelle, les grands modèles nationaux se précipitent pour entrer sur le marché. Qui se démarquera dans la bataille acharnée de milliers de modèles ?Vous êtes invités à laisser vos avis dans la section commentaires.
Cet article a été publié pour la première fois par HyperIAPlateforme publique WeChat~