HyperAIHyperAI

Command Palette

Search for a command to run...

DeepSeek met à jour son modèle d'IA R1 et le publie sur Hugging Face

La jeune entreprise chinoise DeepSeek a annoncé mercredi matin, via son compte WeChat, la mise à jour de son modèle d'IA de raisonnement R1. Cette nouvelle version a été publiée sur la plateforme de développement Hugging Face et est désormais disponible sous une licence MIT permissive, autorisant son utilisation commerciale. Selon le communiqué de DeepSeek, cette mise à jour mineure vise à améliorer le modèle existant. Cependant, la description détaillée de ces améliorations n’est pas encore fournie sur le dépôt Hugging Face, où seuls les fichiers de configuration et les poids internes du modèle sont disponibles. Ces « poids »—qui sont synonymes de « paramètres »—déterminent le comportement du modèle en orientant ses prédictions et décisions. L'updated R1 pèse plus de 685 milliards de paramètres, ce qui en fait un modèle particulièrement imposant. À cause de sa taille colossale, il est peu probable qu'il puisse fonctionner sur du matériel courant sans modifications techniques significatives. DeepSeek avait déjà attiré l'attention plus tôt cette année avec la sortie de son modèle R1, qui avait mis en difficulté certains modèles détenus par OpenAI. L'entreprise a depuis suscité des inquiétudes auprès de certains régulateurs américains. Ces derniers estiment que la technologie de DeepSeek représente un risque potentiel pour la sécurité nationale, notamment en raison de sa puissance et de sa capacité à rivaliser avec des technologies développées aux États-Unis. En résumé, l'actualité de DeepSeek souligne une nouvelle avancée dans le domaine des modèles d'IA de raisonnement, tout en mettant en lumière les tensions géopolitiques croissantes autour des technologies de pointe.

Liens associés