Command Palette
Search for a command to run...
Ensemble De Données De Tâches De Raisonnement Général À Grande Échelle AM-DeepSeek-R1-Distilled-1,4M
Date
Taille
URL de publication
URL du document
AM-DeepSeek-R1-Distilled-1.4M est un ensemble de données de tâches de raisonnement général à grande échelle publié par am-team en mars 2025. Les résultats de l'article associé sont «1,4 million de données de raisonnement distillées open source pour permettre la formation de modèles linguistiques à grande échelle". L'ensemble de données contient environ 1,4 million d'entrées de données, couvrant une variété de types de questions, notamment les mathématiques, le code, les questions-réponses scientifiques et le chat général. Ces données ont été soigneusement sélectionnées, dédupliquées sémantiquement et strictement nettoyées pour garantir la haute qualité et le défi des données. Chaque entrée de l'ensemble de données contient des traces de réflexion riches, qui non seulement fournissent au modèle des exemples du processus de raisonnement, mais aident également le modèle à mieux comprendre et à générer des solutions à des tâches de raisonnement complexes. La publication de l'ensemble de données AM-DeepSeek-R1-Distilled-1.4M vise à fournir un outil puissant pour les tâches de traitement et de raisonnement du langage naturel, en particulier pour la formation et l'optimisation des capacités de raisonnement des grands modèles de langage. Il peut aider les modèles à améliorer leurs performances dans des domaines clés tels que les mathématiques, le code et la réponse aux questions scientifiques, afin qu'ils puissent mieux faire face à diverses tâches de raisonnement complexes.
Citation
Si vous trouvez notre travail utile à vos recherches, merci de nous attribuer une étoile :star: et de citer notre travail :pencil: « BibTeX » @misc{tian2025correctanswersequaldistillation, titre={Toutes les réponses correctes ne se valent pas : pourquoi votre source de distillation est importante}, author={Xiaoyu Tian et Yunjie Ji et Haotian Wang et Shuaiting Chen et Sitong Zhao et Yiping Peng et Han Zhao et Xiangang Li}, année={2025}, eprint={2505.14464}, préfixe d'archive={arXiv}, primaryClass={cs.CL}, url={https://arxiv.org/abs/2505.14464}, } @misc{ji2025amthinkingv1advancingfrontierreasoning, titre={AM-Thinking-v1 : Repousser les frontières du raisonnement à l’échelle 32B}, author={Yunjie Ji et Xiaoyu Tian et Sitong Zhao et Haotian Wang et Shuaiting Chen et Yiping Peng et Han Zhao et Xiangang Li}, année={2025}, eprint={2505.08311}, préfixe d'archive={arXiv}, primaryClass={cs.CL}, url={https://arxiv.org/abs/2505.08311}, } @misc{tian2025exploringpotentialofflinerl, titre={Exploration du potentiel de l'apprentissage par renforcement hors ligne pour le raisonnement dans les masters en droit : une étude préliminaire}, author={Xiaoyu Tian et Sitong Zhao et Haotian Wang et Shuaiting Chen et Yiping Peng et Yunjie Ji et Han Zhao et Xiangang Li}, année={2025}, eprint={2505.02142}, préfixe d'archive={arXiv}, primaryClass={cs.CL}, url={https://arxiv.org/abs/2505.02142}, } @misc{tian2025deepdistillenhancingllmreasoning, titre={DeepDistill : Amélioration des capacités de raisonnement des étudiants en droit grâce à un entraînement sur des données à grande échelle et à difficulté graduée}, author={Xiaoyu Tian et Sitong Zhao et Haotian Wang et Shuaiting Chen et Yiping Peng et Yunjie Ji et Han Zhao et Xiangang Li}, année={2025}, eprint={2504.17565}, préfixe d'archive={arXiv}, primaryClass={cs.CL}, url={https://arxiv.org/abs/2504.17565}, } @misc{wang2025leveragingreasoningmodelanswers, titre={Exploiter les réponses du modèle de raisonnement pour améliorer la capacité du modèle non-raisonnement}, author={Haotian Wang et Han Zhao et Shuaiting Chen et Xiaoyu Tian et Sitong Zhao et Yunjie Ji et Yiping Peng et Xiangang Li}, année={2025}, eprint={2504.09639}, préfixe d'archive={arXiv}, primaryClass={cs.CL}, url={https://arxiv.org/abs/2504.09639}, } @misc{ji2025difficultyawarestagedreinforcementlearning, titre={Comment l'apprentissage par renforcement progressif tenant compte de la difficulté améliore les capacités de raisonnement des étudiants en droit : une étude expérimentale préliminaire}, author={Yunjie Ji et Sitong Zhao et Xiaoyu Tian et Haotian Wang et Shuaiting Chen et Yiping Peng et Han Zhao et Xiangang Li}, année={2025}, eprint={2504.00829}, préfixe d'archive={arXiv}, primaryClass={cs.CL}, url={https://arxiv.org/abs/2504.00829}, } @misc{tian2025thinktwiceenhancingllm, titre={Réfléchir à deux fois : améliorer le raisonnement en LLM en optimisant la réflexion lors des tests à plusieurs tours}, author={Xiaoyu Tian et Sitong Zhao et Haotian Wang et Shuaiting Chen et Yunjie Ji et Yiping Peng et Han Zhao et Xiangang Li}, année={2025}, eprint={2503.19855}, préfixe d'archive={arXiv}, primaryClass={cs.CL}, url={https://arxiv.org/abs/2503.19855}, } @misc{zhao202514millionopensourcedistillé, titre={Ensemble de données de raisonnement distillé open source de 1,4 million de modèles pour optimiser l'entraînement des grands modèles de langage}, author={Han Zhao et Haotian Wang et Yiping Peng et Sitong Zhao et Xiaoyu Tian et Shuaiting Chen et Yunjie Ji et Xiangang Li}, année={2025}, eprint={2503.19633}, préfixe d'archive={arXiv}, primaryClass={cs.CL}, url={https://arxiv.org/abs/2503.19633}, } “`
Créer de l'IA avec l'IA
De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.