Command Palette
Search for a command to run...
AM-DeepSeek-R1-Distilled-1.4M Großer Datensatz Für Allgemeine Denkaufgaben
Datum
Größe
Veröffentlichungs-URL
Paper-URL
AM-DeepSeek-R1-Distilled-1.4M ist ein umfangreicher Datensatz für allgemeine Denkaufgaben, der im März 2025 vom am-team veröffentlicht wurde. Die zugehörigen Ergebnisse sind:1,4 Millionen Open-Source-Datensätze zum destillierten Schlussfolgern ermöglichen das Training großer Sprachmodelle". Der Datensatz enthält ungefähr 1,4 Millionen Dateneinträge und decken eine Vielzahl von Fragetypen ab, darunter Mathematik, Code, wissenschaftliche Fragen und Antworten und allgemeiner Chat. Diese Daten wurden sorgfältig ausgewählt, semantisch dedupliziert und streng bereinigt, um die hohe Qualität und Relevanz der Daten sicherzustellen. Jeder Eintrag im Datensatz enthält ausführliche Denkspuren, die dem Modell nicht nur Beispiele für den Denkprozess liefern, sondern dem Modell auch dabei helfen, komplexe Denkaufgaben besser zu verstehen und Lösungen dafür zu generieren. Die Veröffentlichung des AM-DeepSeek-R1-Distilled-1.4M-Datensatzes soll ein leistungsstarkes Tool für die Verarbeitung natürlicher Sprache und Schlussfolgerungsaufgaben bereitstellen, insbesondere für das Trainieren und Optimieren der Schlussfolgerungsfähigkeiten großer Sprachmodelle. Es kann Modellen dabei helfen, ihre Leistung in Schlüsselbereichen wie Mathematik, Code und Beantwortung wissenschaftlicher Fragen zu verbessern, sodass sie verschiedene komplexe Denkaufgaben besser bewältigen können.
Zitat
Wenn Ihnen unsere Arbeit für Ihre Forschung hilfreich ist, geben Sie uns bitte einen Stern :star: und zitieren Sie unsere Arbeit :pencil:
„BibTeX @misc{tian2025correctanswersequaldistillation, Titel={Nicht alle richtigen Antworten sind gleichwertig: Warum Ihre Destillationsquelle wichtig ist}, Autor={Xiaoyu Tian und Yunjie Ji und Haotian Wang und Shuaiting Chen und Sitong Zhao und Yiping Peng und Han Zhao und Xiangang Li}, Jahr={2025}, eprint={2505.14464}, archivePrefix={arXiv}, primaryClass={cs.CL}, url={https://arxiv.org/abs/2505.14464}, } @misc{ji2025amthinkingv1advancingfrontierreasoning, Titel={AM-Thinking-v1: Die Grenzen des logischen Denkens im Maßstab 32B erweitern}, Autor={Yunjie Ji und Xiaoyu Tian und Sitong Zhao und Haotian Wang und Shuaiting Chen und Yiping Peng und Han Zhao und Xiangang Li}, Jahr={2025}, eprint={2505.08311}, archivePrefix={arXiv}, primaryClass={cs.CL}, url={https://arxiv.org/abs/2505.08311}, } @misc{tian2025exploringpotentialofflinerl, title={Exploring the Potential of Offline RL for Reasoning in LLMs: A Preliminary Study}, Autor={Xiaoyu Tian und Sitong Zhao und Haotian Wang und Shuaiting Chen und Yiping Peng und Yunjie Ji und Han Zhao und Xiangang Li}, Jahr={2025}, eprint={2505.02142}, archivePrefix={arXiv}, primaryClass={cs.CL}, url={https://arxiv.org/abs/2505.02142}, } @misc{tian2025deepdistillenhancingllmreasoning, Titel={DeepDistill: Verbesserung der logischen Fähigkeiten von LLM-Studenten durch groß angelegtes, nach Schwierigkeitsgrad abgestuftes Datentraining}, Autor={Xiaoyu Tian und Sitong Zhao und Haotian Wang und Shuaiting Chen und Yiping Peng und Yunjie Ji und Han Zhao und Xiangang Li}, Jahr={2025}, eprint={2504.17565}, archivePrefix={arXiv}, primaryClass={cs.CL}, url={https://arxiv.org/abs/2504.17565}, } @misc{wang2025leveragingreasoningmodelanswers, title={Nutzung von Antworten aus dem Reasoning-Modell zur Verbesserung der Leistungsfähigkeit des Non-Reasoning-Modells}, Autor={Haotian Wang und Han Zhao und Shuaiting Chen und Xiaoyu Tian und Sitong Zhao und Yunjie Ji und Yiping Peng und Xiangang Li}, Jahr={2025}, eprint={2504.09639}, archivePrefix={arXiv}, primaryClass={cs.CL}, url={https://arxiv.org/abs/2504.09639}, } @misc{ji2025difficultyawarestagedreinforcementlearning, title={Wie schwierigkeitsbewusstes, stufenweises Reinforcement Learning die Denkfähigkeiten von LLMs verbessert: Eine vorläufige experimentelle Studie}, Autor={Yunjie Ji und Sitong Zhao und Xiaoyu Tian und Haotian Wang und Shuaiting Chen und Yiping Peng und Han Zhao und Xiangang Li}, Jahr={2025}, eprint={2504.00829}, archivePrefix={arXiv}, primaryClass={cs.CL}, url={https://arxiv.org/abs/2504.00829}, } @misc{tian2025thinktwiceenhancingllm, title={Zweimal denken: Verbesserung des logischen Denkens im LLM durch Skalierung des Denkens in mehreren Runden während der Testzeit}, Autor={Xiaoyu Tian und Sitong Zhao und Haotian Wang und Shuaiting Chen und Yunjie Ji und Yiping Peng und Han Zhao und Xiangang Li}, Jahr={2025}, eprint={2503.19855}, archivePrefix={arXiv}, primaryClass={cs.CL}, url={https://arxiv.org/abs/2503.19855}, } @misc{zhao202514millionopensourcedistilled, title={1,4 Millionen Open-Source-Datensatz für destilliertes Schlussfolgerungsvermögen zur Unterstützung des Trainings großer Sprachmodelle}, Autor={Han Zhao und Haotian Wang und Yiping Peng und Sitong Zhao und Xiaoyu Tian und Shuaiting Chen und Yunjie Ji und Xiangang Li}, Jahr={2025}, eprint={2503.19633}, archivePrefix={arXiv}, primaryClass={cs.CL}, url={https://arxiv.org/abs/2503.19633}, } “
KI mit KI entwickeln
Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.