HyperAI

Täglich aktualisierte hochmoderne KI-Forschungsarbeiten, um Sie über die neuesten KI-Trends auf dem Laufenden zu halten

Jenseits euklidischen Clippings: Überwindung des Explorationskollapses in LLM-RL durch Riemannsche isometrische Policy-Optimierung

Verstärkendes Lernen

LLM

Zhicheng Cai, Xinyuan Guo, Hanlin Wu, et al.

Skalierungsgesetze für hypernetzwerkbasierte Wissensinjektion in großen Sprachmodellen

LLM

Modelltraining

Nischay Dhankhar, Dos Baha, Abulhair Saparov

Eine Prüfung für aktive Beobachter

Multimodal

LLM

Jiarui Zhang, Muzi Tao, Shangshang Wang, et al.

Jenseits der relevanzzentrierten Suche: Rubrikenorientierte Auswahl und Rangordnung von Dokumentensets

Retrieval-Augmented Generation

Benchmarks

Kailin Jiang, Lei Liu, Jian Xi, et al.

Self Gradient Forcing: Native Langzeit-Videoextrapolation

Videoerzeugung

Diffusionsmodell

Junhao Zhuang, Shiyi Zhang, Yuxuan Bian, et al.

SLAI T-Rex: Vollparameter-Post-Training der DeepSeek-V4-Familie auf Ascend SuperPOD

Überwachtes Feinabstimmen

DeepSeek

Dongfang Li, Xiaodong Luo, Ruoyu Sun, et al.

Vera: Ein geschichtetes Diffusionsmodell für inhaltsbewahrende Videobearbeitung

Diffusionsmodell

Text-zu-Video

Hongkai Zheng, Ta-Ying Cheng, Benjamin Klein, et al.

Zweistufige Meta-Bewertungsraster für die Evaluation offener Textgenerierung: GAMUT, ein Benchmark für faktische Vollständigkeit

LLM

Multimodal

Xilun Chen, Zhaleh Feizollahi, Ross Goodwin, et al.

Automatisierte Entdeckung besitzt kein universell überlegenes Steuerungssystem

LLM

Benchmarks

Akshat Gupta, Jermaine Lei, Alexander Lu, et al.

Auf dem Weg zu einer Wissenschaft der Skalierung von Agentensystemen

Agent

LLM

Yubin Kim, Ken Gu, Chanwoo Park, et al.

AlayaWorld: Interaktive Langzeithorizont-Weltmodellierung – Vollständiger Technischer Bericht

Diffusionsmodell

Videoerzeugung

Kaipeng Zhang, Chuanhao Li, Yifan Zhan, et al.

Mage-Flow: Ein effizientes Foundation-Modell mit nativer Auflösung für Bildgenerierung und -bearbeitung

Bildgenerierung

Text-zu-Bild

Xinjie Zhang, Peng Zhang, Shicheng Zheng, et al.

DataFlow-Harness: Eine geerdete Code-Agent-Plattform zur Konstruktion editierbarer LLM-Datenpipelines

LLM

Codegenerierung

Runming He, Zhen Hao Wong, Hao Liang, et al.

Textvorlagen-Token als implizite semantische Register in Diffusion-Transformern

Text-zu-Bild

Diffusionsmodell

Maohua Li, Qirui Li, Yanke Zhou, et al.

Generativer Welt-Renderer in Spielgeschwindigkeit

Videoerzeugung

Bildgenerierung

Guixu Lin, Zheng-Hui Huang, Siqi Yang, et al.

Unendliche interaktive Welt-Rollouts auf einer einzelnen Desktop-GPU

Videoerzeugung

Diffusionsmodell

Mu Xu, Ning Guo, Fan Jiang, et al.

UniMoMo: Einheitliche generative Modellierung von 3D-Molekülen für das De-novo-Binder-Design

Diffusionsmodell

Protein

Xiangzhe Kong, Zishen Zhang, Ziting Zhang, et al.

Messung von Belohnungsstreben durch kontrastive Glaubensaktualisierungen

Verstärkendes Lernen

Präferenzmodellierung

Axel Højmark, Jérémy Scheurer, Evgenia Nitishinskaya, et al.

LLM-as-a-Coach: Erfahrungsbasiertes Lernen für nicht verifizierbare Aufgaben

Verstärkendes Lernen

LLM

Tianzhu Ye, Li Dong, Guanheng Chen, et al.

Apple-π: Ein Benchmark zur Bewertung von Videogenerierungsmodellen hinsichtlich der Verankerung physikalischer Gesetze

Videoerzeugung

Multimodal

Runmao Yao, Kairui Hu, Yukang Cao, et al.

HOMIE: Human-Objekt-zentrierte Videopersonalisierung durch multimodale intelligente Erweiterung

Videoerzeugung

Multimodal

Yiyang Cai, Nan Chen, Rongchang Xie, et al.

SWE-Pruner Pro: Das Coder-LLM weiß bereits, was zu kürzen ist

Codegenerierung

LLM

Yuhang Wang, Yuling Shi, Shaoqiu Zhang, et al.

DeepSearch-World: Selbstdestillation für Deep-Search-Agenten in einer verifizierbaren Umgebung

Agent

Überwachtes Feinabstimmen

Xinyu Geng, Xuanhua He, Sixiang Chen, et al.

EvolvingWorld: Ein offenes Schema-Framework für ko-evolvierende Rollenspielagenten und Weltmodelle in interaktiven literarischen Welten

LLM

Agent

Qing Zong, Yue Guo, Mengxin Yang, et al.

TimeLens2: Generalist Video Temporal Grounding mit multimodalen LLMs

Videobegreifen

Multimodal

Yuhan Zhu, Changlian Ma, Xiangyu Zeng, et al.

Verständnis des Reasoning von Pretraining bis Post-Training

Verstärkendes Lernen

Reasoning

Jingyan Shen, Ang Li, Salman Rahman, et al.

Rekursive Selbstverbesserung in der KI: Von begrenzter Selbstverfeinerung zu autonomen Forschungsschleifen

LLM

Modelltraining

Mingguang Chen, Licheng Wang, Bo Qu

Loop the Loopies!

Transformer

LLM

Zitian Gao, Yilong Chen, Yihao Xiao, et al.

On-Policy Delta Distillation

Verstärkendes Lernen

LLM

Byeongho Heo, Jaehui Hwang, Sangdoo Yun, et al.

Cura 1T: Ein durch eine menschlich gesteuerte Selbstentwicklungsschleife trainiertes, gesundheitsspezialisiertes LLM

LLM

Multimodal

Haolin Chen, Leon Qi, Steve Brown, et al.

Von menschenzentrierter zu agentischer Code-Überprüfung: Der Einfluss verschiedener Generationen generativer KI-Technologie auf die Überprüfungsqualität

LLM

Agent

Suzhen Zhong, Shayan Noei, Bram Adams, et al.

RecGPT-V3 Technischer Bericht

LLM

Multimodal

Bowen Zheng, Bo Zheng, Chao Yi, et al.

Command Palette

Papers

Command Palette

Papers

Command Palette

Papers