HyperAI

メイン

GPU

コンソール
Studio
ドキュメント
料金

パルス

ニュース

リソース

論文
ノートブック
データセット
Wiki

ベンチマーク

SOTA
LLMモデル
GPUランキング

コミュニティ

イベント

ユーティリティ

概要利用規約プライバシーポリシー
日本語

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

最新のAIトレンドを把握するための、日々更新される最先端AI研究論文

人工知能の未来を築く

概要

当社についてサポートデータセットのヘルプ

製品

ニュース論文ノートブックデータセット Wiki

リンク

© HyperAI

GitHub Discord X (formerly Twitter)

HyperAI

メイン

GPU

コンソール
Studio
ドキュメント
料金

パルス

ニュース

リソース

論文
ノートブック
データセット
Wiki

ベンチマーク

SOTA
LLMモデル
GPUランキング

コミュニティ

イベント

ユーティリティ

概要利用規約プライバシーポリシー
日本語

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

最新のAIトレンドを把握するための、日々更新される最先端AI研究論文

人工知能の未来を築く

概要

当社についてサポートデータセットのヘルプ

製品

ニュース論文ノートブックデータセット Wiki

リンク

© HyperAI

GitHub Discord X (formerly Twitter)

汎用性のある幾何学的画像キャプション生成

汎用性のある幾何学的画像キャプション生成

マルチモーダル

Yue Xin, Wenyuan Wang, Rui Pan, et al.

強化学習による言語モデル計画の利点と課題：理論的視点から

強化学習による言語モデル計画の利点と課題：理論的視点から

監視付き微調整

Siwei Wang, Yifei Shen, Haoran Sun, et al.

言語モデルエージェントのエンパワーメントの推定

エージェント

Jinyeop Song, Jeff Gore, Max Kleiman-Weiner

言語モデルはスカラー報酬なしで言語的フィードバックから学習できる

Renjie Luo, Zichen Liu, Xiangyan Liu, et al.

変分推論による言語モデル

Xiangxin Zhou, Zichen Liu, Haonan Wang, et al.

EPO：大規模言語モデルエージェント向けエントロピー正則化政策最適化
強化学習

Xu Wujiang, Wentian Zhao, Zhenting Wang, et al.

MinerU2.5：効率的な高解像度ドキュメント解析のための分離型視覚言語モデル

ドキュメント理解

マルチモーダル

Junbo Niu, Zheng Liu, Zhuangcheng Gu, et al.

エントロピー安全推論のための分位数アドバンテージ推定

Junkang Wu, Kexin Huang, Jiancan Wu, et al.

LongLive：リアルタイム対応の長時間動画生成

テキストから動画

Shuai Yang, Wei Huang, Ruihang Chu, et al.

組み合わせ的創造性：一般化能力における新たなフロンティア

アルゴリズム

Samuel Schapiro, Sumuk Shashidhar, Alexi Gladstone, et al.

因果的時空間予測：効果的かつ効率的なマルチモーダルアプローチ

マルチモーダル

Yuting Huang, Ziquan Fang, Zhihao Zeng, et al.

Hunyuan3D-Omni：3Dアセットの制御可能生成のための統一フレームワーク

マルチモーダル

Team Hunyuan3D, Bowen Zhang, Chunchao Guo, et al.

Seedream 4.0：次世代マルチモーダル画像生成へ

テキストから画像生成

拡散モデル

Team Seedream, Yunpeng Chen, Yu Gao, et al.

LLMエージェント強化学習のための木探索

Yuxiang Ji, Ziyu Ma, Yong Wang, et al.

SciReasoner：分野を越えた科学的推論の基盤を構築する

Yizhou Wang, Chen Tang, Han Deng, et al.

MMR1：分散に配慮したサンプリングおよびオープンリソースを活用したマルチモーダル推論の向上

マルチモーダル

Sicong Leng, Jing Wang, Jiaxi Li, et al.

VCRL：大規模言語モデル向けの分散に基づくカリキュラム強化学習

Guochao Jiang, Wenfeng Feng, Guofeng Quan, et al.

MultiEdit：多様で困難なタスクにおける指示に基づく画像編集の進展

画像間変換

マルチモーダル

Mingsong Li, Lin Liu, Hongjun Wang, et al.

BRISC：Swin-HAFNetを用いた脳腫瘍セグメンテーションおよび分類のためのアノテーション付きデータセット

セマンティックセグメンテーション

Amirreza Fateh, Yasin Rezvani, Sara Moayedi, et al.

EmoBench-M：マルチモーダル大規模言語モデルの感情知能のベンチマーク評価

マルチモーダル

He Hu, Yucheng Zhou, Lianzhong You, et al.

FDABench：異種データ上の分析クエリ向けデータエージェントのベンチマーク

ベンチマーク

エージェント

Ziting Wang, Shize Zhang, Haitao Yuan, et al.

思考するより絵を描くほうが簡単：テキストから画像を生成するモデルは舞台を設定できるが、演出まではできないか？

テキストから画像生成

Ouxiang Li, Yuan Wang, Xinting Hu, et al.

UniVerse-1：エキスパートのステッチングによる統合型音声・映像生成

Duomin Wang, Wei Zuo, Aojie Li, et al.

基礎モデルは段階的エムボディド推論においてどれほど優れているか？

エムボディドインテリジェンス

ベンチマーク

Dinura Dissanayake, Ahmed Heakl, Omkar Thawakar, et al.

スパイキングブレイン技術報告書：スパイキングブレインをインスパイアした大規模モデル

Yuqi Pan, Yupeng Feng, Jinghao Zhuang, et al.

SAGE：意味理解のための現実的なベンチマーク

ベンチマーク

データセット

Samarth Goel, Reagan J. Lee, Kannan Ramchandran

WAVECLIP：適応的解像度CLIPのためのウェーブレットトークナイゼーション

Moshe Kimhi, Erez Koifman, Ehud Rivlin, et al.

EmbeddingGemma：強力で軽量なテキスト表現

Henrique Schechter Vera, Sahil Dua, Biao Zhang, et al.

GRPOを用いた音声認識言語モデルにおける音声理解の進展

監視付き微調整

Avishai Elmakies, Hagai Aronowitz, Nimrod Shabtay, et al.

VLMが視覚空間的知能からどれほど離れているのか？ベンチマーク駆動型の視点から

ベンチマーク

マルチモーダル

Songsong Yu, Yuxin Chen, Hao Ju, et al.

SIM-CoT：教師付き暗黙的チェーン・オブ・シンキング

監視付き微調整

Xilin Wei, Xiaoran Liu, Yuhang Zang, et al.

SWE-QA：言語モデルはリポジトリレベルのコード質問に答えられるか？

インテリジェントな質問応答

ベンチマーク

Weihan Peng, Yuling Shi, Yuhang Wang, et al.

汎用性のある幾何学的画像キャプション生成

汎用性のある幾何学的画像キャプション生成

マルチモーダル

Yue Xin, Wenyuan Wang, Rui Pan, et al.

強化学習による言語モデル計画の利点と課題：理論的視点から

強化学習による言語モデル計画の利点と課題：理論的視点から

監視付き微調整

Siwei Wang, Yifei Shen, Haoran Sun, et al.

言語モデルエージェントのエンパワーメントの推定

エージェント

Jinyeop Song, Jeff Gore, Max Kleiman-Weiner

言語モデルはスカラー報酬なしで言語的フィードバックから学習できる

Renjie Luo, Zichen Liu, Xiangyan Liu, et al.

変分推論による言語モデル

Xiangxin Zhou, Zichen Liu, Haonan Wang, et al.

EPO：大規模言語モデルエージェント向けエントロピー正則化政策最適化
強化学習

Xu Wujiang, Wentian Zhao, Zhenting Wang, et al.

MinerU2.5：効率的な高解像度ドキュメント解析のための分離型視覚言語モデル

ドキュメント理解

マルチモーダル

Junbo Niu, Zheng Liu, Zhuangcheng Gu, et al.

エントロピー安全推論のための分位数アドバンテージ推定

Junkang Wu, Kexin Huang, Jiancan Wu, et al.

LongLive：リアルタイム対応の長時間動画生成

テキストから動画

Shuai Yang, Wei Huang, Ruihang Chu, et al.

組み合わせ的創造性：一般化能力における新たなフロンティア

アルゴリズム

Samuel Schapiro, Sumuk Shashidhar, Alexi Gladstone, et al.

因果的時空間予測：効果的かつ効率的なマルチモーダルアプローチ

マルチモーダル

Yuting Huang, Ziquan Fang, Zhihao Zeng, et al.

Hunyuan3D-Omni：3Dアセットの制御可能生成のための統一フレームワーク

マルチモーダル

Team Hunyuan3D, Bowen Zhang, Chunchao Guo, et al.

Seedream 4.0：次世代マルチモーダル画像生成へ

テキストから画像生成

拡散モデル

Team Seedream, Yunpeng Chen, Yu Gao, et al.

LLMエージェント強化学習のための木探索

Yuxiang Ji, Ziyu Ma, Yong Wang, et al.

SciReasoner：分野を越えた科学的推論の基盤を構築する

Yizhou Wang, Chen Tang, Han Deng, et al.

MMR1：分散に配慮したサンプリングおよびオープンリソースを活用したマルチモーダル推論の向上

マルチモーダル

Sicong Leng, Jing Wang, Jiaxi Li, et al.

VCRL：大規模言語モデル向けの分散に基づくカリキュラム強化学習

Guochao Jiang, Wenfeng Feng, Guofeng Quan, et al.

MultiEdit：多様で困難なタスクにおける指示に基づく画像編集の進展

画像間変換

マルチモーダル

Mingsong Li, Lin Liu, Hongjun Wang, et al.

BRISC：Swin-HAFNetを用いた脳腫瘍セグメンテーションおよび分類のためのアノテーション付きデータセット

セマンティックセグメンテーション

Amirreza Fateh, Yasin Rezvani, Sara Moayedi, et al.

EmoBench-M：マルチモーダル大規模言語モデルの感情知能のベンチマーク評価

マルチモーダル

He Hu, Yucheng Zhou, Lianzhong You, et al.

FDABench：異種データ上の分析クエリ向けデータエージェントのベンチマーク

ベンチマーク

エージェント

Ziting Wang, Shize Zhang, Haitao Yuan, et al.

思考するより絵を描くほうが簡単：テキストから画像を生成するモデルは舞台を設定できるが、演出まではできないか？

テキストから画像生成

Ouxiang Li, Yuan Wang, Xinting Hu, et al.

UniVerse-1：エキスパートのステッチングによる統合型音声・映像生成

Duomin Wang, Wei Zuo, Aojie Li, et al.

基礎モデルは段階的エムボディド推論においてどれほど優れているか？

エムボディドインテリジェンス

ベンチマーク

Dinura Dissanayake, Ahmed Heakl, Omkar Thawakar, et al.

スパイキングブレイン技術報告書：スパイキングブレインをインスパイアした大規模モデル

Yuqi Pan, Yupeng Feng, Jinghao Zhuang, et al.

SAGE：意味理解のための現実的なベンチマーク

ベンチマーク

データセット

Samarth Goel, Reagan J. Lee, Kannan Ramchandran

WAVECLIP：適応的解像度CLIPのためのウェーブレットトークナイゼーション

Moshe Kimhi, Erez Koifman, Ehud Rivlin, et al.

EmbeddingGemma：強力で軽量なテキスト表現

Henrique Schechter Vera, Sahil Dua, Biao Zhang, et al.

GRPOを用いた音声認識言語モデルにおける音声理解の進展

監視付き微調整

Avishai Elmakies, Hagai Aronowitz, Nimrod Shabtay, et al.

VLMが視覚空間的知能からどれほど離れているのか？ベンチマーク駆動型の視点から

ベンチマーク

マルチモーダル

Songsong Yu, Yuxin Chen, Hao Ju, et al.

SIM-CoT：教師付き暗黙的チェーン・オブ・シンキング

監視付き微調整

Xilin Wei, Xiaoran Liu, Yuhang Zang, et al.

SWE-QA：言語モデルはリポジトリレベルのコード質問に答えられるか？

インテリジェントな質問応答

ベンチマーク

Weihan Peng, Yuling Shi, Yuhang Wang, et al.

言語モデルエージェントのエンパワーメントの推定

言語モデルはスカラー報酬なしで言語的フィードバックから学習できる

変分推論による言語モデル

EPO：大規模言語モデルエージェント向けエントロピー正則化政策最適化強化学習

MinerU2.5：効率的な高解像度ドキュメント解析のための分離型視覚言語モデル

エントロピー安全推論のための分位数アドバンテージ推定

LongLive：リアルタイム対応の長時間動画生成

組み合わせ的創造性：一般化能力における新たなフロンティア

因果的時空間予測：効果的かつ効率的なマルチモーダルアプローチ

Hunyuan3D-Omni：3Dアセットの制御可能生成のための統一フレームワーク

Seedream 4.0：次世代マルチモーダル画像生成へ

LLMエージェント強化学習のための木探索

SciReasoner：分野を越えた科学的推論の基盤を構築する

MMR1：分散に配慮したサンプリングおよびオープンリソースを活用したマルチモーダル推論の向上

VCRL：大規模言語モデル向けの分散に基づくカリキュラム強化学習

MultiEdit：多様で困難なタスクにおける指示に基づく画像編集の進展

BRISC：Swin-HAFNetを用いた脳腫瘍セグメンテーションおよび分類のためのアノテーション付きデータセット

EmoBench-M：マルチモーダル大規模言語モデルの感情知能のベンチマーク評価

FDABench：異種データ上の分析クエリ向けデータエージェントのベンチマーク

思考するより絵を描くほうが簡単：テキストから画像を生成するモデルは舞台を設定できるが、演出まではできないか？

UniVerse-1：エキスパートのステッチングによる統合型音声・映像生成

基礎モデルは段階的エムボディド推論においてどれほど優れているか？

スパイキングブレイン技術報告書：スパイキングブレインをインスパイアした大規模モデル

SAGE：意味理解のための現実的なベンチマーク

WAVECLIP：適応的解像度CLIPのためのウェーブレットトークナイゼーション

EmbeddingGemma：強力で軽量なテキスト表現

GRPOを用いた音声認識言語モデルにおける音声理解の進展

VLMが視覚空間的知能からどれほど離れているのか？ベンチマーク駆動型の視点から

SIM-CoT：教師付き暗黙的チェーン・オブ・シンキング

SWE-QA：言語モデルはリポジトリレベルのコード質問に答えられるか？

言語モデルエージェントのエンパワーメントの推定

言語モデルはスカラー報酬なしで言語的フィードバックから学習できる

変分推論による言語モデル

EPO：大規模言語モデルエージェント向けエントロピー正則化政策最適化強化学習

MinerU2.5：効率的な高解像度ドキュメント解析のための分離型視覚言語モデル

エントロピー安全推論のための分位数アドバンテージ推定

LongLive：リアルタイム対応の長時間動画生成

組み合わせ的創造性：一般化能力における新たなフロンティア

因果的時空間予測：効果的かつ効率的なマルチモーダルアプローチ

Hunyuan3D-Omni：3Dアセットの制御可能生成のための統一フレームワーク

Seedream 4.0：次世代マルチモーダル画像生成へ

LLMエージェント強化学習のための木探索

SciReasoner：分野を越えた科学的推論の基盤を構築する

MMR1：分散に配慮したサンプリングおよびオープンリソースを活用したマルチモーダル推論の向上

VCRL：大規模言語モデル向けの分散に基づくカリキュラム強化学習

MultiEdit：多様で困難なタスクにおける指示に基づく画像編集の進展

BRISC：Swin-HAFNetを用いた脳腫瘍セグメンテーションおよび分類のためのアノテーション付きデータセット

EmoBench-M：マルチモーダル大規模言語モデルの感情知能のベンチマーク評価

FDABench：異種データ上の分析クエリ向けデータエージェントのベンチマーク

思考するより絵を描くほうが簡単：テキストから画像を生成するモデルは舞台を設定できるが、演出まではできないか？

UniVerse-1：エキスパートのステッチングによる統合型音声・映像生成

基礎モデルは段階的エムボディド推論においてどれほど優れているか？

スパイキングブレイン技術報告書：スパイキングブレインをインスパイアした大規模モデル

SAGE：意味理解のための現実的なベンチマーク

WAVECLIP：適応的解像度CLIPのためのウェーブレットトークナイゼーション

EmbeddingGemma：強力で軽量なテキスト表現

GRPOを用いた音声認識言語モデルにおける音声理解の進展

VLMが視覚空間的知能からどれほど離れているのか？ベンチマーク駆動型の視点から

SIM-CoT：教師付き暗黙的チェーン・オブ・シンキング

SWE-QA：言語モデルはリポジトリレベルのコード質問に答えられるか？