HyperAI

メイン

GPU

コンソール
Studio
ドキュメント
料金

パルス

ニュース

リソース

論文
ノートブック
データセット
Wiki

ベンチマーク

SOTA
LLMモデル
GPUランキング

コミュニティ

イベント

ユーティリティ

概要利用規約プライバシーポリシー
日本語

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

最新のAIトレンドを把握するための、日々更新される最先端AI研究論文

人工知能の未来を築く

概要

当社についてサポートデータセットのヘルプ

製品

ニュース論文ノートブックデータセット Wiki

リンク

© HyperAI

GitHub Discord X (formerly Twitter)

HyperAI

メイン

GPU

コンソール
Studio
ドキュメント
料金

パルス

ニュース

リソース

論文
ノートブック
データセット
Wiki

ベンチマーク

SOTA
LLMモデル
GPUランキング

コミュニティ

イベント

ユーティリティ

概要利用規約プライバシーポリシー
日本語

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

最新のAIトレンドを把握するための、日々更新される最先端AI研究論文

人工知能の未来を築く

概要

当社についてサポートデータセットのヘルプ

製品

ニュース論文ノートブックデータセット Wiki

リンク

© HyperAI

GitHub Discord X (formerly Twitter)

LazyDrag：明示的対応関係を用いたマルチモーダル拡散トランスフォーマーにおける安定なドラッグベース編集の実現

LazyDrag：明示的対応関係を用いたマルチモーダル拡散トランスフォーマーにおける安定なドラッグベース編集の実現

拡散モデル

マルチモーダル

Zixin Yin, Xili Dai, Duomin Wang, et al.

SearchInstruct：検索ベースの指示データセット作成によるドメイン適応の向上

SearchInstruct：検索ベースの指示データセット作成によるドメイン適応の向上

監視付き微調整

検索拡張生成

Iman Barati, Mostafa Amiri, Heshaam Faili

解釈可能な物理学的推論と視覚言語モデルにおけるパフォーマンス分類

マルチモーダル

Pranav Pawar, Kavish Shah, Akshat Bhalani, et al.

InternScenes：現実的なレイアウトを備えた大規模なシミュラブルな屋内シーンデータセット

データセット

Weipeng Zhong, Peizhou Cao, Yichen Jin, et al.

UI-S1：セミオンライン強化学習を活用したGUI自動化の進展

エージェント

Zhengxi Lu, Jiabo Ye, Fei Tang, et al.

OmniWorld：4Dワールドモデリングのためのマルチドメイン・マルチモーダルデータセット

データセット

ビデオ理解

Yang Zhou, Yifan Wang, Jianjun Zhou, et al.

LAVa：階層別KVキャッシュ除外と動的予算割り当て

Yiqun Shen, Song Yuan, Zhengze Zhang, et al.

確率構造統合を用いた世界モデリング

モデリング

ビデオ理解

Klemen Kotar, Wanhee Lee, Rahul Venkatesh, et al.

VStyle：音声スタイル適応のためのベンチマーク（口頭指示付き）

Jun Zhan, Mingyang Han, Yuxuan Xie, et al.

HANRAG：ヒューリスティックかつ高精度・ノイズ耐性を備えたマルチホップ質問応答のためのリトリーブ増強生成

検索拡張生成

Duolin Sun, Dan Yang, Yue Shen, et al.

InfGen：スケーラビリティを考慮した解像度無差別な画像生成パラダイム

拡散モデル

Tao Han, Wanghan Xu, Junchao Gong, et al.

X-Part：高忠実度かつ構造整合性を有する形状分解

セマンティックセグメンテーション

Xinhao Yan, Jiachen Xu, Yang Li, et al.

リターンの逓減の錯覚：大規模言語モデルにおける長期的実行の測定

Akshit Sinha, Arvindh Arun, Shashwat Goel, et al.

IntrEx：教育的対話における関与をモデル化するためのデータセット

データセット

Xingwei Tan, Mahathi Parvatham, Chiara Gambi, et al.

Youtu-GraphRAG：グラフ検索拡張型複雑推論のための垂直統合型エージェント

検索拡張生成

Junnan Dong, Siyu An, Yifei Yu, et al.

SceneSplat：視覚言語事前学習を活用したガウシアンスプラッティングベースのシーン理解

3D マシンビジョン

マルチモーダル表現

Yue Li, Qi Ma, Runyi Yang, et al.

バーチャルエージェント経済

エージェント

Preference Modeling

Nenad Tomasev, Matija Franklin, Joel Z. Leibo, et al.

視覚言語モデルにおける視覚基盤の理解に向けて

マルチモーダル

マルチモーダル表現

Georgios Pantazopoulos, Eda B. Özyiğit

マルチモーダル表現

Yikang Ding, Jiwen Liu, Wenyuan Zhang, et al.

機械学習LM：数百万の合成テーブル予測タスク上で継続的に事前学習された言語モデルが、文脈内機械学習をスケーリングする

Haoyu Dong, Pengkun Zhang, Mingzhe Lu, et al.

エコーエックス：音声対音声LLMにおける音響的・意味的ギャップ低減のためのエコー学習へ

Yuhao Zhang, Yuhao Du, Zhanchen Dai, et al.

SimpleVLA-RL：強化学習を活用したVLA学習のスケーリング

監視付き微調整

Haozhan Li, Yuxin Zuo, Jiale Yu, et al.

VLA-Adapter：微小スケール視覚言語行動モデルにおける効果的なパラダイム

マルチモーダル

Yihao Wang, Pengxiang Ding, Lingxiao Li, et al.

scSiameseClu：単細胞RNAシークエンシングデータの解釈を目的としたシアメーズクラスタリングフレームワーク

ゲノミクス

ディープラーニング

Ping Xu, Zhiyuan Ning, Pengjiang Li, et al.

ST-Raptor：LLM駆動の準構造化テーブル質問応答

インテリジェントな質問応答

Zirui Tang, Boyu Niu, Xuanhe Zhou, et al.

OmniSpatial：視覚言語モデルにおける包括的な空間推論ベンチマークへ向けて

ベンチマーク

マルチモーダル

Mengdi Jia, Zekun Qi, Shaochen Zhang, et al.

交渉ゲームにおける人間エージェントとAIエージェント間の経済的トレードオフの理解

エージェント

Preference Modeling

Crystal Qian, Kehang Zhu, John Horton, et al.

ジュピター：ノートブックおよび推論時価値誘導型探索を活用したLLMデータ分析機能の向上

Shuocheng Li, Yihao Liu, Silin Du, et al.

フニエン-MT 技術報告

Mao Zheng, Zheng Li, Bingxin Qu, et al.

P3-SAM：ネイティブ3Dパーツセグメンテーション

コンピュータビジョン

セマンティックセグメンテーション

Changfeng Ma, Yang Li, Xinhao Yan, et al.

AgentGym-RL：マルチターン強化学習を用いた長期意思決定のためのLLMエージェントの訓練

エージェント

Zhiheng Xi, Jixuan Huang, Chenyang Liao, et al.

3Dおよび4Dワールドモデリング：サーベイ

モデリング

Lingdong Kong, Wesley Yang, Jianbiao Mei, et al.

LazyDrag：明示的対応関係を用いたマルチモーダル拡散トランスフォーマーにおける安定なドラッグベース編集の実現

LazyDrag：明示的対応関係を用いたマルチモーダル拡散トランスフォーマーにおける安定なドラッグベース編集の実現

拡散モデル

マルチモーダル

Zixin Yin, Xili Dai, Duomin Wang, et al.

SearchInstruct：検索ベースの指示データセット作成によるドメイン適応の向上

SearchInstruct：検索ベースの指示データセット作成によるドメイン適応の向上

監視付き微調整

検索拡張生成

Iman Barati, Mostafa Amiri, Heshaam Faili

解釈可能な物理学的推論と視覚言語モデルにおけるパフォーマンス分類

マルチモーダル

Pranav Pawar, Kavish Shah, Akshat Bhalani, et al.

InternScenes：現実的なレイアウトを備えた大規模なシミュラブルな屋内シーンデータセット

データセット

Weipeng Zhong, Peizhou Cao, Yichen Jin, et al.

UI-S1：セミオンライン強化学習を活用したGUI自動化の進展

エージェント

Zhengxi Lu, Jiabo Ye, Fei Tang, et al.

OmniWorld：4Dワールドモデリングのためのマルチドメイン・マルチモーダルデータセット

データセット

ビデオ理解

Yang Zhou, Yifan Wang, Jianjun Zhou, et al.

LAVa：階層別KVキャッシュ除外と動的予算割り当て

Yiqun Shen, Song Yuan, Zhengze Zhang, et al.

確率構造統合を用いた世界モデリング

モデリング

ビデオ理解

Klemen Kotar, Wanhee Lee, Rahul Venkatesh, et al.

VStyle：音声スタイル適応のためのベンチマーク（口頭指示付き）

Jun Zhan, Mingyang Han, Yuxuan Xie, et al.

HANRAG：ヒューリスティックかつ高精度・ノイズ耐性を備えたマルチホップ質問応答のためのリトリーブ増強生成

検索拡張生成

Duolin Sun, Dan Yang, Yue Shen, et al.

InfGen：スケーラビリティを考慮した解像度無差別な画像生成パラダイム

拡散モデル

Tao Han, Wanghan Xu, Junchao Gong, et al.

X-Part：高忠実度かつ構造整合性を有する形状分解

セマンティックセグメンテーション

Xinhao Yan, Jiachen Xu, Yang Li, et al.

リターンの逓減の錯覚：大規模言語モデルにおける長期的実行の測定

Akshit Sinha, Arvindh Arun, Shashwat Goel, et al.

IntrEx：教育的対話における関与をモデル化するためのデータセット

データセット

Xingwei Tan, Mahathi Parvatham, Chiara Gambi, et al.

Youtu-GraphRAG：グラフ検索拡張型複雑推論のための垂直統合型エージェント

検索拡張生成

Junnan Dong, Siyu An, Yifei Yu, et al.

SceneSplat：視覚言語事前学習を活用したガウシアンスプラッティングベースのシーン理解

3D マシンビジョン

マルチモーダル表現

Yue Li, Qi Ma, Runyi Yang, et al.

バーチャルエージェント経済

エージェント

Preference Modeling

Nenad Tomasev, Matija Franklin, Joel Z. Leibo, et al.

視覚言語モデルにおける視覚基盤の理解に向けて

マルチモーダル

マルチモーダル表現

Georgios Pantazopoulos, Eda B. Özyiğit

マルチモーダル表現

Yikang Ding, Jiwen Liu, Wenyuan Zhang, et al.

機械学習LM：数百万の合成テーブル予測タスク上で継続的に事前学習された言語モデルが、文脈内機械学習をスケーリングする

Haoyu Dong, Pengkun Zhang, Mingzhe Lu, et al.

エコーエックス：音声対音声LLMにおける音響的・意味的ギャップ低減のためのエコー学習へ

Yuhao Zhang, Yuhao Du, Zhanchen Dai, et al.

SimpleVLA-RL：強化学習を活用したVLA学習のスケーリング

監視付き微調整

Haozhan Li, Yuxin Zuo, Jiale Yu, et al.

VLA-Adapter：微小スケール視覚言語行動モデルにおける効果的なパラダイム

マルチモーダル

Yihao Wang, Pengxiang Ding, Lingxiao Li, et al.

scSiameseClu：単細胞RNAシークエンシングデータの解釈を目的としたシアメーズクラスタリングフレームワーク

ゲノミクス

ディープラーニング

Ping Xu, Zhiyuan Ning, Pengjiang Li, et al.

ST-Raptor：LLM駆動の準構造化テーブル質問応答

インテリジェントな質問応答

Zirui Tang, Boyu Niu, Xuanhe Zhou, et al.

OmniSpatial：視覚言語モデルにおける包括的な空間推論ベンチマークへ向けて

ベンチマーク

マルチモーダル

Mengdi Jia, Zekun Qi, Shaochen Zhang, et al.

交渉ゲームにおける人間エージェントとAIエージェント間の経済的トレードオフの理解

エージェント

Preference Modeling

Crystal Qian, Kehang Zhu, John Horton, et al.

ジュピター：ノートブックおよび推論時価値誘導型探索を活用したLLMデータ分析機能の向上

Shuocheng Li, Yihao Liu, Silin Du, et al.

フニエン-MT 技術報告

Mao Zheng, Zheng Li, Bingxin Qu, et al.

P3-SAM：ネイティブ3Dパーツセグメンテーション

コンピュータビジョン

セマンティックセグメンテーション

Changfeng Ma, Yang Li, Xinhao Yan, et al.

AgentGym-RL：マルチターン強化学習を用いた長期意思決定のためのLLMエージェントの訓練

エージェント

Zhiheng Xi, Jixuan Huang, Chenyang Liao, et al.

3Dおよび4Dワールドモデリング：サーベイ

モデリング

Lingdong Kong, Wesley Yang, Jianbiao Mei, et al.

解釈可能な物理学的推論と視覚言語モデルにおけるパフォーマンス分類

InternScenes：現実的なレイアウトを備えた大規模なシミュラブルな屋内シーンデータセット

UI-S1：セミオンライン強化学習を活用したGUI自動化の進展

OmniWorld：4Dワールドモデリングのためのマルチドメイン・マルチモーダルデータセット

LAVa：階層別KVキャッシュ除外と動的予算割り当て

確率構造統合を用いた世界モデリング

VStyle：音声スタイル適応のためのベンチマーク（口頭指示付き）

HANRAG：ヒューリスティックかつ高精度・ノイズ耐性を備えたマルチホップ質問応答のためのリトリーブ増強生成

InfGen：スケーラビリティを考慮した解像度無差別な画像生成パラダイム

X-Part：高忠実度かつ構造整合性を有する形状分解

リターンの逓減の錯覚：大規模言語モデルにおける長期的実行の測定

IntrEx：教育的対話における関与をモデル化するためのデータセット

Youtu-GraphRAG：グラフ検索拡張型複雑推論のための垂直統合型エージェント

SceneSplat：視覚言語事前学習を活用したガウシアンスプラッティングベースのシーン理解

バーチャルエージェント経済

視覚言語モデルにおける視覚基盤の理解に向けて

Kling-Avatar：段階的長時間アバターアニメーション合成のためのマルチモーダル指示の基盤化

機械学習LM：数百万の合成テーブル予測タスク上で継続的に事前学習された言語モデルが、文脈内機械学習をスケーリングする

エコーエックス：音声対音声LLMにおける音響的・意味的ギャップ低減のためのエコー学習へ

SimpleVLA-RL：強化学習を活用したVLA学習のスケーリング

VLA-Adapter：微小スケール視覚言語行動モデルにおける効果的なパラダイム

scSiameseClu：単細胞RNAシークエンシングデータの解釈を目的としたシアメーズクラスタリングフレームワーク

ST-Raptor：LLM駆動の準構造化テーブル質問応答

OmniSpatial：視覚言語モデルにおける包括的な空間推論ベンチマークへ向けて

交渉ゲームにおける人間エージェントとAIエージェント間の経済的トレードオフの理解

ジュピター：ノートブックおよび推論時価値誘導型探索を活用したLLMデータ分析機能の向上

フニエン-MT 技術報告

P3-SAM：ネイティブ3Dパーツセグメンテーション

AgentGym-RL：マルチターン強化学習を用いた長期意思決定のためのLLMエージェントの訓練

3Dおよび4Dワールドモデリング：サーベイ

解釈可能な物理学的推論と視覚言語モデルにおけるパフォーマンス分類

InternScenes：現実的なレイアウトを備えた大規模なシミュラブルな屋内シーンデータセット

UI-S1：セミオンライン強化学習を活用したGUI自動化の進展

OmniWorld：4Dワールドモデリングのためのマルチドメイン・マルチモーダルデータセット

LAVa：階層別KVキャッシュ除外と動的予算割り当て

確率構造統合を用いた世界モデリング

VStyle：音声スタイル適応のためのベンチマーク（口頭指示付き）

HANRAG：ヒューリスティックかつ高精度・ノイズ耐性を備えたマルチホップ質問応答のためのリトリーブ増強生成

InfGen：スケーラビリティを考慮した解像度無差別な画像生成パラダイム

X-Part：高忠実度かつ構造整合性を有する形状分解

リターンの逓減の錯覚：大規模言語モデルにおける長期的実行の測定

IntrEx：教育的対話における関与をモデル化するためのデータセット

Youtu-GraphRAG：グラフ検索拡張型複雑推論のための垂直統合型エージェント

SceneSplat：視覚言語事前学習を活用したガウシアンスプラッティングベースのシーン理解

バーチャルエージェント経済

視覚言語モデルにおける視覚基盤の理解に向けて

Kling-Avatar：段階的長時間アバターアニメーション合成のためのマルチモーダル指示の基盤化

機械学習LM：数百万の合成テーブル予測タスク上で継続的に事前学習された言語モデルが、文脈内機械学習をスケーリングする

エコーエックス：音声対音声LLMにおける音響的・意味的ギャップ低減のためのエコー学習へ

SimpleVLA-RL：強化学習を活用したVLA学習のスケーリング

VLA-Adapter：微小スケール視覚言語行動モデルにおける効果的なパラダイム

scSiameseClu：単細胞RNAシークエンシングデータの解釈を目的としたシアメーズクラスタリングフレームワーク

ST-Raptor：LLM駆動の準構造化テーブル質問応答

OmniSpatial：視覚言語モデルにおける包括的な空間推論ベンチマークへ向けて

交渉ゲームにおける人間エージェントとAIエージェント間の経済的トレードオフの理解

ジュピター：ノートブックおよび推論時価値誘導型探索を活用したLLMデータ分析機能の向上

フニエン-MT 技術報告

P3-SAM：ネイティブ3Dパーツセグメンテーション

AgentGym-RL：マルチターン強化学習を用いた長期意思決定のためのLLMエージェントの訓練

3Dおよび4Dワールドモデリング：サーベイ