HyperAIHyperAI

Command Palette

Search for a command to run...

R1-OneVisionのワンクリック展開

Date

9ヶ月前

Size

380.88 MB

License

Apache 2.0

Paper URL

2503.10615

1. チュートリアルの紹介

R1-OneVisionは、浙江大学のチームによって2025年2月にリリースされた大規模マルチモーダル推論モデルです。Qwen2.5-VLをベースとし、R1-OneVisionデータセットに基づいて微調整されたこのモデルは、複雑な視覚推論タスクの処理に優れており、画像とテキストデータをシームレスに統合します。数学、科学、深層画像理解、論理的推論において非常に優れたパフォーマンスを発揮し、様々な問題を解決するための強力なAIアシスタントとして機能します。関連研究論文も公開されています。 R1-Onevision: クロスモーダル形式化による一般化マルチモーダル推論の進歩

このチュートリアルでは、デモとして R1-Onevision-7B を使用し、コンピューティング リソースには RTX 4090 を使用します。

2. 操作手順

1. コンテナを起動した後、API アドレスをクリックして Web インターフェイスに入ります

「Bad Gateway」と表示される場合は、モデルが初期化中であることを意味します。 1~2分ほど待ってからページを更新してください。

2. 機能デモンストレーション

引用情報

GitHubユーザーに感謝 ボーイズウー  このチュートリアルを作成するためのプロジェクト参照情報は次のとおりです。

@article{yang2025r1onevision,
  title={R1-Onevision: Advancing Generalized Multimodal Reasoning through Cross-Modal Formalization},
  author={Yi Yang and Xiaoxuan He and Hongkun Pan and Xiyan Jiang and Yan Deng and Xingtao Yang and Haoyu Lu and Dacheng Yin and Fengyun Rao and Minfeng Zhu and Bo Zhang and Wei Chen},
  journal={arXiv preprint arXiv:2503.10615},
  year={2025},
}

交流とディスカッション

🖌️ 高品質のプロジェクトを見つけたら、メッセージを残してバックグラウンドで推奨してください。さらに、チュートリアル交換グループも設立しました。お友達はコードをスキャンして [SD チュートリアル] に参加し、さまざまな技術的な問題について話し合ったり、アプリケーションの効果を共有したりできます。

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています