2ヶ月前

視覚質問応答

マルチモーダル表現

データセット

AIインフラストラクチャ

マルチモーダル

Zhenyang Cai Jiaming Zhang Junjie Zhao Ziyi Zeng Yanchao Li Jingyi Liang Junying Chen Yunjin Yang Jiajun You Shuzhi Deng

概要

歯科分野におけるマルチモーダルデータの信頼性のある解釈は、自動化された口腔 healthcare の実現に不可欠であるが、現在のマルチモーダル大規模言語モデル（MLLM）は、細粒度な歯科画像情報の捉え具合に欠け、正確な診断に必要な十分な推論能力を有していない。これらの課題に対応するため、本研究では高品質な領域知識の注入と強化学習を活用して開発された専門的歯科MLLM「DentalGPT」を提案する。具体的には、診断上重要な視覚的特徴に注目した詳細な説明が付与された12万枚以上の歯科画像を統合し、これまでで最も大規模な歯科分野向けマルチモーダルデータセットを構築した。このデータセットを用いた学習により、MLLMの歯科状態に対する視覚的理解が顕著に向上し、その後の強化学習段階でマルチモーダルな複雑な推論能力がさらに強化された。口腔内およびパノラマ画像を対象としたベンチマーク、および医療分野のVQA（視覚質問応答）ベンチマークの歯科サブセットにおける包括的な評価結果から、DentalGPTが疾患分類および歯科VQAタスクにおいて、パラメータ数がわずか7Bであるにもかかわらず、多数の最先端MLLMを上回る優れた性能を発揮することが明らかになった。これらの結果は、高品質な歯科データと段階的な適応戦略の組み合わせが、強力かつ領域特化型の歯科MLLM構築に有効な道筋を提供することを示している。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

2ヶ月前

視覚質問応答

マルチモーダル表現

データセット

AIインフラストラクチャ

マルチモーダル

Zhenyang Cai Jiaming Zhang Junjie Zhao Ziyi Zeng Yanchao Li Jingyi Liang Junying Chen Yunjin Yang Jiajun You Shuzhi Deng

概要

歯科分野におけるマルチモーダルデータの信頼性のある解釈は、自動化された口腔 healthcare の実現に不可欠であるが、現在のマルチモーダル大規模言語モデル（MLLM）は、細粒度な歯科画像情報の捉え具合に欠け、正確な診断に必要な十分な推論能力を有していない。これらの課題に対応するため、本研究では高品質な領域知識の注入と強化学習を活用して開発された専門的歯科MLLM「DentalGPT」を提案する。具体的には、診断上重要な視覚的特徴に注目した詳細な説明が付与された12万枚以上の歯科画像を統合し、これまでで最も大規模な歯科分野向けマルチモーダルデータセットを構築した。このデータセットを用いた学習により、MLLMの歯科状態に対する視覚的理解が顕著に向上し、その後の強化学習段階でマルチモーダルな複雑な推論能力がさらに強化された。口腔内およびパノラマ画像を対象としたベンチマーク、および医療分野のVQA（視覚質問応答）ベンチマークの歯科サブセットにおける包括的な評価結果から、DentalGPTが疾患分類および歯科VQAタスクにおいて、パラメータ数がわずか7Bであるにもかかわらず、多数の最先端MLLMを上回る優れた性能を発揮することが明らかになった。これらの結果は、高品質な歯科データと段階的な適応戦略の組み合わせが、強力かつ領域特化型の歯科MLLM構築に有効な道筋を提供することを示している。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

DentalGPT：歯科におけるマルチモーダルな複雑な推論を促進するためのアプローチ | 記事 | HyperAI超神経