Command Palette
Search for a command to run...
MedGen: グラナラーに注釈付けられた医療動画のスケーリングによる医療動画生成の解錠
MedGen: グラナラーに注釈付けられた医療動画のスケーリングによる医療動画生成の解錠
Rongsheng Wang Junying Chen Ke Ji Zhenyang Cai Shunian Chen Yunjin Yang Benyou Wang
概要
最近のビデオ生成技術の進歩は、オープンドメイン設定において著しい成果を示していますが、医療ビデオ生成は依然としてほとんど研究されていません。医療ビデオは、臨床トレーニング、教育、シミュレーションなどのアプリケーションにとって重要であり、高品質な視覚的忠実度だけでなく、厳密な医学的な正確さも必要とされます。しかし、現在のモデルは医療に関連するプロンプトに適用される場合、現実的でないまたは誤ったコンテンツを生成することが多く、これは大規模かつ高品質な医療分野向けデータセットの不足が主な原因です。このギャップを埋めるために、私たちはMedVideoCap-55K(メディカル・ビデオキャプション・55K)を導入します。これは初めての大規模で多様性があり、キャプションが豊富な医療ビデオ生成用データセットです。本データセットには55,000以上のキュレーションされたクリップが含まれており、現実世界の医療シナリオを網羅しており、汎用的な医療ビデオ生成モデルの訓練に強力な基盤を提供します。このデータセットに基づいて開発したMedGen(メディカルジェネレータ)は、オープンソースモデルの中で最高の性能を達成し、視覚的品質と医学的な正確さの両面で複数のベンチマークにおいて商用システムと匹敵する成果を上げています。私たちは本データセットとモデルが貴重な資源となり、さらに医療ビデオ生成に関する研究を促進することを期待しています。コードとデータは https://github.com/FreedomIntelligence/MedGen から入手可能です。