HyperAI超神経

上海交通大学が MedMNIST 医療画像分析データセットと新しいベンチマークをリリース

5年前
大きな工場の事務
情報
神经小兮
特色图像

医用画像解析は非常に複雑な学際的な分野であり、最近、上海交通大学が MedMNIST データセットを発表し、医用画像解析の発展が期待されています。

首を振る医療画像解析

医用画像解析は「難しい」トピックとして認識されています。

まず、学際的な分野ですので、医師にはさまざまな知識が求められます。コンピューター ビジョンを研究している専門家や臨床医学者であっても、医療画像解析についてはせいぜい 0.5 歩しか経験したことがありません。

何年にもわたる学習と研究を経て、最終的にコンピュータビジョンと臨床医学の双方向のスキルを習得し、次の手術でもハゲになるだろうと楽観的に推定されています。これらのデータは、X 線、CT、超音波などのさまざまなソースから取得されるためです。非常に多くの非標準データセットをさまざまなモードで分析および処理するのは非常に困難です。

これはまだ終わっていませんが、ディープラーニングは医療画像解析の研究と応用において支配的な地位を占めていますが、AutoML を使用するのは簡単ではありません。ただし、医療画像分類用の AutoML ベンチマークは基本的にありません。

MedMNIST カテゴリー 十種競技の概要

医療画像解析は困難に満ちていますが、上海交通大学が最近発表した MedMNIST データセットは、これらの長年の問題を解決する優れたツールをもたらしました。

10 の公開データセット、450,000 枚の画像を再配置

MedMNIST は、10 の医療公開データ セットを集めたものです。すべてのデータは前処理され、トレーニング セット、検証セット、テスト サブセットを含む標準データ セットに分割されています。データソースには、X線、OCT、超音波、CTなどの異なる画像モードが含まれており、同じ病変のマルチモーダルデータが取得されます。 MNIST データセットと同様に、MedMNIST は、軽量の 28*28 画像に対して分類タスクを実行できます。

10 個のデータセットのデータ パターン、適用可能なタスク、および画像の数

MedMNIST には次の機能があります。

教育:マルチモーダル データは複数の公開医療画像データ セットから取得されており、教育での使用を容易にするためにクリエイティブ コモンズ (CC) ライセンスまたは無料ライセンスを採用しています。

標準化:すべてのデータは同じ形式に前処理されているため、参入障壁が低くなり、誰でも利用できるようになります。

多様性:マルチモーダル データ セットはさまざまなデータ モードをカバーし、100 ~ 100,000 のデータ サイズをサポートし、タスク タイプも二項分類、多変量分類、順序回帰、およびマルチラベルに強化されています。

軽量:28*28 の画像サイズにより、ラピッド プロトタイピング、マルチモーダル機械学習および AutoML アルゴリズムの迅速な反復と実験が容易になります。

MedMNIST データセット

発行機関:上海交通大学

含まれる数量:454,591枚の画像データ

データ形式:NPZ

データサイズ:654MB

発売時期:2020年10月28日

ダウンロードアドレス:http://dwz.date/dew2

Decathlon は AutoML の新しいベンチマークを作成するための優れた方法です 

医療セグメンテーション十種競技からインスピレーションを得て、上海交通大学の研究者も、医療画像分類における軽量の AutoML ベンチマークとして「MedMNIST分類十種競技」をリリースしました。

研究者らは、MedMNIST 分類十種競技を使用して 10 個のデータセットすべてのアルゴリズムのパフォーマンスを評価し、このベンチマークと比較するために ResNets (18, 50)、auto-sklearn、AutoKeras、Google AutoML Vision などの他のいくつかのベースライン手法を採用しました。

AUC や ACC などの指標に関する MedMNIST のパフォーマンスの概要

実験結果は、10 個のデータセットすべてに対して良好な汎化パフォーマンスを達成できるアルゴリズムが実験には存在しないことを示しています。この実験は、さまざまなデータ パターン、タスク タイプ、データ サイズにわたって適切に一般化する AutoML アルゴリズムを探索する上で非常に重要です。

MedMNIST 分類十種競技ベンチマークは、医療画像分析のための AutoML に関する将来の研究を促進します。

関連論文:

https://arxiv.org/pdf/2010.14925.pdf

オープンソースのアドレス:

https://github.com/MedMNIST/MedMNIST

今すぐデータセットをダウンロードしてトレーニングを開始してください

データセットをダウンロードし、オンラインで機械学習モデルをトレーニングします。OpenBayes を通じて実践を開始できます。

OpenBayes は、機械学習のためのクラウド コンピューティング能力を提供するクラウド サービス プラットフォームであり、大規模なスーパーコンピューティング クラスターを備え、GPU および CPU コンピューティング リソースの複数の構成をサポートし、すぐに使用できる汎用機械学習モデリングを備えています。機械学習の経験がなくても、インテリジェントなシステムを迅速に構築できます。

現在、OpenBayes のコンピューティング パワー コンテナ製品はすでにサポートされています。 TensorFlow、PyTorch、MXNet、Darknet、cpp-develop、その他の CPU および GPU 環境、標準的な機械学習フレームワークのさまざまなバージョンとタイプ、およびさまざまな共通の依存関係。

同時に、OpenBayes は次のサービスも提供します。 CPU、NVIDIA T4、NVIDIA Tesla V100、その他のコンピューティング リソース、大規模なデータの集中トレーニングでも、低電力モデルの常駐操作でも、ユーザーのニーズに簡単に対応できます。

MedMNIST データセットは現在 OpenBayes で入手できます。

openbayes.com にアクセスしてください  招待コード【HyperAI】で新規ユーザー登録楽しむ準備はできています週あたり 240 分の CPU + 180 分の NVIDIA vGPU  無料のコンピューティングパワー~

アクセス以下のリンクまたはクリックすると原文が読めます、MedMNIST 探索の旅を始めましょう!

リンク: http://dwz.date/dew2

- 以上 -