2ヶ月前

Spark NLP を使用した COVID-19 研究における臨床文書理解の向上

Veysel Kocaman; David Talby
Spark NLP を使用した COVID-19 研究における臨床文書理解の向上
要約

新型コロナウイルス感染症(COVID-19)の世界的パンデミックを受けて、ウイルスに関する科学研究論文の数が大幅に増加し、自動文献レビューへの関心が高まっています。本稿では、以前の取り組みを三つの点で改善した臨床テキストマイニングシステムを紹介します。第一に、このシステムは健康の社会的決定要因、解剖学、リスク因子、有害事象など、100種類以上の異なるエンティティタイプを認識できます。これは他の一般的な臨床および生物医学的なエンティティも含んでいます。第二に、テキスト処理パイプラインには主張状態検出機能が含まれており、患者自身ではなく他の人物に関するものや存在する事実、存在しない事実、条件付きの事実などを区別することができます。第三に、使用されている深層学習モデルは以前のものよりも精度が高く、最先端の事前学習済み命名エンティティ認識モデルと統合されたパイプラインを活用し、主張状態検出におけるこれまでの最高性能基準を向上させています。本システムでは、COVID-19オープンリサーチデータセット(CORD-19)から頻度が高い疾患や症状、一般的な生命徴候や心電図所見などの傾向と洞察を抽出する例を示しています。システムはSpark NLPライブラリを使用して構築されており、分散クラスタでのスケーリングに対応しGPUを利用可能であり、設定可能な再利用可能なNLPパイプラインや医療専門の埋め込み表現を提供します。また、新しいエンティティタイプや人間言語をサポートするためにモデルを訓練することも可能で、コード変更なしで対応できます。

Spark NLP を使用した COVID-19 研究における臨床文書理解の向上 | 最新論文 | HyperAI超神経