名前付きエンティティ認識(Named Entity Recognition, NER)とは、文字列を入力として受け取り、その中にある関連する固有名詞を特定するプロセスである。本論文では、デーバナガリ文字で書かれたヒンディ語のNERシステムの開発について報告する。この研究では、さまざまな埋め込みモデル(embedding models)を用いてシステムを構築した。埋め込みモデルは「文脈非依存型(Non-contextual)」と「文脈依存型(Contextual)」に分類し、それぞれのカテゴリ内およびカテゴリ間で比較検討を行った。文脈非依存型埋め込みでは、Word2VecとFastTextを用い、文脈依存型埋め込みでは、BERTおよびその派生モデルであるRoBERTa、ELECTRA、CamemBERT、Distil-BERT、XLM-RoBERTaを検証した。文脈非依存型埋め込みのケースでは、ガウスNB、Adaboost分類器、多層パーセプトロン分類器、ランダムフォレスト分類器、決定木分類器の5つの機械学習アルゴリズムを用いて、FastTextおよびGensim Word2Vecの2種類の単語埋め込みモデルをそれぞれ用いて、合計10のヒンディ語NERシステムを構築した。これらのモデルは、BERTおよびその変種を用いたTransformerベースの文脈依存型NERモデルと比較された。本研究では、これらのすべてのNERモデルについて包括的な比較分析を行った。最終的に、最も優れたモデルを選定し、Webアプリケーションを構築した。このアプリケーションは、任意の長さのヒンディ語テキストを入力として受け取り、各単語に対してNERタグを返す機能を備えている。さらに、ユーザーからのタグの正誤に関するフィードバックを収集する仕組みも設けた。これらのフィードバックは、今後のデータ収集に活かされる。