HyperAI超神経

計算言語学

計算言語学は、数理モデルを用いて自然言語を解析・処理し、その解析・処理過程をコンピュータ上のプログラムで実現することで、人間の言語能力の一部、あるいは全部を機械で模擬する学問です。

基本的な内容

計算言語学は、その仕事の性質と複雑さに応じて、次の 3 つのカテゴリに分類できます。

  1. 自動オーケストレーション: これはコンピューターが最も得意とすることであり、計算言語学の最も成熟した部分です。各種言語資料の統計・分類・整理、各種単語帳・索引・辞書の編集、コーパス・用語データベースの構築等。
  2. 自動分析: これは、より複雑な言語の自動処理です。この自動解析システムは、あらかじめコンピュータに保存された特定の言語情報に基づいて動作し、所定の結論を導き出すことを目的としています。
  3. 自動学習: これは、言語のより複雑な自動処理です。この種の自動調査システムは、コンピューターに保存されている一般的な言語情報に基づいて機能し、統計、比較、類推、その他の手段を利用して独自の推論結論を導き出します。

応用

計算言語学の核心は、言語の自動理解と自動生成です。前者は、文表面の単語記号列から文の構文構造を特定し、構成要素間の意味関係を判断し、最終的に意味を理解します。文は表現から始まり、単語の意味に基づいて単語を選択し、単語間の意味関係に従って各構成要素間の意味構造と構文構造を構築し、最終的に文法と論理に準拠した文章を作成します。

計算言語学は、科学研究と技術研究の 2 つのレベルに分かれています。科学研究の目的は、言語固有の法則を発見し、言語の理解と生成のための計算手法を探索し、言語情報処理の基礎リソースを構築することです。応用目標に応じて、社会の実際のニーズに応じて実用的な言語情報処理システムを設計および開発します。