HyperAI超神経

自動要約

自動要約は、元の文書の重要なポイントを含む要約を作成するために、ソフトウェアを使用してテキスト文書を短縮するプロセスであり、現在は機械学習とデータマイニングの分野の一部であり、その目的はデータのサブセットを見つけることです。関連する「情報」が含まれています。

自動要約には現在、抽出と抽象化の 2 つの方法があります。抽出は、元のテキスト内の単語、語句、または文のサブセットに基づいて要約を形成し、抽象化は内部の意味表現を確立し、自然言語生成テクノロジーを使用して要約を作成します。人間の表現に近い要約。

抽象化プログラムが焦点を当てているものに基づいて、抽象化タスクには大まかに 2 つのタイプがあります。1 つ目は、記事などのコレクションまたは要約の一般的な要約の取得に焦点を当てたもので、2 つ目は、要約が特定のものであるクエリ関連の要約です。クエリのオブジェクト。

自動要約を評価する一般的な方法は、人間による要約と比較することです。要約は主に内部評価と外部評価、テキスト間とテキスト内に分けられます。

内部および外部の評価

内部評価は、要約システム自体をテストするために使用され、主に要約の一貫性と有益性を評価します。外部評価は、関連性などのタスクに対する要約の影響を含む、他のタスクの完了に対する要約の影響をテストすることに基づいています。評価と読解力。

テキスト間およびテキスト内

テキスト内メソッドは特定の要約システムの出力を評価しますが、テキスト間メソッドは複数の要約システムの出力の比較分析に焦点を当てます。