HyperAI超神経

AI詩人は中秋節の芸術的構想を書くことができるだろうか?

6年前
情報
Dao Wei
特色图像

おそらく誰もが、古代の文人のように洗練された詩で自分の感情を表現できるようになりたいと願って、詩人になることを夢見ています。たとえば、中秋節には詩を書いて親戚や友人に祝福を送ります。しかし、詩を書くことは想像されているほど簡単ではありません。しかし、ファーウェイのノアの方舟研究所が発表した最新の「Yuefu AI」は、テーマが与えられれば数秒で詩を生成することができ、詩人になるという夢を人工知能技術によってすでに実現できる。さあ、詩を作りに来てください!

中秋節はいかがお過ごしでしたか?この再会と月見の祭典は、古今の無数の文人たちの心を動かし、多くの意味深い詩を残しました。

美しい花と満月の中秋節の美しい景色を前に、古代人はこう唱えました。 「明るい月が海を照らし、私たちは世界中でこの瞬間を共有します。」美しい詩ですが、今ではほとんどの人は自分の無限の感情をどうすることもできずに一文にすることしかできません。 「ああ、月が満月ですね。」

これはおそらく、「夕日と孤独なフクロウが一緒に飛ぶ、秋の水と空は同じ色です」と「なんて大きな鳥なんだろう」との距離だろう。

しかし、悲しまないでください。今では AI がこの距離を埋めるのに役立ちます。させて誰でも簡単に詩を暗唱して詩人になれます!

ファーウェイ、「岳府詩」ミニプログラムを開始

最近、Huawei EI Experience Spaceアプレットは、新機能「Yuefu Poetry」を開始しました。テーマを与え、文字数とジャンル(四行詩か詩)を選べば、あっという間に詩が作れます。たとえば、次のように入力します。 「中秋節」:

「月の感謝」:

「機械学習」:

「AI」:

言わなくても、これらの詩が AI によって書かれたものであることがわかりますか?今年の6月には、ファーウェイ・ノアの方舟研究所論文を発表しました「GPT ベースの中国古典詩の生成」では、モデルのトレーニング プロセスと結果の表示について詳しく紹介します。

一般に、この詩生成モデルの背後にある重要なテクノロジーは、強力な GPTモデル。

GPT は次のように構成されています。 OpenAI  提案された事前トレーニング済み自然言語モデルの中心的なアイデアは、最初にラベルなしのテキストを使用して生成言語モデルをトレーニングし、次に特定のタスクに従ってラベル付きデータを通じてモデルを微調整することです。チームはまず、大規模な中国語ニュース コーパスを使用して中国語 GPT モデルをトレーニングしました。次に、中国の古典詩をコーパスとして使用し、それを微調整して詩生成システム - Yuefu AI を完成させました。

ノアの箱舟チームは、四行詩や韻に加えて、アクロスティクスを生成することを学習するために微調整方法も使用しました。

また、このGPTモデルはAIが自ら詩を書くことを学習できるようにするため、詩に必要な単語数、リズム、レベル、コントラストの知識などは設定されていません。古代の詩のデータから独自に。

「岳府AI」と比べると、長年中国語を勉強しているのにまともな詩が書けない人間は本当に残念です。 

AI が詩の作曲を学習する過程の内訳

中国の古典詩の生成は、自然言語生成の分野における興味深い課題です。

フリーテキストの生成とは異なり、中国の古典詩は通常、形式と内容の点で特定の要件を満たす必要があります。例えば単語数、韻、等価性、コントラスト待って。また、詩全体のテーマに一貫性があり、一貫性があることも求められる内容です。

蘇軾の「水条格頭」はとてもキャッチーなので、今でも歌にされて歌われています。

また、中国古典詩には、五字四行詩、押韻詩、七字四行詩、押韻詩、さらには「萬江紅」「水貂歌頭」などの単語カードや対句など、さまざまな形式があります。したがって、人工知能手法を使用して中国の古典詩を生成するのは比較的複雑です。ファーウェイのノアの方舟研究所の科学者たちは、与えられた形式と特定のテーマでの詩生成の問題を研究することにより、事前トレーニング済みモデル GPT に基づく詩生成方法を提案しました。

メソッドの具体的な詳細は次のとおりです。「Yuefu AI」は基本モデルとしてTransformerを使用し、BERTソースコードに基づいて独自のGPTモデルを実装します。Transformer のサイズ構成は BERT-Base と同じで、BERT で公開されているトークン化されたスクリプトと中国語の語彙も使用します。テキスト生成のために、彼らはtruncatedを実装しました トップ K サンプリングさまざまなテキストを生成します。

「Yuefu AI」が生成した詩 3 編とオリジナルの詩 1 編


「Yuefu AI」の詩作学習は以下の3段階に分かれています。

フェーズ 1: データ処理

ファーウェイのノアの方舟研究所の GPT モデルは、中国語のニュース コーパスでトレーニングされています。データのトレーニングは主に次のように分けられます。事前トレーニングと微調整2段階。それを微調整するために、彼らは公的に入手可能な中国の古典詩を収集し、サンプル詩をフォーマットされたシーケンスに変換しました。

データトレーニングプロセス

第 2 段階: モデルのトレーニング

次に、ニュース コーパスを含むクラウド サービス上で GPT モデルを事前トレーニングしました。このプロセスには 90 時間かかりました。次に、4 つのステージを 8 台の NVIDIA V100 (16 GB) でトレーニングしました。トレーニングが完了すると、微調整が実行されて、すべての詩のトレーニング シーケンスがトランスフォーマーに入力され、自動回帰言語モデルがトレーニングされて、任意のシーケンスの確率が X を最大化するかどうかが観察されます。

第三段階:詩の生成

トレーニングが完了すると、モデルが適用され、要件に従って特定のトピックに関する詩が生成されます。彼らはまず形式と主題を次のように変換します。 [フォーム、識別子 1、件名、識別子 2]次に、初期シーケンスがモデルに与えられ、ボディ フィールドが 1 つずつデコードされます。

デコード プロセス中に、フォームの正確性を保証するための厳しい制約は必要ありません。代わりに、モデルはデコードできます。カンマとピリオドの位置を自動的に割り当てます。詩の生成が完了すると、 「イオス」プロセスを終了するためのトークン。

「Yuefu AI」は詩を作ることを学んだだけでなく、アクロスティック詩という新しいスキルも習得しました。

アクロスティックスの場合も、同じ方法でトレーニングが行われます。ただし、アクロスティック詩モデルをトレーニングする際、以前のトレーニング プロセスのテーマ (「きよしこの夜の考え」など) を詩の各文の最初の単語 (「ベッドは疑わしく、低く上げられている」など) に置き換えました。 。 

AI詩人がもたらす驚き

研究チームは、この方法によって得られた結果に驚きました。

彼らは、モデルがリズミカルな詩の複雑な組み合わせルールを学習したことを発見しました。このルールは、中国語を母語として通常の教育を受けている人にとっても習得するのが困難です(多くの学生が同じように感じていると思います)。

生成される四行詩や押韻詩では95%以上が良好な性能を発揮しますが、単語カードの点では若干劣ります。その理由は、四行詩や押韻詩に比べて、Cipai の形式が比較的複雑であり、学習サンプルの数が前者に比べてはるかに少ないためであると考えられます。

四行詩と押韻詩の両方に何千ものトレーニング サンプルがあり、単語カードは882種類しかありません。このうち、100 個を超えるトレーニング サンプルが含まれるのは 104 種類だけであり、最大のサンプルでも 816 個しか含まれていません。

「秋の思い」をテーマにシステムが生成する様々なジャンルの詩

さらに、特定のトピックでは、生成結果は通常非常に良好ですが、「機械翻訳」などの一部のトピックでは、トレーニング コーパスにほとんど表示されないため、詩を生成することが困難です。逆に「秋の思い」などのテーマは生まれやすいです。

チームが紹介したのは、この方法は、リカレント ニューラル ネットワーク (RNN) に基づく既存の方法よりもはるかに簡単です。そしてより良い詩を生み出すことができるのです。

AIはすでに詩の作り方を学習している

中国は詩の国だという人もいます。古来より、文人、詩人、文学芸術家は常に詩を書くことに熱中してきました。そして、理工系の学生の大多数は、恋愛感情を表現するためにテクノロジーを使い続けています。

2017年12月、清華大学チームが開発した詩ロボット 「九つの歌」彼はCCTV番組「Extreme Wit」に出演し、彼の詩は視聴者に大きな驚きをもたらしました。

「Nine Songs」はディープラーニングに基づいており、80万以上の詩を学習した後に詩を書くことを学びました。マルチモーダル入力、マルチジャンルとスタイル、人間とコンピューターのインタラクション作成モードの特徴があります。

古代の詩だけでなく、現代の詩もAIにとって問題ないようです。Microsoft Xiaobing が詩集を出版しました。海外では多言語で利用できるAI詩生成ツールもあります。 

AIは本当に詩を書くことができるのでしょうか、それともただ作っているだけなのでしょうか?

AIが詩を書くと、それを賞賛する人もいれば、批判する人もいます。

上海詩協会の理事、劉魯寧氏はかつて、人間はコンピュータに比べて詩を書く速度にはかなわないが、人間が一日で書く詩は、千ページの詩を書けるコンピュータにはかなわない、と語った。鄧万英監督はまた、AI詩の特徴は「詩はあるが章がない」ことだと述べた。

文学的思考が流れているときに文人や詩人が創作したものと比較すると、AIによって書かれた詩は、大量のテキストの中に詩のルールを発見し、完全ではあるが「つなぎ合わせ」た「感情のない作家」であると言えます。おそらく意味のない詩。

しかし、研究者にとって、AI 詩の執筆は技術的能力の実証というよりも、AI 詩の執筆の背後にある NLP テクノロジーの開発により多くの注意を払っています。

また、一般の人にとっても、AI詩作成ツールを使えば誰もが自分の感情を詩で表現することができ、エンターテインメントツールとしても優れています。 AIにも時間を与えて、AIが世界にさらなる驚きをもたらすことを信じましょう。

- 以上 -