来年はAIを使って村全体の連句を書きます

毎年年末の旧暦 12 月 29 日か 30 日に、各家庭で春節の対句が投稿され始めます。最近、春節の対句を書くのに役立つさまざまな AI 春節対句作成アプリケーションが次々にリリースされています。試してみませんか。
春節も終わりに近づいていますが、まだ新年の雰囲気に浸っていますか?
毎年旧暦 12 月 29 日または 30 日に、各家庭で赤い春節対句が飾られ、春節が正式に始まります。
「カップル」、「ドアペア」、「カップル」とも呼ばれる春対句は、中国語の独特の芸術形式であり、長い歴史があります。 2005 年、中国国務院は対句の習慣を国家無形文化遺産リストの第一陣に記載しました。
対句 対句は、きちんと対比され、バランスが取れている必要がある「対」に注意を払います。しかし、現代人の対句の組み合わせのスキルは古代の文人に比べてはるかに劣っており、場合によっては上下の対句を明確に区別することさえできない場合があります。そして賢いAIは自ら対句を書くことを学習しました。
70万個の対句データがAIにペアを教えます
既存の公開カプレット データセットの中で、Feng Zhongpu_Liweizhai Sanye_ のブログによって公開されているカプレット データセット データは、最大で最も広く使用されています。

データセットはトレーニングセット、テストセット、語彙に分かれています。
このうち、上図の抜粋に示すように、トレーニング セットは入力と出力の 2 つの部分に分かれており、それぞれカプレットの上部と下部が順番に 1 対 1 に対応しています。テストセット用。
データセットの詳細は次のとおりです。
カプレットデータセット
カプレットデータセット
データソース:Feng Chongpu_Liwezhai 粉末葉
含まれる数量:700,000対句
データ形式:。TXT データサイズ:59.7MB(圧縮時は27.4MB)
住所:https://orion.hyper.ai/datasets/14547
このデータ セットはカプレット データの中で「お気に入り」となっており、多くの AI エンジニアやチームによってカプレット モデルを作成するためのトレーニング データ セットとして使用されています。このデータ セットを使用してアクセスすることもできます。上記アドレスまたはクリックして原文を読み、データセットをダウンロードしてください。ただし、このデータセットには水平バッチがないため、独自のパフォーマンスを使用する必要があることが少し残念です。
AI: 私に理解できない対句はない
Wang Bin という名前のエンジニアは、カプレット データ セットをクロールして使用し、GTX 1080 Ti で 4 日間トレーニングし、自動カプレット モデルを取得しました。どれくらい効果があるのでしょうか?試してみましょう。

テストアドレス: https://ai.binwang.me/couplet/
エンジニアはまた、このプロジェクトを GitHub でオープンソースにしました。
https://github.com/wb14123/couplet-dataset
別のエンジニアは、GPT2-中国語と対句を自動的に生成できる対句データセットに基づいて、対句の分野で GPT-2 モデルをトレーニングしました。
サーバー バージョンを WeChat パブリック アカウント AINLP バックエンドに接続し、ダイアログ ボックスで直接テストできます。
キーワード「Write Counters」を入力すると、対句の自動生成をトリガーできます。たとえば、「Write Counters with Taurus」と入力すると、対句モデルは「Taurus」に基づいて自動的に書き込みを続け、「Taurus」で始まる 3 つの対句を提供します。

3 セットの対句を取得するには、「対句 + 上部対句のセット」と入力します。たとえば、次のようになります。

現時点では、一部の古典的な対句については、AI は、同じ最初の対句に対して、複数の異なる 2 番目の対句を生成でき、対句にあまり現れない単語については、AI のパフォーマンスがある程度向上しているようです。恣意的で突飛な。もちろん、AIが「人工知能」などを扱うのは確かに少し難しいです。
Huaweiチームが開発したAIカプレットも、トレーニングデータとしてCouplet-datasetカプレットデータセットを使用します。このモデルは、特定のトピックに基づいて対句を生成できます。以下は、それぞれ「明けましておめでとうございます」、「安全で健康」、「一晩で一攫千金」のテーマを入力した結果です。スワイプして表示:

来年、独自の AI モデルをトレーニングして、春節の対句を書いたり、家族のために対句を書いたりしたいですか?
データセット ダウンロード ポータル: https://orion.hyper.ai/datasets/14547