L'année Prochaine, J'utiliserai L'ia Pour Écrire Des Distiques Pour Tout Le Village

À la fin de l'année, les 29 et 30 du douzième mois lunaire, chaque foyer commence à afficher des distiques de la Fête du Printemps. Récemment, diverses applications d'IA pour écrire des distiques du Festival du Printemps ont été lancées pour aider tout le monde à écrire des distiques du Festival du Printemps. Voulez-vous l'essayer ?
La Fête du Printemps touche à sa fin, êtes-vous toujours plongé dans l'ambiance festive ?
Chaque année, les 29 et 30 du douzième mois lunaire, chaque foyer décore des distiques rouges de la Fête du Printemps, et la Fête du Printemps commence officiellement.
Les distiques de la fête du printemps, également connus sous le nom de « distiques », « distiques de porte » et « distiques », sont une forme d'art propre à la langue chinoise et ont une longue histoire. En 2005, le Conseil d'État chinois a inscrit la coutume des distiques sur la première liste du patrimoine culturel immatériel national.
La chose la plus importante à propos des distiques est « l'appariement », ils doivent être bien équilibrés et avoir des tons harmonieux. Cependant, les compétences des hommes modernes en matière d’écriture de distiques sont bien inférieures à celles des lettrés et des poètes de l’Antiquité. Parfois, ils ne sont même pas capables de distinguer les distiques supérieurs et inférieurs. Et l’IA intelligente a appris à écrire des distiques toute seule.
700 000 données de distiques, apprenez à l'IA à écrire des distiques
Parmi les ensembles de données de couplets publics existants, l'ensemble de données de couplets publié par le blog _梨味斋散叶_ de Feng Zhongpu est le plus grand et le plus largement utilisé.

L'ensemble de données est divisé en ensemble d'entraînement, ensemble de test et vocabulaire.
Comme le montre l'extrait ci-dessus, l'ensemble d'entraînement est divisé en deux parties : entrée et sortie, qui sont les couplets supérieur et inférieur du couplet, correspondant un par un dans l'ordre, et l'ensemble de test est le même.
Les détails de l'ensemble de données sont les suivants :
jeu de données de couplets
Ensemble de données de couplets
Source des données :Feng Zhongpu_Légumes aromatisés à la poire
Quantité incluse :700 000 distiques
Format des données :.SMS Taille des données :59,7 Mo (27,4 Mo compressés)
adresse:https://orion.hyper.ai/datasets/14547
Cet ensemble de données est devenu un favori parmi les données de couplets et est utilisé par de nombreux ingénieurs et équipes d'IA comme ensemble de données de formation pour les modèles d'écriture de couplets. Les couplets du festival du printemps de Yuefu de Huawei sont également formés à l'aide de cet ensemble de données. Vous pouvez télécharger l'ensemble de données via l'adresse ci-dessus ou cliquer pour lire le texte original. Il y a cependant un petit regret : il n'y a pas de bannière horizontale dans cet ensemble de données, vous devez donc proposer vos propres idées.
IA : Il n’y a pas de couplet que je ne puisse pas trouver
Un ingénieur nommé Wang Bin a parcouru et utilisé l'ensemble de données de couplets, l'a formé pendant 4 jours avec une GTX 1080 Ti et a obtenu un modèle de correspondance automatique de couplets. COMMENT ÇA MARCHE ? Testons-le.

Adresse de test : https://ai.binwang.me/couplet/
L'ingénieur a également ouvert le projet sur GitHub :
https://github.com/wb14123/couplet-dataset
Un autre ingénieur a formé un modèle GPT-2 dans le domaine des distiques basé sur GPT2-Chinois et l'ensemble de données de distiques, qui peut générer automatiquement des distiques.
Il connecte sa version serveur au backend AINLP du compte public WeChat et peut être testé directement dans la boîte de dialogue.
Saisissez le mot-clé « écrire des distiques » pour déclencher la génération automatique des distiques. Par exemple, si vous saisissez « écrire des distiques Taureau », le modèle de distique continuera automatiquement à écrire en fonction de « Taureau » et donnera 3 distiques commençant par « Taureau » :

Saisissez « couplet + un ensemble de premiers distiques » pour obtenir trois ensembles de distiques, par exemple :

À l’heure actuelle, il semble que pour certains distiques classiques, l’IA puisse atteindre un parallélisme relativement net et une imagination riche. Pour la même première ligne, plusieurs deuxièmes lignes différentes peuvent apparaître. Cependant, pour certains mots qui n’apparaissent pas souvent dans les distiques, les performances de l’IA sont quelque peu arbitraires et tirées par les cheveux. Bien sûr, il est effectivement un peu difficile pour l’IA de parler d’« intelligence artificielle » ou de quelque chose comme ça.
Le couplet d'IA développé par l'équipe Huawei utilise également l'ensemble de données Couplet comme données de formation. Le modèle peut générer des couplets basés sur un sujet donné.Voici les résultats de la saisie des thèmes « Bonne année », « Sûr et sain » et « Devenez riche du jour au lendemain ».Vous pouvez faire glisser pour voir :

L'année prochaine, souhaitez-vous former votre propre modèle d'IA pour écrire des distiques du Festival du Printemps et écrire des distiques pour votre famille ?
Portail de téléchargement des jeux de données : https://orion.hyper.ai/datasets/14547