HyperAI초신경

이번 춘절에는 춘절 연을 쓰는 데 도움이 되는 AI 도구 3가지를 추천합니다.

6년 전
헤드라인
추천 목록
정보
Dao Wei
特色图像

Super Neuro의

—-

기대됩니다, 기대됩니다, 춘절이 다가옵니다. 올해 춘절에는 기대할 만한 것이 있나요? 부모님이 결혼이나 아이를 낳으라고 재촉하기 전에 집에서 먼저 예의 바르게 행동하는 게 좋습니다.

예를 들어, 집에 춘절 연을 쓰고 싶거나 친척과 친구들에게 줄 연을 몇 개 맞춤 제작하고 싶다면, 연을 쓰는 데 도움을 줄 수 있는 로봇이 여기 세 대 있습니다. 그것에 대해 알아보도록 하겠습니다.

연을 쓸 수 있는 AI

지금은 2019년인데, 갑자기 연을 써줄 AI를 찾고 싶다는 생각이 떠올랐습니다. 전능한 인터넷의 도움으로 저는 실제로 세 가지 AI 도구를 찾았습니다.

Microsoft의 Couplet AI는 Microsoft Research Asia의 웹 제품입니다. 이는 2004년의 자동 연의 아이디어에서 유래되었습니다.

수년에 걸쳐 많은 변경을 거쳐 2015년에 최신 버전이 출시되었으며, 이제 구절을 맞추는 작업을 빠르게 완료할 수 있습니다.

그리고 다양한 옵션이 제공될 것입니다. 그래도 만족스럽지 않다면 각 단어에 대해 여러 가지 선택지가 제공됩니다. 가장 사용자 친화적인 점은 필요에 따라 좋아하는 단어를 삽입할 수 있다는 것입니다.

이것은 간단한 웹 연작 체계이며, 숨겨진 엔지니어의 "연습 프로젝트"라고 합니다.

2017년 10월에 출시되었으며, 하루 종일 행복을 가져다준다는 평을 받으며 출시 후 예상치 못하게 대중의 사랑을 받았습니다. 일부 네티즌은 테스트 영상을 특별히 촬영해 빌리빌리에 업로드하기도 했습니다.

사용 방법도 매우 간단합니다. 당신에게 연의 첫 줄을 주면, 그것은 즉시 두 번째 줄로 대답할 것입니다. 협상의 여지가 없으며, 깨끗하고 깔끔합니다.

저자는 인터넷에서 수백만 개의 커플릿 데이터 세트를 크롤링하고 seq2seq 모델을 사용하여 체인을 걸었습니다. 그는 현재 도구 외에도 작업 완료 후 자신의 데이터 세트와 모델을 Github에 오픈 소스로 공개했습니다.

이는 AI 쌍문 분야의 새로운 참가자입니다. 일주일 전에 탄생한 AI 모델이며, 공개 계정에 연결되어 있습니다. 작가는 연을 여러 개 본 후 자신의 기량을 보여주고 싶어서 이 작품을 만들었습니다.

방법은 공식 계정의 백그라운드에서 "첫 번째 연의 내용을 입력하세요"라고 답장하는 것입니다. 그러면 두 번째 연이 나옵니다. 물론, 두 번째 구절이 떠오르지 않는 경우도 있습니다.

첫 번째 줄을 입력하는 것을 잊어버리면 배경은 채팅 로봇입니다.

이것은 당나귀인가 말인가? 그것을 꺼내서 쌍을 만들어 보세요

이 세 가지 AI 도구의 효과를 비교하기 위해 여러 차례의 테스트를 진행했으며, 출력 순서는 Microsoft 쌍문, Wang Bin 쌍문, AINLP 쌍문의 결과였습니다.

  • 1라운드: 페이페이 리(Fei-Fei Li)는 누구인가?

이번 라운드에서는 글자를 읽기가 조금 어려웠던 WeChat 로봇을 제외하고 나머지 두 참가자는 꽤 평범했습니다.

  • 2라운드: 왕쓰총이 핫도그를 먹는다

교장의 행동에 대해 AINIP 로봇은 대답을 하지 못하고 곧바로 귀여운 행동을 하기 시작했습니다. 하하하하, AI는 쓰총이 얼마나 부자인지 정말 모르는 것 같군요.

  • 3라운드: 인공지능이 춘절 연을 쓴다

이번 라운드에서는 세 가지 모두 고유한 특성을 가지고 있습니다. 마이크로소프트가 준 "삼차신경"은 웃음을 터뜨릴 정도이고, AINLP의 "기적적인 장인정신"도 약간 혼란스럽고, 두 번째인 "자유"는 약간 밋밋한 느낌이 듭니다.

  • 4라운드: 첫 연: 지는 해와 외로운 기러기가 함께 날아간다

이 고전적인 문장에 대한 왕빈의 답변은 너무 얄밉다. (실제로 Microsoft에서도 옵션에 표준 답변을 제공합니다)

  • 5라운드: 첫 연: 폭죽 소리가 묵은 해에 작별을 고합니다.

본론으로 돌아와서 춘절 연을 써보도록 하겠습니다.

하지만 지난 라운드의 결과를 보면 문 앞에 걸어두는 용도로도 쓸 수 있을 듯합니다.

AI가 춘절 연을 쓰도록 훈련시키는 방법은?

이러한 가젯을 살펴보면, 우리는 기본적으로 중국 전통 문화에서 고대 시, 연뿐만 아니라 대조 연과 같은 언어 단위도 매우 강력한 규칙성을 가지고 있으며, 이는 기계를 통한 학습에 매우 적합하고 쉽게 자동화될 수 있다는 것을 알 수 있습니다.

  1. 인코더-디코더 모델 사용

인코더-디코더 프레임워크는 텍스트 처리 분야의 연구 모델로 볼 수 있으며, 적용 시나리오가 매우 다양합니다.

추상 인코더-디코더 프레임워크

인코더-디코더 프레임워크는 직관적으로 다음과 같이 이해할 수 있습니다. 이는 한 문장(또는 문단)에서 다른 문장(또는 문단)을 생성하는 처리에 적합한 일반적인 처리 모델로 볼 수 있습니다. 문장 쌍의 경우, 목표는 입력 문장 X가 주어졌을 때 인코더-디코더 프레임워크를 통해 목표 문장 Y를 생성하는 것입니다. X와 Y는 같은 언어이거나 두 개의 다른 언어일 수 있습니다. X와 Y는 각자의 단어 시퀀스로 구성됩니다.

이름에서 알 수 있듯이 Encoder는 입력 문장 X를 인코딩하고 비선형 변환을 통해 입력 문장을 중간 의미 표현 C로 변환합니다.

디코더의 경우, 그 작업은 문장 X의 중간 의미 표현 C와 이전에 생성된 역사적 정보 y1, y2….yi-1을 기반으로 시간 i에서 생성될 단어 yi를 생성하는 것입니다.

각 yi는 이런 방식으로 차례로 생성되므로 전체 시스템이 입력 문장 X를 기반으로 대상 문장 Y를 생성하는 것처럼 보입니다.

이 시나리오는 전형적인 인코더-디코더 프레임워크 응용 프로그램 문제입니다. 여러분이 해야 할 일은 Encoder-Decoder 프레임워크의 특정 모델을 구성하는 것뿐입니다. 예를 들어, Encoder와 Decoder는 모두 RNN 모델을 사용합니다.

인코더-디코더는 하위 링크를 생성합니다.

이 모델을 훈련하려면 대량의 연 데이터를 찾은 다음, 이 모델을 사용하여 첫 번째 연을 입력하면 기계가 자동으로 두 번째 연을 생성합니다.

인코더-디코더 프레임워크와 어텐션을 함께 사용하면 두 번째 줄의 품질이 크게 향상될 것입니다. 그 이유는 엄격한 병렬성이 필요하기 때문입니다. 따라서 두 번째 줄에서 특정 단어를 생성할 때, 첫 번째 줄에서 해당 단어를 찾는 것은 생성을 위한 핵심 참고 정보로서 매우 중요합니다.

예를 들어, 주의 모델이 첫 번째 연에서 "三"이라는 글자를 보면, 해당 글자를 생성할 때 두 번째 연의 "一"이라는 글자에 초점을 맞춥니다. 해당 문자는 숫자형 한자여야 한다는 것을 알아야 합니다.

주의 모델

이를 위해 인코더-디코더를 사용하면 한자 간의 대조 관계를 잘 학습할 수 있지만, 생성된 두 번째 연의 의미가 일관성을 유지하도록 하는 방법은 반드시 좋은 해결책은 아닙니다. 이것은 무슨 뜻인가요? 즉, 기계가 "풍운삼척도(風雲三谷刀)"의 첫 번째 줄을 보면 "비풍만척도(雨風千尺刀)"라는 줄을 제시할 가능성이 매우 높다는 뜻입니다. 개별적으로 보면 각 단어는 잘 어울리는 것처럼 보이지만, 전체적으로 보면 의미론이 그다지 조화롭지 않은 것 같습니다. (참고: 사실, 이 두 번째 줄을 생각해 낸다면, 사실 꽤 영웅적인 일이 아닐까요? 이는 사람들이 상상력을 발휘하여 연속된 단어를 적절한 맥락으로 결합한다는 사실과 관련이 있습니다.)

기본적으로 Encoder-Decoder는 디코딩 단계에서 언어 모델을 학습할 수 있으며, 언어 모델을 도입하면 두 번째 줄의 가독성과 언어적 일관성을 생성하는 데 매우 도움이 된다는 것은 자명한 사실입니다.

그러나 학습 데이터가 그렇게 크지 않다면, 많은 수의 고대 시를 사용하여 시 언어 모델을 학습시키고, 디코더 생성 단계에서 각 시간 노드 t에서 많은 후보 한자를 생성한 다음, 이 언어 모델 + 빔 검색을 사용하면 생성된 연은 일정한 의미적 일관성을 보장할 수 있을 것으로 생각합니다.

연을 생성할 때 실제로 상위 연과 하위 연의 중국어 문자의 음운 문제가 있는데, 이는 언어 모델과 유사한 후처리 단계로 걸러지고 필터링될 수도 있습니다.

  • 2. RNN을 사용하여 완료

RNN을 사용하여 고대 시의 언어 모델을 구축한 후, 이 RNN 언어 모델을 통해 첫 번째 연을 자동으로 생성합니다.

Figure는 완전 자동으로 쌍을 생성합니다.

또한, 연행에는 여전히 작은 문제가 남아 있는데, 그것은 연행의 가로 배너를 생성하는 방법입니다. 일반적으로 연은 상연과 하연의 주요 주제를 요약하는 수평 배너가 필요합니다.

실제로 아이디어는 비슷합니다. 위와 아래의 연은 하나의 전체로 인코더의 입력으로 간주될 수 있으며, 디코더는 가로 배너를 생성하는 데 사용될 수 있습니다. 이는 요약을 위해 인코더-디코더+어텐션을 사용하는 아이디어와 유사합니다.

참고문헌:

  • 1.https://blog.csdn.net/malefactor/article/details/51124732
  • "인코더-디코더 모델을 사용하여 쌍을 자동으로 생성하는 방법" - 장준린
  • 2.https://mp.weixin.qq.com/s/ettmrvz0SMpdBd5HU1xhnw
  • 위챗 공식 계정 '샹즈란'의 "최초 인공지능 커플링 경연대회"
  • 3.https://duilian.msra.cn/app/couplet.aspx
  • Microsoft Couplet 도구
  • 4.https://ai.binwang.me/couplet/
  • 왕빈 자동 커플릿 매칭 시스템
  • 5. 위챗 공개 계정 커플릿 도구: AINLP