In Zukunft Wird Für Die Frühlingsfest-Gala Möglicherweise Kein Live-Moderator Mehr Benötigt.

Von Super Neuro
Bei der Online-Frühlingsfest-Gala 2019 am 28. Januar betrat ein virtueller KI-Moderator die Bühne, um die Show zu moderieren. Sa Beining, einer der Moderatoren auf derselben Bühne wie der AI-Ersatz, gab vor Ort bekannt, dass er bereit sei, „in den Ruhestand zu gehen“. Ist es wirklich an der Zeit, dass KI den Wirt ersetzt?
Bei der diesjährigen Online-Gala zum Frühlingsfest gaben vier virtuelle Moderatoren ihr Debüt: Sa Beining, Zhu Xun, Gao Bo und Long Yang. Alle vier Moderatoren teilten sich die Bühne mit ihren eigenen virtuellen Moderatoren, was der Party wirklich viel Spaß verlieh.
Zur Anzeige springen: Vier virtuelle Hosts
Wie im Video zu sehen ist, besteht eine große Ähnlichkeit zwischen dem virtuellen und dem realen KI-Host. Sie können nicht nur genauso gut wie Menschen Fragen beantworten und witzige Bemerkungen machen, sondern verfügen auch über eine entsprechende Körpersprache und jeder virtuelle Moderator hat unterschiedliche Ausdrucksmerkmale.
Was ist ein virtueller Host?
Es wird berichtet, dass der virtuelle Moderator, der dieses Mal bei der Internet Spring Festival Gala auftrat, PAI (Personal AI) von ObEN war, das ein virtuelles Spiegelmodell basierend auf dem Bild einer Person erstellen kann.

Die Kerntechnologien dieses Produkts liegen hauptsächlich in drei Bereichen:
Zunächst wird das visuelle Bild erstellt. Mithilfe des Fotos des Hosts, 3D-Scannern, 3DS MAX, MAYA und anderen 3D-Modellierungstools erstellt die KI ein Algorithmusmodell, um die Beziehung zwischen der Farbverteilung und der Strukturtiefe des Fotos zu verstehen und schließlich die Gesichts- und Körperform zu konstruieren.
Als nächstes folgt die Klangsynthese. Die von ihnen verwendete KI-Sprachtechnologie erfordert nicht die Sammlung einer großen Anzahl von Sprachbibliotheken. Es sind nur etwa ein Dutzend Sprachaufnahmen erforderlich. Das Klangmodell kann durch Merkmalsparameterextraktion, Transferlernen und andere Methoden erstellt werden.
Und schließlich: Gestalten Sie den virtuellen Host so realistisch wie möglich. Dies erfordert nicht nur, dass die visuellen Elemente zum Klang passen, sondern auch, dass sie personalisiert sind. Durch Sensoren und Bewegungsverfolgungsgeräte, kombiniert mit KI- und Motion-Capture-Training, kann der virtuelle Host je nach Entität mündliche Ausdrücke, Gesichtsausdrücke, Gesten, Körperbewegungen und Szeneninteraktionen simulieren.
Obwohl dies das erste Mal ist, dass KI in den Moderationsbereich Einzug hält, sind KI-basierte virtuelle Moderatoren weltweit schon häufiger aufgetreten.
Der erste KI-Nachrichtensprecher
Auf der fünften Internetkonferenz im November 2018 stellte die Nachrichtenagentur Xinhua einen neuen Reporter vor, den ersten virtuellen KI-Nachrichtensprecher. Qiu Hao, der Prototyp der KI, sagte: „Das Bild ist mein Bild, und der Ton passt auch zu meiner Stimme, aber ich habe diese Worte in der Sendung nie gesagt …“
Zur Uhr springen, virtueller KI-Moderator
In diesem Video können wir sehen, wie sich der Moderator mit seinem Akzent vorstellt und sein Gesicht und seine Lippen entsprechende Bewegungen im Einklang mit der Stimme machen. Ich muss sagen, es gab Überraschungen, aber ich war trotzdem ein wenig enttäuscht. Im Vergleich zu echten Ankern erkennt man auf den ersten Blick, dass es sich um ein mechanisiertes Produkt handelt. So wie es funktioniert, sind zum Verfassen von Pressemitteilungen immer noch Menschen erforderlich. Aber
Diese Art der technischen Unterstützung kommt von Sogous „Klontechnologie“. Der Schlüssel dieser Technologie besteht aus zwei Teilen: Sprachsynthese und Bilderzeugung.

Mithilfe der Sprachsynthesetechnologie kann das Maschinenmodell mithilfe einer kleinen Menge an Audiodaten die Sprecheigenschaften des Eingabeobjekts erlernen, Klangfarbe, Rhythmus, Emotionen und andere Aspekte erfassen und schließlich die Audioinformationen des Eingabetextes realisieren.
Bei der Bildgenerierung kommen Lernen und Konstruktion in Bereichen wie Gesichtserkennung, 3D-Gesichtsrekonstruktion und Ausdrucksmodellierung zum Einsatz, wodurch letztendlich eine Übereinstimmung zwischen den ausgegebenen Audio- und visuellen Informationen erreicht wird.
Abgesehen von diesen Kritikpunkten ist der größte Vorteil dieser Technologie die Möglichkeit, die Bildschirmklonfunktion zu realisieren. Das bedeutet, dass Sie auf Ihrem Fernseher, Tablet und Mobiltelefon sehen können, wie eine Person drei verschiedene Inhalte gleichzeitig überträgt.
Frühere KI-Anker
Zuvor gab es in Japan Berichte, dass sie auch einen KI-Anker entwickelt hätten.
Im April letzten Jahres war die Moderatorin der Sendung „NEWS CHECK 11“ beim japanischen Fernsehsender NHK eine niedliche Cartoon-KI-Moderatorin – „News Anchor Yomiko“.

Dieser Anker wurde mithilfe der CG-Technologie erstellt. Es lernte, aus einer großen Anzahl von Aufnahmen Phoneme zu zerlegen, lernte dann, Text zu erkennen und zu lesen und nutzte ihn schließlich zum Vorlesen der Nachrichten.
Darüber hinaus wurden Roboter auch als Nachrichtensprecher eingesetzt.
Der wunderschöne Roboter „Elika“, der von den Universitäten Osaka und Kyoto entwickelt wurde, diente im April 2018 auch als Nachrichtensprecher für den japanischen Fernsehsender NNN.
Die Figur „Elika“ ist ein 23-jähriges, schönes Mädchen. Sie erhält ein standardmäßiges weibliches Gesicht und ihre Sprechstimme wird auf Grundlage der Aufnahme des Synchronsprechers synthetisiert, was als sehr natürlich beschrieben werden kann.

Darüber hinaus verfügt es auch über ein erweitertes Dialogsystem. Beim Gespräch mit Menschen sammelt es Informationen über Mikrofone und Sensoren, nimmt die Stimme und Bewegungen des Gesprächspartners wahr, wendet sich dem Gesprächspartner zu und führt ein flüssiges Gespräch.
Seine Augen, sein Mund, sein Hals und 19 andere Teile können sich durch Luftdruck bewegen, um verschiedene Ausdrücke zu zeigen, und können auch einige einfache Bewegungen ausführen, die sehr lebensecht sind.
Wann wird der Host ersetzt?
Zurück zur Online-Frühlingsfest-Gala: Der Auftritt der vier frechen virtuellen Moderatoren erregte große Aufmerksamkeit und an der Haltung des Publikums lässt sich erkennen, dass sie ihnen sehr gut gefielen.
Werden sie also eine Gelegenheit für die Entlassung des Gastgebers sein? Vielleicht würden weder Xiao Sa noch Xiao Xiao Sa zustimmen.

Was den Akzent und die ungeschickten Gesichtsausdrücke bei Live-Nachrichtensendungen mit künstlicher Intelligenz betrifft, besteht noch Verbesserungsbedarf. Die einst in Japan beliebten Nachrichtenroboter haben die lokale Journalismusbranche nicht im großen Stil ersetzt. Sie befinden sich höchstens noch auf der Hilfs- und Romanebene.
Aus dieser Perspektive betrachtet, bescheren uns technologische Fortschritte tatsächlich neue und wunderbare Erfahrungen, doch in einer Ära wie dieser entwickeln sich Spielereien vielleicht schneller als die Realität.
Vielleicht wird der Tag der Ablösung irgendwann kommen, aber heute ist es definitiv nicht. Wir sollten davon ausgehen, dass die Menschen, wenn dieser Tag wirklich kommt, möglicherweise bereits herausgefunden haben, wie sie mit der KI zurechtkommen. Während des Frühlingsfests werden wir nicht nur sehen, wie KI die Frühlingsfest-Gala moderiert, sondern auch Shows aufführt. Was uns betrifft, müssen wir nur den Mund aufmachen und darauf warten, dass die KI uns füttert.
Vielleicht wird der Tag der Ablösung irgendwann kommen, aber heute ist es definitiv nicht. Wir sollten davon ausgehen, dass die Menschen, wenn dieser Tag wirklich kommt, möglicherweise bereits herausgefunden haben, wie sie mit der KI zurechtkommen. Während des Frühlingsfests werden wir nicht nur sehen, wie KI die Frühlingsfest-Gala moderiert, sondern auch Shows aufführt.
Was uns betrifft, müssen wir nur den Mund aufmachen und darauf warten, dass die KI uns füttert.