HyperAI

Nach Der Betrachtung Von 50.000 Albumcovern Gibt Der KI-Designer Verrückte Ergebnisse Aus

vor 4 Jahren
Wahre Nerven
Information
神经小兮
特色图像

Der spanische Künstler nutzte StyleGAN2, um einen KI-Designer zu erschaffen, der sich mithilfe von 50.000 Bildern selbst das Design beibrachte. Er hätte nicht erwartet, dass es so einfach sein würde, einen impressionistischen Designer auszubilden.

Vielleicht sind einige Designs so klassisch und herausragend, dass die Leute gar nicht anders können, als sie nachzuahmen.

Vorgestern veröffentlichte Meng Jia, der mit „Riding the Wind and Waves“ in die Öffentlichkeit gelangt war, einen neuen Song, und das Albumcover wurde beschuldigt, genau das Plagiat einer Instagram-Berühmtheit zu sein;
Kurz darauf wurde auch darauf hingewiesen, dass das Styling-Design der Schauspielerin Song Zuer das Albumcover eines koreanischen Stars auf Pixelebene kopiert hatte und nicht einmal das ursprüngliche Wasserzeichen entfernt worden war. Man sieht, dass Designkreativität tatsächlich nicht einfach ist.

Internetnutzer sortierten Vergleichsbilder von Plagiatsvorfällen

Wer kreativ tätig ist, dem geht irgendwann einmal die Inspiration aus.Beabsichtigen oder unabsichtlichen Bezug auf die Werke anderer nehmen, daraus leihen oder sie imitieren. „Kann das, was ein Künstler tut, als Diebstahl betrachtet werden?“
Angesichts der Verurteilung durch die Internetnutzer verlor nicht nur der Star sein Gesicht, sondern auch der Designer seinen Ruf.

50.000 Albumcover, KI-Designer hat es sich selbst beigebracht

Obwohl beides sekundäre Schöpfungen nach dem Kopieren sind, scheint KI mit Werkzeugattributen gerechtfertigter zu sein.

Der spanische Geniekünstler Bruno López, basierend auf 50.000 Albumcover auf Spotify haben es NVIDIAs StyleGAN2 ermöglicht, selbstständig zu lernen. „Entwickelt“ sich zu einem „emotionslosen, abstrakten Albumcover-KI-Designer“.

Zufällig generiertes Albumcover von StyleGAN2

StyleGAN2 hat aus 50.000 Spotify-Albumcovern schnell einen eigenen Satz von Design-Spezifikationen und Stilgenres erstellt.
Das eigentliche Albumcover besteht grundsätzlich aus zwei Teilen.Text und wichtigste visuelle Elemente.

Der Trainingsprozess der KI ähnelt der Art und Weise, wie Menschen „in Bildern nach Mustern suchen“. Im Layout des AlbumcoversKI scheint sich auch mit Größenverhältnisstandards wie dem Goldenen Schnitt, der Fibonacci-Folge und der Drittelregel gut auszukennen.

Allerdings ist der Gesamtstil der von der KI generierten Albumcover etwas „seltsam“, und manche Cover können sogar als „schrecklich“ bezeichnet werden: ein abscheuliches menschliches Gesicht, ein Auge ohne Augapfel und ein Hintergrund, bei dem nicht klar ist, ob es sich um Wellen oder Tierkadaver handelt … ganz zu schweigen von dem verschwommenen Text und den düsteren Tönen.

Obwohl der Stil des von StyleGAN2 zufällig generierten Albumcovers einzigartig ist, sind Farbabstimmung und Layout relativ vernünftig.

Das Erscheinungsbild dieser Artefakte hängt nicht nur vom Stil der Trainingsbeispiele ab, sondern auch vom Modell selbst. Denn diese 50.000 Trainingsdaten stammen alle aus der redaktionellen Empfehlungsliste von Spotify.Es gibt keine Einschränkung hinsichtlich des musikalischen Kunststils, was zu unzureichenden Trainingsdaten für einen einzelnen Stil und starken Artefakten und Flecken führt.

BildDurch die Verwendung der Standardisierung anstelle der Normalisierung in StyleGAN2 können Merkmalsartefakte in Bildern entfernt werden

StyleGAN ist eine neue Generator-Netzwerkstruktur, die von NVIDIA veröffentlicht wurde. Dieses Modell greift auf die entsprechende Technologie der Stilübertragung zurück, mit der die Hauptattribute des Zielobjekts Schicht für Schicht geändert werden können.

Aufgrund der Existenz einer Instanznormalisierung in AdaIN gehen während des Stilübertragungsprozesses einige wichtige Informationen der Eingabe verloren, was zur Existenz von Flecken und Artefakten in den generierten Bildern führt.

StyleGAN2 ist eine aktualisierte Version von StyleGAN, die die Qualität der generierten Bilder verbessert, das Auftreten von Feature-Artefakten erheblich reduziert und eine ausgefeiltere Detailverarbeitung ermöglicht.

Verwenden Sie KI, um das Cover zu zeichnen und ein Musikvideo zu erstellen

Um einen erfahrenen KI-Designer auszubilden, sind Trainingsdaten und vortrainierte Modelle unerlässlich. Bruno López stellte den Entstehungsprozess von „AI Designer“ vor und erstellte mit diesen Covern ein abstraktes MV (Musikvideo).

  Erstellen Sie einen Datensatz:
1.Die entsprechende API wurde in Spotify gefunden, die bei Angabe einer Album-ID mehrere Metadaten zurückgeben kann, einschließlich Albumcover.
2.Schreiben Sie ein Crawler-Skript, um die Albumbibliothek in der Empfehlungsliste des Spotify-Editors zu crawlen und das Albumcover herunterzuladen.
3.Erhalten Sie einen Datensatz mit etwa 50.000 Bildern und einer Auflösung von 640×640.

Rufen Sie die entsprechende API in Spotify auf

Trainingsprozess:

Die Autoren haben mit der Skyflynil-Implementierung des ursprünglichen StyleGAN2 in Google Colab Pro trainiert. Der Vorgang dauerte mehrere Tage und endete nach 50.000 Zyklen.

Sich bei der Erstellung eines groben Albumcovers einfach auf KI zu verlassen, ist in den Augen des großen Künstlers Bruno López nicht gut genug.

Das Timing-Video, das in den sozialen Netzwerken viral ging, gab ihm einen Geistesblitz.

  Erstellen Sie ein Kartenspiel-Video:

Der Autor hat ein auf lhzbrian basierendes Python-Skript geschrieben, um zufällige latente Vektoren zu erstellen und diese Vektoren dann zu interpolieren, um einen KI-generierten animierten Übergang zu erstellen.

Um die Animation mit dem Lied zu synchronisieren, hat der Autor geschickt PyDub verwendet, um die Interpolationsgeschwindigkeit mit der Beat-Lautstärke jedes Frames zu synchronisieren.

Schließlich kann das Skript mithilfe des Bildmoduls von Pillow und der Gesichtserkennungsfunktionen von OpenCV Bilder mit angegebenen Merkmalen (z. B. ein gelbes Albumcover ohne Gesichter) nur unter Verwendung des latenten Vektors generieren.

Bruno berücksichtigte auch das Erlebnis des Publikums. Schließlich hinterlässt ein Clip von wenigen Sekunden immer ein bleibendes Gefühl. Um den fertigen Film unterhaltsamer zu gestalten, kam Bruno auf die Idee der Permutationen und Kombinationen.

Er erstellte zunächst mehrere Clips mit unterschiedlichen Attributen und komprimierte diese anschließend mit Premiere zu einem Video.Dies ist der letzte „Interference Music Video“-Film.

Stil wandert, Kreativität wandert auch?

Wo verläuft in der Kunst die Grenze zwischen Schöpfung und Nachahmung?

Im Hinblick auf den kreativen Prozess beginnt die künstlerische Schöpfung mit dem Kopieren, dem Kopieren der Natur und dem Kopieren der Gesellschaft. Beim Erlernen der Erstellung von Albumcovern reproduziert StyleGAN2 den Prozess vom Kopieren anderer bis zur Entwicklung eines persönlichen Stils vollständig.

Der Maler Qi Baishi vertrat die Ansicht, die Schönheit der Kunst liege im „Gleichgewicht zwischen Ähnlichkeit und Unähnlichkeit“. Sein Malstil ist frisch, lebendig und einzigartig. Tatsächlich begann auch Herr Qi in seinen frühen Jahren damit, die Gemälde anderer Leute zu kopieren.Durch ständiges Betrachten, Kopieren und Nachdenken habe ich nach und nach meinen eigenen, persönlichen Stil gefunden.

CCTV-Dokumentationen zufolge kopierte Qi Baishi in seinen frühen Jahren auch die Gemälde anderer Leute.

Auf der anderen Seite plagiieren die „Träger der Designbranche“ auf Pixelebene, unterschreiben mit ihrem eigenen Namen und nutzen dies sogar für kommerzielle Zwecke. In Bezug auf Geschäftsfähigkeiten und Berufsethik sind diese Entwickler tatsächlich nicht so gut wie KI.

siehe:https://arxiv.org/pdf/1912.04958.pdfhttps://thenextweb.com/neural/2021/03/08/ai-music-video-deep-learning-algorithm-stylegan2-album-covers-spotify-gans/https://docs.google.com/document/d/1qePvtKTJ3lbpxKfiJ1cn0wAVLazza0Zux4Lb-aTHuBE/edit?usp=sharing