HyperAI

Jahresrückblick 2022 | Ausgereiftere KI, Disruptiverer Technologie-Karneval

vor 2 Jahren
Information
Jiaxin Sun
特色图像

Das Jahr 2022 geht unter Hustengeräuschen zu Ende. In diesem Jahr hat sich AIGC zum größten Außenseiter auf dem Gebiet der künstlichen Intelligenz entwickelt, ScienceAI verfügt über mehr praktische Anwendungen, in diesem Jahr haben wir Budgetkürzungen und Entlassungen bei großen Herstellern erlebt und auch einen technologischen Karneval des Überlebens erlebt ... Dieser Artikel,Lassen Sie uns gemeinsam mit unseren Kollegen die bahnbrechenden Forschungs- und Entwicklungserfolge im Bereich der künstlichen Intelligenz im Jahr 2022 Revue passieren lassen.

data2vec

Ein allgemeiner Rahmen für das selbstüberwachte Lernen von Sprache, Sehen und Text

Verlag:Meta-KI

Veröffentlichungszeit:Januar 2022

Projektadresse:

https://github.com/facebookresearch/fairseq/tree/main/examples/data2vec

data2vec ist einEin einheitliches multimodales selbstüberwachtes Lernmodell,Es kann Bilder, Text, Sprache und andere Aufgaben mit höherer Leistung verarbeiten.

Am 16. Dezember wurde data2vec 2.0 veröffentlicht, das bei gleicher Genauigkeit 16-mal schneller ist als bestehende selbstüberwachte Computer Vision-Algorithmen.

Data2vec 2.0-Prinzipien

AlphaCode

KI zur Codegenerierung auf Wettbewerbsniveau

Verlag:DeepMind

Veröffentlichungszeit:Februar 2022

Projektadresse:

https://github.com/deepmind/code_contests

AlphaCode verwendet ein großes Sprachmodell, um Code basierend auf der Sprachbeschreibung des Problems zu erstellen.Bei der Codeforces-Challenge besiegte AlphaCode die Konkurrenten von 46%. Die Forschungsergebnisse schafften es nicht nur auf das Titelblatt von Science, sondern wurden von der Zeitschrift auch zu einem der zehn größten wissenschaftlichen Durchbrüche des Jahres gekürt.

AlphaCode Übersicht

Dall E 2

Tool zur Generierung von Text zu Bild

Verlag:OpenAI

Veröffentlichungszeit:April 2022

Projektadresse: https://openai.com/dall-e-2/

Dall·E 2 Basierend auf der Textbeschreibung können Sie künstlerische Bilder mit realistischeren Farben erstellen.Im Vergleich zum 2021 von OpenAI veröffentlichten Dall·E kann Dall·E 2 realistischere und genauere Bilder mit einer viermal höheren Auflösung erzeugen.

Ein Astronaut reitet auf einem Pferd in einem fotorealistischen Stil. Ein Beispiel für ein von Dall·E 2 generiertes Bild.

Katze

Intelligenter Allround-Agent

Verlag:DeepMind

Veröffentlichungszeit:Mai 2022

Projektadresse:

https://www.deepmind.com/blog/a-generalist-agent

Gato ist ein rundum intelligenter Agent.Es kann Atari-Spiele spielen, Bilder beschreiben, chatten und je nach Kontext Text, Gelenkdrehmoment oder andere Token ausgeben.

Dieses allgemeine Modell löst alle Aufgaben, die der künstlichen Intelligenz ähneln, und könnte irgendwann domänenspezifische Modelle übertreffen.

Fügen Sie eine Bildunterschrift hinzu, maximal 140 Zeichen (optional)

ESM-Falte

Modelle zur Vorhersage der Proteinstruktur

Verlag:Meta-KI

Veröffentlichungszeit:Juli 2022

Projektadresse:

https://github.com/facebookresearch/esm

ESM Fold ist ein Modell zur Vorhersage von Proteinsequenzen.Kann direkt hochpräzise, durchgängige Strukturvorhersagen auf atomarer Ebene durchführen. Es verwendet nur eine einzige Eingabesequenz und muss nur eine einzige Proteinsequenz betrachten, was die Inferenz erheblich beschleunigt.

Vorhersage einzelner Sequenzstrukturen mit ESM Fold

Mach ein Video

KI-System, das Videos aus Text generiert

Verlag:MetaAI

Veröffentlichungszeit:September 2022

Projektadresse: https://makeavideo.studio/

Make-A-Video ist ein Text-zu-Video-Generierungsmodell, das allgemeine Beschreibungen aus Bildern mit Textbeschreibungen lernt und Bewegungsmuster anhand unbeschrifteter Videos versteht und lernt.

Die von Make-A-Video generierten Videos weisen unterschiedliche Stile und eine hohe Textwiederherstellung auf, was es zu einem SOTA-Modell für die Generierung kurzer Videos macht.

Einige Beispiele für die Generierung von Videos basierend auf Textbeschreibungen

AlphaTensor

Verbessern Sie die Matrizenmultiplikation und erhöhen Sie die Berechnungsgeschwindigkeit

Verlag:DeepMind

Veröffentlichungszeit:Oktober 2022

Projektadresse:

https://github.com/deepmind/alphatensor

AlphaTensor verbessert die derzeit optimale 4*4-Matrixmultiplikation und verbessert darüber hinaus die Berechnungsgeschwindigkeit von mehr als 70 weiteren Matrixmultiplikationen unterschiedlicher Größe. Dieses Ergebnis wurde auf dem Cover von Nature veröffentlicht.Vom Scinece-Magazin zu einem der zehn größten wissenschaftlichen Durchbrüche des Jahres gekürt.

Übersicht über die AlphaTensor-Architektur

Magie 3D

Tools zur Text-zu-3D-Inhaltserstellung

Verlag:NVIDIA

Veröffentlichungszeit:November 2022

Projektadresse:

https://deepimagination.cc/Magic3D/

NVIDIA tritt der AIGC bei,3D-Mesh-Modelle können basierend auf Textbeschreibungen generiert werden.Es kombiniert Bildaufbereitungstechnologie und textbasierte Eingabeaufforderungsbearbeitungsmethoden, um eine neue Möglichkeit zur Steuerung der 3D-Synthese bereitzustellen und so die Erstellung hochwertiger 3D-Mesh-Modelle zu ermöglichen.

Magic 3D erstellt Text-zu-3D-Inhalte in zwei Schritten.

ChatGPT

Super-Konversationsmodell

Verlag:OpenAI

Veröffentlichungszeit:November 2022

Projektadresse:

https://openai.com/blog/chatgpt/

ChatGPT wird mit RLHF (Reinforcement Learning from Human Feedback) trainiert, derselben Methode wie InstructGPT, mit nur geringfügigen Unterschieden in der Einstellung zur Datenerfassung.

ChatGPT kann wie ein Mensch chatten und kommunizieren und Aufgaben wie das Schreiben von E-Mails, Videoskripten, Texten, Übersetzungen und Code erledigen. Seit seiner Einführung hat es unzählige Entwickler im In- und Ausland angezogen, die es ausprobiert und hitzig diskutiert haben, und man kann sagen, dass es im Jahr 2022 das Technologieprojekt mit der höchsten Entwicklerbeteiligung sein wird.

Übersicht über den ChatGPT-Schulungsprozess

Punkt E

Generieren Sie eine 3D-Punktwolke basierend auf einer Textbeschreibung

Verlag:OpenAI

Veröffentlichungszeit:Dezember 2022

Projektadresse:

https://github.com/openai/point-e

Der Prozess der Generierung einer 3D-Punktwolke auf Basis von Textaufforderungen mit Point·E gliedert sich in drei Schritte::

1. Generieren Sie eine synthetische Ansicht basierend auf der Textaufforderung

2. Generieren Sie eine grobe Punktwolke (1024 Punkte) basierend auf der synthetischen Ansicht

3. Generieren Sie eine feine Punktwolke (4096 Punkte) basierend auf einer Punktwolke mit niedriger Auflösung und einer synthetischen Ansicht

Mit einer einzigen Point·E-Karte können 3D-Punktwolken in 1 Minute generiert werden und Text-to-3D verabschiedet sich von der Ära des hohen Rechenleistungsverbrauchs.

Fügen Sie eine Bildunterschrift hinzu, maximal 140 Zeichen (optional)

Der Winter ist vorbei und der Frühling ist da, stellen wir uns 2023 vor

Das Jahr 2022 neigt sich dem Ende zu und 2023 wird voraussichtlich ein Jahr voller Unbekannter sein. Welche neuen Errungenschaften wird es im Bereich AIGC geben? Wie wird ScienceAI auf die Herausforderungen reagieren, die sich aus der Schnittstelle zwischen Grundlagenforschung und KI ergeben? Welche neuen Durchbrüche werden sich aus der Chipforschung und -entwicklung sowie aus inländischen Betriebssystemen ergeben?

Was sind Ihre Prognosen für die Technologien und Anwendungen im Bereich der künstlichen Intelligenz im Jahr 2023? Gerne können Sie eine Nachricht hinterlassen, um etwas zu besprechen ~

Chao Neuro bietet außerdem zahlreiche Artikel zur Entwicklung der künstlichen Intelligenz im vergangenen Jahr. Klicken Sie hier, um zu lesen ~