vor 8 Monaten

Zusammenfassung

Das Wahrnehmen multimodaler Informationen und das Durchführen von Dialogen mit Menschen ist ein langfristiges Ziel der Künstlichen Intelligenz. Prätraining wird allgemein als effektiver Ansatz für multimodale Dialoge angesehen. Dennoch ist aufgrund der begrenzten Verfügbarkeit multimodaler Dialogdaten die Forschung zu multimodal vortrainierten Dialogmodellen noch lückenhaft. Ein weiteres faszinierendes Herausforderung ergibt sich aus dem umfassenden Charakter multimodaler Dialoge, die verschiedene Modalitäten und Aufgaben umfassen. Zudem können neue Aufgabenformen in unvorhersehbaren Zeitpunkten in der Zukunft entstehen. Es ist daher entscheidend, dass entwickelte multimodale Dialogmodelle genügend Flexibilität besitzen, um solchen Szenarien anzupassen. In dieser Arbeit wird \textbf{PaCE} vorgestellt, ein vereintes, strukturiertes und kompositionales Framework für das Prätraining multimodaler Dialogue. Es nutzt eine Kombination mehrerer grundlegender Experten, um verschiedene dialogbezogene Aufgaben abzudecken, und kann unter Verwendung begrenzter Dialog- und umfangreicher nicht-dialogbezogener multimodaler Daten vortrainiert werden. Darüber hinaus schlagen wir eine fortschreitende Trainingsmethode vor, bei der alte Experten aus der Vergangenheit neuen Experten helfen können, ihre Fähigkeiten zu erweitern. Die experimentellen Ergebnisse zeigen, dass PaCE den aktuellen Stand der Technik auf acht Benchmarks für multimodale Dialoge erreicht.

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

vor 8 Monaten

Yunshui Li Binyuan Hui Zhichao Yin Min Yang Fei Huang Yongbin Li

Zusammenfassung

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

vor 8 Monaten

Yunshui Li Binyuan Hui Zhichao Yin Min Yang Fei Huang Yongbin Li

Zusammenfassung

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

Command Palette

PaCE: Einheitliche multimodale Dialog-Vorverarbeitung mit fortschreitenden und kompositionellen Experten

Yunshui Li Binyuan Hui Zhichao Yin Min Yang Fei Huang Yongbin Li

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

PaCE: Einheitliche multimodale Dialog-Vorverarbeitung mit fortschreitenden und kompositionellen Experten

Yunshui Li Binyuan Hui Zhichao Yin Min Yang Fei Huang Yongbin Li

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

PaCE: Einheitliche multimodale Dialog-Vorverarbeitung mit fortschreitenden und kompositionellen Experten

Yunshui Li Binyuan Hui Zhichao Yin Min Yang Fei Huang Yongbin Li

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters