vor 8 Monaten

Zusammenfassung

Die Inferenz von Metainformationen über Tabellen, wie etwa Spaltenüberschriften oder Beziehungen zwischen Spalten, ist ein aktives Forschungsthema im Bereich der Datenverwaltung, da wir feststellen, dass viele Tabellen einige dieser Informationen fehlen. In dieser Arbeit untersuchen wir das Problem der Annotation von Tabellenspalten (d.h., die Vorhersage von Spaltentypen und den Beziehungen zwischen Spalten) unter Verwendung nur der Informationen aus der Tabelle selbst. Wir entwickeln einen Multi-Task-Lernrahmen (genannt Doduo), der auf vorgefertigten Sprachmodellen basiert und die gesamte Tabelle als Eingabe verwendet, um Spaltentypen und -beziehungen mit einem einzigen Modell vorherzusagen. Experimentelle Ergebnisse zeigen, dass Doduo neue Standarts in der Leistung auf zwei Benchmarks für die Aufgaben der Spaltentypvorhersage und der Spaltenbeziehungsvorhersage aufstellt, mit Verbesserungen von bis zu 4,0 % und 11,9 % jeweils. Wir berichten, dass Doduo bereits die bisherige beste Leistung mit einer minimalen Anzahl an Token übertreffen kann – lediglich 8 Token pro Spalte. Wir stellen ein Toolset bereit (https://github.com/megagonlabs/doduo) und bestätigen die Effektivität von Doduo durch eine Fallstudie anhand eines realen Data-Science-Problems.

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

vor 8 Monaten

Multi-Task-Lernen

Transformer

Natürliche Sprachverarbeitung

Ansatz/Rahmenwerk

Natürliche Sprachverarbeitung

Aufgabe

Yoshihiko Suhara Jinfeng Li Yuliang Li Dan Zhang Çağatay Demiralp Chen Chen Wang-Chiew Tan

Zusammenfassung

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

vor 8 Monaten

Multi-Task-Lernen

Transformer

Natürliche Sprachverarbeitung

Ansatz/Rahmenwerk

Natürliche Sprachverarbeitung

Aufgabe

Yoshihiko Suhara Jinfeng Li Yuliang Li Dan Zhang Çağatay Demiralp Chen Chen Wang-Chiew Tan

Zusammenfassung

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

Command Palette

Spalten mit vorab trainierten Sprachmodellen annotieren

Yoshihiko Suhara Jinfeng Li Yuliang Li Dan Zhang Çağatay Demiralp Chen Chen Wang-Chiew Tan

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

Spalten mit vorab trainierten Sprachmodellen annotieren

Yoshihiko Suhara Jinfeng Li Yuliang Li Dan Zhang Çağatay Demiralp Chen Chen Wang-Chiew Tan

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

Spalten mit vorab trainierten Sprachmodellen annotieren

Yoshihiko Suhara Jinfeng Li Yuliang Li Dan Zhang Çağatay Demiralp Chen Chen Wang-Chiew Tan

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters