Ressourcen - Vid2Seq: Großskaliges Vortraining eines visuellen Sprachmodells für dichte Videozusammenfassung | Paper | HyperAI

HyperAI

Hauptbereich

GPU

Konsole
Dokumente
Preise

Pulse

Neuigkeiten

Ressourcen

Fachartikel
Notebooks
Datensätze
Wiki

Benchmarks

SOTA
LLM-Modelle
GPU-Bestenliste

Community

Veranstaltungen

Tools

Über uns Nutzungsbedingungen Datenschutzerklärung
Deutsch

Command Palette

Search for a command to run...

HyperAI
Papers
Vid2Seq: Großskaliges Vortraining eines visuellen Sprachmodells für dichte Videozusammenfassung

vor 6 Monaten

Video Captioning

Multimodale Darstellung

Zusammenfassung Paper Benchmarks Ressourcen

google-research/scenic/tree/main/scenic/projects/vid2seq

Offiziell

jax

KastanDay/video-pretrained-transformer

pytorch

antoyang/VidChapters

pytorch

https://antoyang.github.io/vid2seq.html

Gestalten Sie die Zukunft der Künstlichen Intelligenz

Über uns

Über uns Hilfe zu Datensätzen

Produkte

Neuigkeiten Notebooks Datensätze Wiki

Links

© HyperAI

GitHub Discord X (formerly Twitter)

HyperAI

Hauptbereich

GPU

Konsole
Dokumente
Preise

Pulse

Neuigkeiten

Ressourcen

Fachartikel
Notebooks
Datensätze
Wiki

Benchmarks

SOTA
LLM-Modelle
GPU-Bestenliste

Community

Veranstaltungen

Tools

Über uns Nutzungsbedingungen Datenschutzerklärung
Deutsch

Command Palette

Search for a command to run...

HyperAI
Papers
Vid2Seq: Großskaliges Vortraining eines visuellen Sprachmodells für dichte Videozusammenfassung

vor 6 Monaten

Video Captioning

Multimodale Darstellung

Zusammenfassung Paper Benchmarks Ressourcen

google-research/scenic/tree/main/scenic/projects/vid2seq

Offiziell

jax

KastanDay/video-pretrained-transformer

pytorch

antoyang/VidChapters

pytorch

https://antoyang.github.io/vid2seq.html

Gestalten Sie die Zukunft der Künstlichen Intelligenz

Über uns

Über uns Hilfe zu Datensätzen

Produkte

Neuigkeiten Notebooks Datensätze Wiki

Links

© HyperAI

GitHub Discord X (formerly Twitter)

3.8k

3.8k

54

54

203

203