vor 6 Monaten

Zusammenfassung

Hochauflösende dichte Vorhersagen ermöglichen zahlreiche ansprechende Anwendungen in der realen Welt, wie beispielsweise computergestützte Fotografie oder autonomes Fahren. Allerdings verursachen die immensen Rechenkosten eine erhebliche Herausforderung bei der Bereitstellung modernster hochauflösender dichter Vorhersagemodelle auf hardwarebasierten Geräten. In dieser Arbeit stellen wir EfficientViT vor, eine neue Familie hochauflösender Visionmodelle mit neuartigem multiskalarem linearem Attention. Im Gegensatz zu früheren Modellen, die auf rechenintensive Softmax-Attention, hardwareunfreundliche große Kernel-Faltungen oder komplizierte Topologiestrukturen setzen, um gute Leistungen zu erzielen, erreicht unser multiscales lineares Attention sowohl einen globalen Empfindungsfeldbereich als auch multiskalare Lernfähigkeit – zwei erwünschte Eigenschaften für hochauflösende dichte Vorhersagen – mit lediglich leichtgewichtigen und hardwareeffizienten Operationen. Dadurch erzielt EfficientViT bemerkenswerte Leistungsverbesserungen gegenüber vorherigen State-of-the-Art-Modellen und gleichzeitig signifikante Geschwindigkeitssteigerungen auf unterschiedlichen Hardwareplattformen, einschließlich mobiler CPUs, Edge-GPUs und Cloud-GPUs. Ohne Leistungsverlust auf Cityscapes erreicht EfficientViT eine bis zu 13,9-fache und 6,2-fache Reduktion der GPU-Latenz gegenüber SegFormer und SegNeXt, respektive. Für die Super-Resolution erzielt EfficientViT bis zu 6,4-fache Geschwindigkeitssteigerung gegenüber Restormer, wobei gleichzeitig eine Verbesserung von 0,11 dB im PSNR erreicht wird. Für Segment Anything erreicht EfficientViT eine bis zu 48,9-fach höhere Durchsatzleistung auf einer A100-GPU und gleichzeitig eine leicht bessere Leistung bei der Zero-Shot-Instanzsegmentierung auf COCO.

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

vor 6 Monaten

Transformer

Computer Vision

Semantische Segmentierung

Ansatz/Rahmenwerk

Computervision

Aufgabe

Han Cai Junyan Li Muyan Hu Chuang Gan Song Han

Zusammenfassung

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

vor 6 Monaten

Transformer

Computer Vision

Semantische Segmentierung

Ansatz/Rahmenwerk

Computervision

Aufgabe

Han Cai Junyan Li Muyan Hu Chuang Gan Song Han

Zusammenfassung

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

Command Palette

EfficientViT: Multi-Scale Linear Attention für hochauflösende dichte Vorhersagen

Han Cai Junyan Li Muyan Hu Chuang Gan Song Han

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

EfficientViT: Multi-Scale Linear Attention für hochauflösende dichte Vorhersagen

Han Cai Junyan Li Muyan Hu Chuang Gan Song Han

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

EfficientViT: Multi-Scale Linear Attention für hochauflösende dichte Vorhersagen

Han Cai Junyan Li Muyan Hu Chuang Gan Song Han

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters