HyperAIHyperAI

Command Palette

Search for a command to run...

Pixelweise Erkennung für eine ganzheitliche Verständnis chirurgischer Szenen

Zusammenfassung

Diese Arbeit präsentiert den Holistic and Multi-Granular Surgical Scene Understanding of Prostatectomies (GraSP)-Datensatz, ein sorgfältig zusammengestelltes Benchmark-Dataset, das das Verständnis chirurgischer Szenen als Hierarchie komplementärer Aufgaben mit unterschiedlichen Granularitätsstufen modelliert. Unser Ansatz umfasst langfristige Aufgaben, wie die Erkennung chirurgischer Phasen und Schritte, sowie kurzfristige Aufgaben, darunter die Segmentierung chirurgischer Instrumente und die Detektion atomarer visueller Aktionen. Um das vorgeschlagene Benchmark-Dataset optimal auszunutzen, führen wir das Transformers for Actions, Phases, Steps, and Instrument Segmentation (TAPIS)-Modell ein, eine allgemeine Architektur, die einen globalen Videofeature-Extractor mit lokalisierten Regionen-Vorschlägen aus einem Instrument-Segmentierungsmodell kombiniert, um die Multigranularität des Benchmarks zu bewältigen. Durch umfangreiche Experimente sowohl an unserem als auch an alternativen Benchmarks zeigen wir die Vielseitigkeit und den state-of-the-art-Performance von TAPIS bei verschiedenen Aufgaben. Diese Arbeit stellt einen grundlegenden Fortschritt im Bereich der endoskopischen Vision dar und bietet einen innovativen Rahmen für zukünftige Forschung im Bereich des umfassenden Verständnisses chirurgischer Szenen.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp