TeCNO: Chirurgische Phasenerkennung mit mehrstufigen zeitlichen Faltungsnetzwerken

Die automatische Erkennung chirurgischer Phasen ist eine herausfordernde und entscheidende Aufgabe, die das Potenzial besitzt, die Patientensicherheit zu verbessern und ein integraler Bestandteil intraoperativer Entscheidungsunterstützungssysteme zu werden. In diesem Artikel stellen wir erstmals in der Arbeitsablaufanalyse ein mehrstufiges zeitliches Faltungsnetzwerk (Multi-Stage Temporal Convolutional Network, MS-TCN) vor, das hierarchische Vorhersageverfeinerungen für die Erkennung chirurgischer Phasen ermöglicht. Verzögerungsfreie, dilatierte Faltungen erlauben ein großes Empfangsfeld sowie eine Online-Inferenz mit glatten Vorhersagen auch während mehrdeutiger Übergänge. Unser Ansatz wird umfassend an zwei Datensätzen von laparoskopischen Cholezystektomie-Videos evaluiert, sowohl mit als auch ohne Nutzung zusätzlicher Informationen über chirurgische Instrumente. Im Vergleich zu verschiedenen state-of-the-art LSTM-Ansätzen zeigt unser Verfahren eine überlegene Leistung und bestätigt die Eignung des vorgeschlagenen kausalen MS-TCN für die Erkennung chirurgischer Phasen.