HyperAIHyperAI
vor 2 Monaten

CholecTriplet2021: Eine Benchmark-Herausforderung für die Erkennung von chirurgischen Aktionstrippeln

Nwoye, Chinedu Innocent ; Alapatt, Deepak ; Yu, Tong ; Vardazaryan, Armine ; Xia, Fangfang ; Zhao, Zixuan ; Xia, Tong ; Jia, Fucang ; Yang, Yuxuan ; Wang, Hao ; Yu, Derong ; Zheng, Guoyan ; Duan, Xiaotian ; Getty, Neil ; Sanchez-Matilla, Ricardo ; Robu, Maria ; Zhang, Li ; Chen, Huabin ; Wang, Jiacheng ; Wang, Liansheng ; Zhang, Bokai ; Gerats, Beerend ; Raviteja, Sista ; Sathish, Rachana ; Tao, Rong ; Kondo, Satoshi ; Pang, Winnie ; Ren, Hongliang ; Abbing, Julian Ronald ; Sarhan, Mohammad Hasan ; Bodenstedt, Sebastian ; Bhasker, Nithya ; Oliveira, Bruno ; Torres, Helena R. ; Ling, Li ; Gaida, Finn ; Czempiel, Tobias ; Vilaça, João L. ; Morais, Pedro ; Fonseca, Jaime ; Egging, Ruby Mae ; Wijma, Inge Nicole ; Qian, Chen ; Bian, Guibin ; Li, Zhen ; Balasubramanian, Velmurugan ; Sheet, Debdoot ; Luengo, Imanol ; Zhu, Yuanbo ; Ding, Shuai ; Aschenbrenner, Jakob-Anton ; van der Kar, Nicolas Elini ; Xu, Mengya ; Islam, Mobarakol ; Seenivasan, Lalithkumar ; Jenke, Alexander ; Stoyanov, Danail ; Mutter, Didier ; Mascagni, Pietro ; Seeliger, Barbara ; Gonzalez, Cristians ; Padoy, Nicolas
CholecTriplet2021: Eine Benchmark-Herausforderung für die Erkennung von chirurgischen Aktionstrippeln
Abstract

Kontextbewusste Entscheidungsunterstützung im Operationssaal kann durch die Nutzung von Echtzeit-Feedback aus der Analyse des operativen Arbeitsablaufs die operative Sicherheit und Effizienz fördern. Die meisten existierenden Arbeiten erkennen operative Aktivitäten auf grobkörniger Ebene, wie Phasen, Schritte oder Ereignisse, und lassen dabei feinkörnige Interaktionsdetails der operativen Aktivität außer Acht; diese Details sind jedoch für eine hilfreichere KI-Assistenz im Operationssaal erforderlich. Das Erkennen von operativen Aktionen als Triplette der Kombination liefert umfassende Details über die Aktivitäten in operativen Videos. Dieses Papier stellt CholecTriplet2021 vor: eine endoskopische Vision-Herausforderung, die bei MICCAI 2021 organisiert wurde, um Triplette von operativen Aktionen in laparoskopischen Videos zu erkennen. Die Herausforderung gewährte privaten Zugang zum groß angelegten CholecT50-Datensatz, der mit Informationen zu Aktionstriplett annotiert ist. In diesem Artikel präsentieren wir die Aufbaustruktur der Herausforderung sowie die Bewertung der Stand-of-the-Art-Tiefenlernmethoden, die während der Herausforderung von den Teilnehmern vorgeschlagen wurden. Es werden insgesamt 4 Baseline-Methoden der Herausforderungsorganisatoren und 19 neue Tiefenlernalgorithmen von wettbewerbsorientierten Teams vorgestellt, um Triplette von operativen Aktionen direkt aus operativen Videos zu erkennen, wobei mittlere Durchschnittsgenauigkeiten (mAP) zwischen 4,2 % und 38,1 % erreicht wurden. Diese Studie analysiert auch die Bedeutung der durch die präsentierten Ansätze erzielten Ergebnisse, führt einen gründlichen methodologischen Vergleich zwischen ihnen durch sowie eine detaillierte Ergebnisanalyse und schlägt eine neuartige Ensemble-Methode zur verbesserten Erkennung vor. Unsere Analyse zeigt, dass die Analyse des operativen Arbeitsablaufs noch nicht gelöst ist und interessante Richtlinien für zukünftige Forschungen zur feinkörnigen Erkennung von operativen Aktivitäten aufzeigt, was für die Entwicklung von KI in der Chirurgie äußerst wichtig ist.