HiRID-ICU-Benchmark -- Eine umfassende Maschinelles-Lernen-Benchmarkstudie an hochaufgelösten Intensivstationendaten

Der jüngste Erfolg von maschinellem Lernen bei der Analyse von Zeitreihen, die aus Intensivstationen (ICU) gesammelt wurden, zeigt das Fehlen standardisierter Benchmarks für das Entwickeln und Vergleichen solcher Methoden auf. Obwohl Rohdatensätze wie MIMIC-IV oder eICU auf Physionet frei zugänglich sind, wird die Auswahl der Aufgaben und die Vorverarbeitung oft für jede Veröffentlichung ad hoc getroffen, was den Vergleich zwischen Veröffentlichungen erschwert. In dieser Arbeit streben wir eine Verbesserung dieser Situation an, indem wir einen Benchmark bereitstellen, der ein breites Spektrum von ICU-bezogenen Aufgaben abdeckt. Unter Verwendung des HiRID-Datensatzes definieren wir mehrere klinisch relevante Aufgaben in Zusammenarbeit mit Ärzten. Zudem stellen wir einen reproduzierbaren End-to-End-Pipeline zur Verfügung, um sowohl Daten als auch Labels zu erstellen. Schließlich führen wir eine detaillierte Analyse aktueller Stand-of-the-Art-Sequenzmodellierungsmethoden durch und werfen dabei einige Einschränkungen tiefelernernder Ansätze für diese Art von Daten hervor. Mit diesem Benchmark hoffen wir, der Forschergemeinschaft die Möglichkeit eines fairen Vergleichs ihrer Arbeiten zu bieten.