HyperAI

Das „Black Box“-Problem Der Zeitreihenprognose Knacken! Die Huazhong University of Science and Technology Hat Eine CGS-Maske Vorgeschlagen, Um Die Wichtigsten Indikatoren Für Die Überlebensrate Von Patienten Aufzudecken

特色图像

Mit der weitverbreiteten Anwendung der KI-Technologie in unserem täglichen Leben,Die „Interpretierbarkeit“ des Modells ist allmählich zu einem Problem geworden, das angegangen werden muss.Insbesondere wenn es um Aufgaben geht, bei denen es um die Sicherheit von Menschenleben und Eigentum geht, untergräbt dieser „Black Box“-Algorithmus nicht nur das Vertrauen der Benutzer in KI-Systeme, sondern verursacht auch eine Reihe von Problemen, wie etwa Sicherheitsbeeinträchtigungen und Diskriminierung.

Dieses Problem tritt insbesondere bei Aufgaben zur Zeitreihenprognose auf.Die Zeitreihenprognose betrifft mehrere Schlüsselbranchen, unter anderem die Aktienmarktprognose, Krankheitsprognose, Energieprognose, Wettervorhersage usw. Bei Aufgaben in diesen Bereichen ist es von entscheidender Bedeutung, die Gründe für KI-Entscheidungen zu verstehen.Am Beispiel der Krankheitsvorhersage müssen Ärzte und Patienten nicht nur die Vorhersageergebnisse der KI kennen, sondern auch verstehen, wie diese Ergebnisse zustande kommen. Wenn sie klar aufzeigen können, welche Symptome bei der Diagnose eine Schlüsselrolle spielen, wird dies das Vertrauen von Ärzten und Patienten in die KI-gestützte medizinische Diagnose stärken.

Um die Vorhersage von Zeitreihen nicht nur zu einer genauen Zahl zu machen, sondern zu einem "sichtbaren" Prozess,Das Lu Feng-Team von der Huazhong University of Science and Technology hat zusammen mit dem Zomaya-Team von der University of Sydney und dem Tongji Hospital eine neue Methode vorgeschlagen: CGS-Mask.Durch die Kombination von Zeitreihenprognosen mit Interpretierbarkeit kann diese Methode nicht nur die Genauigkeit der Modellvorhersage verbessern, sondern auch die Prognoseergebnisse intuitiver und interpretierbarer machen.

Insbesondere kann das Modell durch die Einführung eines Maskierungsmechanismus hervorheben, welche Momente und welche Daten den größten Einfluss auf das Endergebnis haben, genau wie wichtige Schilder auf der Straße beim Fahren deutlich für Sie markiert werden, sodass Sie verstehen, warum Sie sich zum Abbiegen oder Abbremsen entschieden haben.Dieser Ansatz bietet ein breites Anwendungspotenzial in Bereichen wie Gesundheitswesen, Astronomie, Sensorik und Energie, insbesondere bei Aufgaben zur Zeitreihenprognose, die eine Interaktion mit Benutzern erfordern.

Diese Errungenschaft mit dem Titel „CGS-Mask: Zeitreihenvorhersagen für alle intuitiv gestalten“ wurde zur Veröffentlichung in den Proceedings der 38. AAAI-Konferenz für Künstliche Intelligenz (AAAI'24) angenommen, einer der weltweit führenden Konferenzen für Künstliche Intelligenz.

Forschungshighlights:

* Im Vergleich zu herkömmlichen Methoden kann CGS-Mask deutlicher zeigen, welche Zeiträume für die Prognoseergebnisse am wichtigsten sind und welche Faktoren nicht wichtig sind, wodurch es für Benutzer einfacher wird, den Prognoseprozess zu verstehen

* CGS-Mask eignet sich für verschiedene Aufgaben zur Zeitreihenprognose, insbesondere für solche, die eine Benutzerinteraktion und Erklärung der Ergebnisse erfordern, wie z. B. Börsenprognosen, Krankheitsvorhersagen und Wettervorhersagen.

* CGS-Mask ist anderen Methoden hinsichtlich Genauigkeit, Interpretierbarkeit und Intuition überlegen. Es reduziert das „Black Box“-Problem und verbessert die Transparenz des Modells. Durch diese Methode können auch Laien die Vorhersageergebnisse des Modells verstehen, was benutzerfreundlicher ist und die Anwendbarkeit und Glaubwürdigkeit des Modells erhöht.

* In Zukunft werden die Forscher CGS-Mask aktiv weiterentwickeln und daran arbeiten, die Anwendbarkeit von CGS-Mask in weiteren Zeitreihenanwendungen nachzuweisen, insbesondere im Gesundheitswesen, wo die Methode verwendet werden kann, um signifikante Merkmale aus Krankenakten zu identifizieren und so den Beginn, die Entwicklung und die Verschlechterung von Krankheiten aufzudecken.

Papieradresse:

https://ojs.aaai.org/index.php/AAAI/article/view/29325

Folgen Sie dem offiziellen Konto und antworten Sie mit „Zeitreihenprognose“, um das vollständige PDF zu erhalten

Das Open-Source-Projekt „awesome-ai4s“ vereint mehr als 100 AI4S-Papierinterpretationen und stellt umfangreiche Datensätze und Tools bereit:

https://github.com/hyperai/awesome-ai4s

Datensätze: Synthetische + reale Daten aus den Bereichen Gesundheitswesen, Astronomie, Sensoren und Energie

Die Forscher wählten vier synthetische Datensätze aus:Dabei handelt es sich um „seltene Merkmale“, „seltene Zeit“, „Mischung“ und „Zufall“.

* Die Datensätze mit seltenen Merkmalen und seltenen Zeiten enthalten eine kleine Anzahl signifikanter Merkmale bzw. eine kleine Anzahl signifikanter Zeitpunkte. 

* Der Mischungsdatensatz wird durch die Kombination seltener Merkmale und seltener Zeit erstellt

* random Die markanten Eingabebereiche des Datensatzes sind zufällig angeordnet

Die von den Forschern ausgewählten realen Datensätze sind: MIMIC-III-Datensatz, LSST-Datensatz, NATOPS-Datensatz und AE-Datensatz.Diese Datensätze decken Bereiche wie Gesundheitswesen, Astronomie, Sensoren und Energie ab und werden verwendet, um die Leistung von CGS-Mask in verschiedenen Bereichen zu bewerten.

MIMIC-III-Datensatz:Enthält Gesundheitsakten von 40.000 Patienten auf Intensivstationen (ICU), jeweils mit 31 Merkmalen, die zur Vorhersage der Überlebensrate des Patienten innerhalb der nächsten 48 Stunden verwendet werden. Dies ist eine binäre Klassifizierungsaufgabe, bei der das Ziel darin besteht, zu unterscheiden, ob ein Patient überleben oder sterben wird.

LSST-Datensatz:Simulieren Sie astronomische Zeitreihendaten zur Vorbereitung von Beobachtungen mit dem Large Synoptic Survey Telescope. Das Vorhersagemodell muss diese Daten in 14 verschiedene astronomische Kategorien einteilen.

NATOPS-Datensatz:Wird durch Gestenerkennungssensoren generiert, die Sensordaten von Hand, Ellbogen, Handgelenk und Daumen aufzeichnen. Diese Daten müssen in 6 verschiedene Gesten eingeteilt werden.

AE-Datensatz:Der Home Appliance Energy Forecasting-Datensatz aus dem UCI-Repository wird verwendet, um den Gesamtenergieverbrauch eines Hauses vorherzusagen. Dies ist eine Regressionsaufgabe und die Ausgabe des Vorhersagemodells ist ein numerischer Wert, der den gesamten Energieverbrauch darstellt.

Modellarchitektur: Durch die Optimierung von Balkenmasken bietet CGS-Mask klare und intuitive Erklärungen für Zeitreihenprognosen

CGS-Mask ist eine Salienzmethode, die auf der Cellular Genetic Strip Mask basiert. Durch die Kombination eines zellularen genetischen Algorithmus zur Optimierung der Streifenmaske kann das „Black Box“-Problem bei Aufgaben zur Vorhersage von Zeitreihen gelöst und die Interpretierbarkeit des Modells verbessert werden.

* Die Balkenmaske berücksichtigt aufeinanderfolgende Zeitschritte als Ganzes, um die Auswirkungen von Merkmalen zu bewerten, wodurch die zeitliche Abhängigkeit von Zeitreihendaten effektiv erfasst werden kann. Der Binärwert (0 oder 1) der Balkenmaske verbessert die Interpretierbarkeit der Ergebnisse und macht den Signifikanzwert intuitiver.

Die spezifischen Schritte zur Optimierung der Balkenmaske sind wie folgt: Erstellen Sie zunächst einen Satz von Balkenmasken und ordnen Sie diese dem Zellularautomaten zu. Optimieren Sie dann jede Maske mithilfe genetischer Operationen (wie Crossover, Mutation und Translation), um sie zur nächsten Generation weiterzuentwickeln. Nach N Generationenrunden wird die Maske mit dem höchsten Fitnesswert als optimale Maske ausgewählt. Der Gesamtrahmen von CGS-Mask ist in der folgenden Abbildung dargestellt:

Der Gesamtrahmen von CGS-Mask

Populationsinitialisierung:Eine Population von Balkenmasken wird zufällig initialisiert und diese Masken werden in einen zweidimensionalen Zellularautomaten abgebildet.

Fitnessbewertung:Für jede Balkenmaske wird ein Fitnesswert berechnet und anhand eines definierten Störungsfehlers bewertet, der den Einfluss der Maske auf die Modellvorhersagen misst.

Optimierung genetischer Operatoren: Jede Maske wird mithilfe genetischer Operatoren wie Crossover, Mutation und Translation optimiert.

* Crossover: Der Algorithmus führt eine Crossover-Operation zwischen benachbarten Masken durch, um eine neue Maske zu generieren. In CGS-Mask sind Streifen die Grundeinheit genetischer Operationen. Die Streifen der neuen Maske können von beiden übergeordneten Elementen übernommen werden.

* Mutation: Erhöhen Sie die genetische Vielfalt, indem Sie die Streifen in der Maske mit einer bestimmten Wahrscheinlichkeit ersetzen und verhindern Sie, dass der Algorithmus zu früh zur lokalen Optimallösung konvergiert.

* Übersetzung: Passen Sie den Positionsversatz des Streifens auf der Zeitleiste an, um die Streifenmaske zu optimieren. Dies hilft dabei, die Position der Bänder zu optimieren, sodass sie genauer auf die wirklich markanten Bereiche in den Eingabedaten ausgerichtet sind.

Iterative Entwicklung:Durch iteratives Anwenden der oben genannten genetischen Operatoren entwickeln sich die Masken in der Population kontinuierlich weiter, um Masken mit höheren Fitnesswerten zu finden.

Wählen Sie die optimale Maske:Nach N Iterationsrunden wird die Maske mit dem höchsten Fitnesswert als optimale Maske ausgewählt (Optimale Maske M*).

Durch die Kombination zellulärer Automaten und genetischer Algorithmen kann CGS-Mask Balkenmasken effektiv optimieren, um eine klare und intuitive Interpretation von Zeitreihenprognosen zu ermöglichen. Diese Methode erfordert keine internen Informationen des Modells, sodass sie auf verschiedene Black-Box-Modelle anwendbar ist und Benutzern schnell aussagekräftige Erklärungen liefern kann.

Experimentelles Fazit: CGS-Mask kann signifikante Merkmale, die sich im Laufe der Zeit verändern, effektiv identifizieren und Schlüsselfaktoren für die Entwicklung und Verschlechterung von Krankheiten aufdecken

Um die Leistung der CGS-Mask-Methode zu bewerten, verglichen die Forscher sie mit acht anderen hochmodernen Salienzmethoden sowohl anhand synthetischer als auch realer Datensätze. Zu diesen Methoden gehören Dynamask, DeepLIFT, RISE, FIT, Shapley Value Sampling (SVS), Feature Occlusion (FO), Feature Permutation (FP) und Integrated Gradient (IG). Wie in der Abbildung unten gezeigt,Experimentelle Ergebnisse zeigen, dass CGS-Mask eine höhere Genauigkeit bei der Bestimmung hervorstechender Merkmale aufweist, was darauf hindeutet, dass es bei der Identifizierung hervorstechender Merkmale, die sich im Laufe der Zeit ändern, wirksamer ist.

Vergleichsergebnisse anhand realer Datensätze

Am Beispiel der Anwendung im Gesundheitswesen wählten die Forscher den MIMIC-III-Datensatz, um die Überlebensrate des Patienten in den nächsten 48 Stunden vorherzusagen. Der Vergleich verschiedener Methoden ist in der folgenden Abbildung dargestellt. Abbildung f ist das Ergebnis der CGS-Maskenvorhersage. Der grüne Balken zeigt die wichtigsten Merkmale im Zusammenhang mit dem Patientenergebnis an.Studien haben ergeben, dass niedriger Blutdruck, Tachykardie und Kurzatmigkeit auf eine unmittelbare Todesgefahr hinweisen und Ärzte anhand dieser Merkmale rechtzeitig eingreifen können.Andere Vergleichsmethoden können jedoch den Zeitraum und die Merkmale, die zu diesem Ergebnis führen, nicht eindeutig identifizieren, wie in den Abbildungen (a)–(d) gezeigt.

Um die Lesbarkeit der generierten Masken zu bewerten, befragten die Forscher 254 Teilnehmer aus verschiedenen Altersgruppen (5–83 Jahre) und mit unterschiedlichem Fachwissen. Die Ergebnisse zeigen, dassMehr als 651 TP3T-Benutzer bewerteten CGS-Mask als die Methode, die ihnen am besten dabei half, hervorstechende Merkmale und ihre zeitlichen Zusammenhänge zu verstehen, und mehr als 851 TP3T-Benutzer platzierten sie unter den Top 3.

Darüber hinaus führten die Forscher eine Pilotbenutzerstudie durch, um die Reaktionszeit und Genauigkeit der Merkmalswichtigkeit bei der Bestimmung von vier Merkmalen (A, B, C und D) innerhalb von 10 Zeitschritten unter Verwendung von drei Salienzmasken (Q1, Q2 und Q3) zu bewerten. Wie in der folgenden Abbildung gezeigt, beträgt die durchschnittliche Reaktionszeit von Benutzern, die CGS-Maske (Q2) verwenden, 6,26 Sekunden und die Genauigkeit 85,4 %, während die durchschnittliche Reaktionszeit von Benutzern, die numerische Masken (Q1 und Q3) verwenden, 19,22 Sekunden beträgt und die Genauigkeit nur 40,6% beträgt.Dies deutet darauf hin, dass CGS-Maske Benutzern dabei helfen kann, die Wichtigkeit von Merkmalen schneller und mit höherer Genauigkeit zu identifizieren.

Benutzerreaktionszeit und Auswahlergebnisse

Zusammenfassend lässt sich sagen, dass CGS-Mask als modellunabhängige Salienzmethode nicht nur intuitiv und benutzerfreundlich ist, sondern auch Zeitreihenprognosen effektiv erklären kann. Es übertrifft bestehende Lösungen sowohl bei synthetischen als auch bei realen Daten.Insbesondere im medizinischen Bereich hat CGS-Mask hervorragende Fähigkeiten bei der Identifizierung signifikanter Merkmale in Krankenakten bewiesen, was für die Aufdeckung des Auftretens, der Entwicklung und der Verschlechterung von Krankheiten von großer Bedeutung ist und ein großes Anwendungspotenzial bietet.

Modernste Anwendungen von Zeitreihenvorhersagemodellen im medizinischen Bereich

Bei der Zeitreihenprognose handelt es sich um die Analyse von Daten mit einer zeitlichen Abfolge mit dem Ziel, durch die Erstellung von Modellen Trends, Saisonalität und zyklische Muster in den Daten zu erfassen. Diese Modelle können nicht nur die sich ändernden Muster historischer Daten vorhersagen, sondern auch zukünftige Entwicklungstrends analysieren. Ihre Anwendungsmöglichkeiten sind sehr breit gefächert und decken viele Bereiche ab, beispielsweise das Finanzwesen, die Meteorologie, die medizinische Versorgung, das Transportwesen und die Energieprognose.

Im medizinischen Bereich konzentriert sich der Erstautor dieses Artikels, Professor Lu Feng von der Huazhong University of Science and Technology, weiterhin auf die Anwendung von Sequenzvorhersagemodellen.Zusätzlich zu der oben genannten Forschung arbeitete sie auch mit einem Team der Universität Sydney zusammen, um einen Artikel mit dem Titel „A Composite Multi-Attention Framework for Intraoperative Hypotension Early Warning“ in den Proceedings der 37. AAAI-Konferenz über künstliche Intelligenz (AAAI'23) zu veröffentlichen.

Originalarbeit:
https://ojs.aaai.org/index.php/AAAI/article/view/26681

In diesem Artikel schlugen die Forscher ein Follow-up-Warnsystem für intraoperative Hypotonie vor, das auf Multimodalität und Aufmerksamkeitsmechanismen basiert. Experimente mit zwei umfangreichen realen Datensätzen zeigen, dass mit dieser Methode eine Genauigkeit von bis zu 94,1% für die Frühwarnung vor intraoperativen Hypotonie-Ereignissen erreicht werden kann, während gleichzeitig der Bedarf an Signalabtastrate um das 3.000-fache reduziert wird. Darüber hinaus erreichte das multimodale Framework bei der anspruchsvollsten 15-minütigen Vorhersage des mittleren arteriellen Drucks einen mittleren absoluten Fehler von 4,48 mmHg, was einer Fehlerreduzierung von 42,91 % im Vergleich zu bestehenden Lösungen entspricht.

In ähnlicher Weise hat ein Forschungsteam der Nanjing Medical University ein Zeitreihenmodell entwickelt.Wird verwendet, um das Auftreten von Hepatitis vorherzusagen. Mithilfe saisonaler autoregressiver gleitender Durchschnittsmodelle und saisonaler exponentieller Glättungsmodelle analysierten sie die Anzahl der Fälle verschiedener Hepatitistypen.

Studien haben ergeben, dass der März jedes Jahres die Hochsaison für verschiedene Hepatitis-Typen ist. In den letzten zehn Jahren war bei der Häufigkeit von Hepatitis A im Allgemeinen ein Abwärtstrend zu beobachten. die Inzidenz von Hepatitis B schwankte und hat in den letzten Jahren zugenommen; die Zahl der Hepatitis-C-Fälle ist weiter gestiegen; und die Inzidenz von Hepatitis E ist im Wesentlichen stabil geblieben. Diese Erkenntnisse bilden eine wichtige Grundlage für die Entwicklung wirksamerer Maßnahmen zur Prävention und Bekämpfung von Hepatitis. Die Studie mit dem Titel „Zeitreihenanalyse und Prognose von vier Hepatitis-Epidemietrends in China von 2012 bis 2021“ wurde im Journal of Nanjing Medical University (Natural Sciences) veröffentlicht.

Zusammenfassend lässt sich sagen, dass die Anwendung der Zeitreihenvorhersagetechnologie im medizinischen Bereich großes Potenzial gezeigt hat. Angesichts des kontinuierlichen Fortschritts in Wissenschaft und Technologie und der zunehmenden Datenfülle freuen wir uns darauf, in Zukunft noch innovativere Modelle und Methoden zur Zeitreihenvorhersage zu sehen, die einen größeren Beitrag zur Gesundheit und zum Wohlbefinden der Menschen leisten.

Quellen:
https://mp.weixin.qq.com/s/8gYtFqcuctY0BqBYa1e_Hg

Empfehlen Sie abschließend eine wissenschaftliche Tätigkeit! Klicken Sie auf das Bild für weitere Details ↓