HPI-DHC am TREC 2018 Precision Medicine Track

Die TREC-PM-Challenge zielt auf Fortschritte im Bereich der Informationsgewinnung im Kontext der präzisionsmedizinischen Forschung ab. In diesem Beitrag beschreiben wir unsere experimentelle Setup sowie die erzielten Ergebnisse in der Ausgabe des Jahres 2018. Wir untersuchten die Anwendung von unüberwachten Themenmodellen, überwachten Dokumentenklassifikation sowie regelbasiertem Boosting und der Erweiterung von Suchbegriffen zur Suchzeit. Wir nahmen an den Unteraufgaben zu biomedizinischen Artikeln und klinischen Studien teil und erreichten dabei eine der drei höchsten Bewertungen. Unsere Ergebnisse zeigten, dass eine Suchbegriffserweiterung, die auf handgefertigten Regeln basiert, zu verbesserten Werten der Informationsgewinnungs-Metriken führt. Die Anwendung eines Klassifikators für präzisionsmedizinische Inhalte zeigte hingegen für die Unteraufgabe der biomedizinischen Abstracts keine erwartete Verbesserung. In Zukunft planen wir, verschiedene Terminologien einzuführen, um die handgefertigten Regeln zu ersetzen, und die Erkennung von Verneinungen zu untersuchen.