Ein tiefes Relevanz-Matchings-Modell für ad-hoc-Retrieval

In den letzten Jahren haben tiefe neuronale Netze aufregende Durchbrüche in der Spracherkennung, Computer Vision und den Aufgaben der natürlichen Sprachverarbeitung (NLP) erzielt. Allerdings gab es bisher nur wenige positive Ergebnisse von tiefen Modellen bei ad-hoc-Retrieval-Aufgaben. Dies ist teilweise darauf zurückzuführen, dass viele wichtige Merkmale der ad-hoc-Retrieval-Aufgabe in tiefen Modellen noch nicht ausreichend berücksichtigt wurden. In der Regel wird die ad-hoc-Retrieval-Aufgabe in existierenden Arbeiten mit tiefen Modellen als ein Zuordnungsproblem zwischen zwei Textstücken formalisiert und gleichgesetzt mit vielen NLP-Aufgaben wie Paraphrasenerkennung, Fragebeantwortung und automatischer Konversation. Wir argumentieren jedoch, dass die ad-hoc-Retrieval-Aufgabe hauptsächlich um Relevanzzuordnung geht, während die meisten NLP-Zuordnungsaufgaben sich auf semantische Zuordnung konzentrieren, wobei es grundlegende Unterschiede zwischen diesen beiden Zuordnungsaufgaben gibt. Ein erfolgreicher Relevanzabgleich erfordert eine angemessene Behandlung von exakten Abgleichssignalen, der Bedeutung von Suchbegriffen und den vielfältigen Anforderungen an den Abgleich. In dieser Arbeit schlagen wir ein neues tiefes Relevanzabgleichsmodell (DRMM) für ad-hoc-Retrieval vor. Insbesondere verwendet unser Modell eine gemeinsame tiefe Architektur auf der Ebene der Suchbegriffe für die Relevanzzuordnung. Durch die Anwendung von Abgleichshistogrammabbildung, eines Feed-Forward-Abgleichsnetzes und eines Begriffsgating-Netzes können wir die drei oben genannten Faktoren des Relevanzabgleichs effektiv behandeln. Experimentelle Ergebnisse anhand zweier repräsentativer Benchmark-Sammlungen zeigen, dass unser Modell einige bekannte Retrieval-Modelle sowie state-of-the-art tiefere Abgleichsmodelle signifikant übertrifft.