Mehrere-Passagen-Maschinelles Leseverständnis mit Quer-Passagen-Antwortverifizierung

Maschinelles Leseverständnis (MRC) auf realen Webdaten erfordert in der Regel, dass die Maschine eine Frage durch die Analyse mehrerer von einer Suchmaschine abgerufener Passagen beantwortet. Im Vergleich zu MRC auf einem einzelnen Textabschnitt ist das Mehrfachpassagen-MRC herausfordernder, da wir aus verschiedenen Passagen möglicherweise mehrere verwirrende Antwortkandidaten erhalten. Um dieses Problem zu lösen, schlagen wir ein neuronales Modell vom Typ „End-to-End“ vor, das es den Antwortkandidaten ermöglicht, sich gegenseitig basierend auf ihren Inhaltsrepräsentationen zu verifizieren. Insbesondere trainieren wir drei Module gemeinsam, die in der Lage sind, die endgültige Antwort basierend auf drei Faktoren vorherzusagen: der Antwortgrenze, dem Antwortinhalt und der übergeordneten Verifizierung der Antworten zwischen den Passagen. Die experimentellen Ergebnisse zeigen, dass unsere Methode den Baseline um einen großen Vorsprung übertrifft und sowohl auf dem englischen MS-MARCO-Datensatz als auch auf dem chinesischen DuReader-Datensatz eine Spitzenleistung erzielt, wobei beide für MRC in realen Anwendungsszenarien entwickelt wurden.