GRITv2: Effizient und leichtgewichtig zur Erkennung sozialer Beziehungen

Unsere Forschung konzentriert sich auf die Analyse und Verbesserung des graphbasierten Relation-Inferenz-Transformers (GRIT), der als wichtiger Referenzpunkt in diesem Bereich dient. Wir führen eine umfassende Ablationsstudie mit dem PISC-fine-Datensatz durch, um Effizienz- und Leistungsverbesserungen des GRITv2 zu identifizieren und zu untersuchen. Unsere Arbeit hat ein neues Standmodell für die Beziehungsidentifikation auf dem PISC-Beziehungsdatensatz bereitgestellt. Wir stellen mehrere Erweiterungen des GRIT-Modells vor und analysieren unsere neuen Benchmarks in zwei Versionen: GRITv2-L (groß) und GRITv2-S (klein). Das von uns vorgeschlagene GRITv2-L übertrifft bestehende Methoden bei der Beziehungsidentifikation, während das GRITv2-S nur 0,0625-fache Modellgröße und -Parameter wie das GRITv2-L besitzt, aber innerhalb eines 2%-igen Leistungsspielraums zum GRITv2-L liegt. Darüber hinaus adressieren wir auch die Notwendigkeit der Modellkompression, ein Bereich, der entscheidend ist für die Bereitstellung effizienter Modelle auf ressourcenbeschränkten Plattformen. Durch Anwendung von Quantisierungstechniken haben wir die Größe des GRITv2-S effizient auf 22 MB reduziert und es auf dem Topmodell OnePlus 12 mobilen Gerät bereitgestellt, wobei es weiterhin die PISC-fine-Benchmarks in Bezug auf Leistung übertrifft. Dies unterstreicht die praktische Machbarkeit und verbesserte Effizienz unseres Modells auf Mobilgeräten.