DeepPatent: Großskalige Erkennung und Abfrage von Patentzeichnungen
{Juan Castorena Diane Oyen Michal Kucer}

Abstract
Wir befassen uns mit dem Problem der Analyse und Abfrage technischer Zeichnungen. Zunächst stellen wir DeepPatent vor, eine neue, großskalige Datensammlung für die Erkennung und Abfrage von Designpatentzeichnungen. Die Datensammlung enthält über 350.000 Designpatentzeichnungen zur Bildabfrage. Im Gegensatz zu bestehenden Datensätzen bietet DeepPatent feinabgestimmte Abfragebeziehungen innerhalb der Sammlung von Zeichnungen und stützt sich nicht auf Querdomänen-Beziehungen zur Supervision. Wir entwickeln ein Baseline-Deep-Learning-Modell namens Patent-Net, das auf bewährten Praktiken für das Training von Abfragemodellen für statische Bilder basiert. Wir zeigen, dass Patent-Net, wenn es auf unseren feinabgestimmten Beziehungen von DeepPatent trainiert wird, eine überlegene Leistung gegenüber anderen Deep-Learning-Ansätzen und klassischen Computer-Vision-Deskriptoren erzielt. Mit der Einführung dieses neuen Datensatzes und benchmarkfähiger Algorithmen demonstrieren wir, dass die Analyse und Abfrage technischer Zeichnungen weiterhin eine offene Herausforderung im Bereich der Computer Vision darstellt; zudem zeigt sich, dass die Abfrage von Patentzeichnungen eine praktische Testumgebung darstellt, die die Forschung voranbringen kann.
Benchmarks
| Benchmark | Methodik | Metriken |
|---|---|---|
| image-retrieval-on-deeppatent | Res50 | mean average precision: 0.379 |
KI mit KI entwickeln
Von der Idee bis zum Start — beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und den besten GPU-Preisen.