Mehr Als Herkömmliche OCR! Ein-Klick-Bereitstellung Von Googles Neuester Errungenschaft InkSight: Genaue Erkennung Von Handgeschriebenem Text, Kein Druck Auf Chinesisch Und Englisch

Früher lernten die Menschen zu Beginn ihrer Schulzeit zunächst die richtige Haltung beim Halten des Stifts. Anschließend lernten sie das Schreiben mit den grundlegenden arabischen Ziffern und dem chinesischen Pinyin und gingen dann schrittweise zu chinesischen Schriftzeichen und Englisch über. Oft ist der Schreibstil einer Person eng mit ihren Persönlichkeitsmerkmalen verbunden, von energisch und kraftvoll bis kühn und ungezügelt, von schön und elegant bis ruhig und friedlich ...
Heutzutage haben elektronische Aufzeichnungen auf Computern, Mobiltelefonen und Tablets in vielen Szenarien schnell die Handschrift ersetzt, und auch im Zuge des allgemeinen Trends zum Umweltschutz und zur Reduzierung des CO2-Ausstoßes schreitet die papierlose Aufzeichnung stetig voran. Handschriftliche Texte sind jedoch noch immer ein wichtiger Bestandteil des täglichen Lebens der Menschen, beispielsweise als Lernnotizen, für spontane Inspiration und Kreativität usw. Gleichzeitig werden alte Dokumente meist von Hand kopiert und ihre Konvertierung in ein elektronisches Format erleichtert die langfristige Speicherung oder den sofortigen Abruf.
Zu diesem Zweck ist die genaue Erkennung handgeschriebenen Textes von entscheidender Bedeutung.Bei unübersichtlichen Hintergründen oder verschwommener Handschrift weist die herkömmliche optische Zeichenerkennungstechnologie (OCR) häufig eine schlechte Leistung auf, was zu einer erheblichen Verringerung der Erkennungsgenauigkeit führt.
Vor Kurzem hat Google Research eine neue Errungenschaft veröffentlicht: InkSight. Es unterscheidet sich von OCR, da es lediglich Handschrift in Textdokumente überträgt.InkSight kann die Strichsammlung handschriftlicher Dokumente erfassen und die Erkennung handschriftlichen Textes auf natürlichere Weise realisieren.
Konkret schlugen die Forscher eine Rendering-Methode vor, mit der Bilder von handgeschriebenem Text aufgenommen und die Striche extrahiert werden können, ohne dabei auf typische geometrische Strukturen angewiesen zu sein (d. h., es werden Farbverläufe, Konturen und Formen in Bildern verwendet, um die Striche zu extrahieren).Das Trainingsmodell imitiert den Menschen, um "Lesen" und "Schreiben" zu verstehen.Erstere können geschriebenen Text erkennen, während Letztere handschriftähnliche Striche ausgeben und durch kontinuierliches Umschreiben und Lernen handgeschriebener Texte ein Verständnis für das Aussehen und die Bedeutung von Texten entwickeln können.
Jetzt,Im Tutorial-Bereich der offiziellen Website von HyperAI wurde die „InkSight-Demo zum Digitalisieren handgeschriebener Texte“ gestartet.Klonen Sie mit einem Klick und erleben Sie es online! Kommen Sie und konvertieren Sie Ihren "Tintenschatz" in ein elektronisches Format ~
Link zum Tutorial:
Demolauf
1. Melden Sie sich bei hyper.ai an, wählen Sie auf der Seite „Tutorials“ die Option „InkSight Digitize Handwritten Text Demo“ und klicken Sie auf „Dieses Tutorial online ausführen“.


2. Klicken Sie nach dem Seitensprung oben rechts auf „Klonen“, um das Tutorial in Ihren eigenen Container zu klonen.

3. Klicken Sie unten rechts auf „Weiter: Hashrate auswählen“.

4. Wählen Sie nach dem Seitensprung das Bild „NVIDIA GeForce RTX 4090“ und „PyTorch“ aus und wählen Sie je nach Bedarf „Pay as you go“ oder „Tages-/Wochen-/Monatspaket“ und klicken Sie auf „Weiter: Überprüfen“. Neue Benutzer können sich über den unten stehenden Einladungslink registrieren, um 4 Stunden RTX 4090 + 5 Stunden CPU-freie Zeit zu erhalten!
Exklusiver Einladungslink von HyperAI (kopieren und im Browser öffnen):
https://openbayes.com/console/signup?r=Ada0322_QZy7

5. Klicken Sie nach der Bestätigung auf „Weiter“ und warten Sie, bis die Ressourcen zugewiesen wurden. Der erste Klonvorgang dauert etwa 3 Minuten. Wenn sich der Status in „Läuft“ ändert, klicken Sie auf den Sprungpfeil neben „API-Adresse“, um zur Demoseite zu springen.Bitte beachten Sie, dass Benutzer vor der Verwendung der API-Adresszugriffsfunktion eine Echtnamenauthentifizierung durchführen müssen.
Da das Modell zu groß ist, müssen Sie, nachdem der Container anzeigt, dass er ausgeführt wird, etwa 1 Minute warten, bevor Sie die API-Adresse öffnen, da sonst „BadGateway“ angezeigt wird.



Effektanzeige
Nach dem Öffnen der Demo-OberflächeDas Tutorial ist in zwei Modi unterteilt: „Inferenz auf Wortebene“ und „Inferenz auf der gesamten Seite“.Hinweis: Die Worttranskription ist nur auf die Erkennung einzelner Zeichen oder Wörter anwendbar.
Ich habe mich blamiert, indem ich „Möge alles gut werden“ und einen klassischen Spruch aus „Forrest Gump“ handschriftlich geschrieben habe. Sowohl Chinesisch als auch Englisch wurden korrekt erkannt!



Wir haben eine „Stable Diffusion Tutorial Exchange Group“ eingerichtet. Willkommen, Freunde, treten Sie der Gruppe bei, um verschiedene technische Probleme zu diskutieren und Anwendungsergebnisse auszutauschen ~
Scannen Sie den unten stehenden QR-Code, um HyperaiXingXing zu WeChat hinzuzufügen (WeChat-ID: Hyperai01), und notieren Sie „SD Tutorial Exchange Group“, um dem Gruppenchat beizutreten.
