HyperAIHyperAI

Command Palette

Search for a command to run...

Holo1-7B: Natürliche Sprache Lokalisiert UI-Elemente Präzise

Date

vor 7 Monaten

Size

76.57 MB

License

Apache 2.0

Paper URL

2506.02865

1. Einführung in das Tutorial

Holo1-7B ist ein visuelles Aktionssprachemodell (VLM), das von HCompany am 28. März 2025 für das Surfer-H-Webagentensystem veröffentlicht wurde. Es ist für die Interaktion mit Webschnittstellen wie ein menschlicher Benutzer konzipiert. Als Teil einer umfassenderen Agentenarchitektur kann Holo1 als Richtlinienmodell, Lokalisierungsmodell oder Validierungsmodell fungieren und den Agenten dabei unterstützen, die digitale Umgebung zu verstehen und zu manipulieren. Zugehörige Forschungsarbeiten sind verfügbar. Surfer-H trifft Holo1: Kostengünstiger Web-Agent mit Open Weights .

Dieses Tutorial verwendet eine einzelne RTX A6000-Karte als Ressource. Es bietet hauptsächlich zwei Anwendungsbeispiele: Lokalisierung und Navigation.

2. Projektbeispiele

Lokalisierung

Navigation

3. Bedienungsschritte

1. Klicken Sie nach dem Starten des Containers auf die API-Adresse, um die Weboberfläche aufzurufen

2. Anwendungsschritte

Wenn „Bad Gateway“ angezeigt wird, bedeutet dies, dass das Modell initialisiert wird. Da das Modell groß ist, warten Sie bitte etwa 2–3 Minuten und aktualisieren Sie die Seite.

2.1 Lokalisierung

2.2 Navigation

4. Diskussion

🖌️ Wenn Sie ein hochwertiges Projekt sehen, hinterlassen Sie bitte im Hintergrund eine Nachricht, um es weiterzuempfehlen! Darüber hinaus haben wir auch eine Tutorien-Austauschgruppe ins Leben gerufen. Willkommen, Freunde, scannen Sie den QR-Code und kommentieren Sie [SD-Tutorial], um der Gruppe beizutreten, verschiedene technische Probleme zu besprechen und Anwendungsergebnisse auszutauschen ↓

Zitationsinformationen

Die Zitationsinformationen für dieses Projekt lauten wie folgt:

@misc{andreux2025surferhmeetsholo1costefficient,
      title={Surfer-H Meets Holo1: Cost-Efficient Web Agent Powered by Open Weights}, 
      author={Mathieu Andreux and Breno Baldas Skuk and Hamza Benchekroun and Emilien Biré and Antoine Bonnet and Riaz Bordie and Matthias Brunel and Pierre-Louis Cedoz and Antoine Chassang and Mickaël Chen and Alexandra D. Constantinou and Antoine d'Andigné and Hubert de La Jonquière and Aurélien Delfosse and Ludovic Denoyer and Alexis Deprez and Augustin Derupti and Michael Eickenberg and Mathïs Federico and Charles Kantor and Xavier Koegler and Yann Labbé and Matthew C. H. Lee and Erwan Le Jumeau de Kergaradec and Amir Mahla and Avshalom Manevich and Adrien Maret and Charles Masson and Rafaël Maurin and Arturo Mena and Philippe Modard and Axel Moyal and Axel Nguyen Kerbel and Julien Revelle and Mats L. Richter and María Santos and Laurent Sifre and Maxime Theillard and Marc Thibault and Louis Thiry and Léo Tronchon and Nicolas Usunier and Tony Wu},
      year={2025},
      eprint={2506.02865},
      archivePrefix={arXiv},
      primaryClass={cs.AI},
      url={https://arxiv.org/abs/2506.02865}, 
}

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp