Wöchentliche Empfehlungen Der Redaktion | Der 7×24h AI Live Room Ist Da! Ein-Klick-Nutzung Des GPT-SoVITS-Tutorials Zum Stimmenklonen – Neu

📢📢 Gute Neuigkeiten! Gute Nachrichten! 📺「Super Neuro TV」 ist jetzt online auf bilibili~
„Super Neuro TV“ überträgt „rund um die Uhr“ praktische Kurse und Branchenkonferenzen im Bereich KI.Jede Woche veröffentlichen wir am Ende des Artikels eine Vorschau auf das Programm der nächsten Woche!
Klicken Sie hier, um zu sehen:http://live.bilibili.com/26483094
Flüstern,Karpathy, ein technischer Experte, der OpenAI vor einiger Zeit verlassen hat Der KI-Kurs „Let’s Build a GPT Tokenizer“ wird am kommenden Freitag (15. März) um 20 Uhr im Live-Übertragungsraum ausgestrahlt.Um es jedem zu erleichtern, das Projekt kennenzulernen, wurden die projektbezogenen Ressourcen minbpe auch auf der offiziellen Website von hyper.ai veröffentlicht. Kommen Sie, schauen Sie zu und lernen Sie~
Darüber hinaus hat die offizielle Website von hyper.ai diese Woche mehrere Datensätze zur Textstimmungsanalyse veröffentlicht, die jeder herunterladen und verwenden kann!
Vom 4. bis 8. März wurde die offizielle Website von hyper.ai schnell aktualisiert:
* Hochwertige öffentliche Datensätze: 10
* Community-Artikelauswahl: 4 Artikel
* Beliebte Enzyklopädieeinträge: 10
Besuchen Sie die offizielle Website:hyper.ai
Ausgewählte öffentliche Datensätze
1. Minbpe-Repository
Dieses Repository ist das Minbpe-Projektrepository von Karpathy, das klassenbasierte Tokenizer-Implementierungen wie BaseTokenizer und BasicTokenizer enthält. Diese Klassen sind darauf ausgelegt, grundlegende Funktionen für Training, Kodierung und Dekodierung sowie Hilfsfunktionen wie Speichern und Laden bereitzustellen.
Direkte Verwendung:
2. D4 Chinesischer Dialogdatensatz für den Chat zur Depressionsdiagnose
D4 ist ein chinesischer Dialogdatensatz für Chats zur Depressionsdiagnose. Es handelt sich um eine neue Art der Konversation, den sogenannten aufgabenbasierten Chat. Der Datensatz besteht aus 1.339 mehrstufigen Dialogen, einschließlich Dialogzusammenfassungen und Diagnoseergebnissen.
Direkte Verwendung:
3. dmsc_v2-Filmkritik-Datensatz
Der Datensatz enthält mehr als 2 Millionen Bewertungen oder Rezensionen zu 28 Filmen von mehr als 700.000 Benutzern. Geeignet für Empfehlungssysteme, Stimmungs-/Meinungs-/Kommentaranalysen und andere Aufgaben der Tendenzanalyse.
Direkte Verwendung:
4. Amazon Amazon-Benutzerbewertungsdatensatz
Der Datensatz enthält 7,2 Millionen Rezensionen oder Bewertungen von 1,42 Millionen Benutzern zu 520.000 Produkten in mehr als 1.100 Kategorien auf Amazon und kann für Aufgaben wie Empfehlungssysteme und Stimmungs-/Meinungs-/Rezensionstendenzanalysen verwendet werden.
Direkte Verwendung:
5. Dianping Dianping-Datensatz
Der Datensatz enthält 4,4 Millionen Bewertungen oder Beurteilungen von 540.000 Benutzern zu 240.000 Restaurants. Es kann für Aufgaben wie Empfehlungssysteme, Stimmungs-/Meinungs-/Kommentartendenzanalysen usw. verwendet werden.
Direkte Verwendung:
6. Weibo_senti_100k Sina-Sentiment-Microblog-Datensatz
Der Datensatz enthält mehr als 100.000 Sina Weibo-Posts mit Stimmungsanmerkungen, darunter etwa 50.000 positive und negative Kommentare.
Direkte Verwendung:
7. Online_shopping_10_cats 10 Kategorien von Online-Shopping-Bewertungsdatensätzen
Der Datensatz enthält Online-Shopping-Bewertungen in 10 Kategorien (Bücher, Tablets, Mobiltelefone, Obst, Shampoos, Wasserkocher, Mengniu, Kleidung, Computer und Hotels) mit insgesamt mehr als 60.000 Bewertungsdaten, darunter etwa 30.000 positive und negative Bewertungen. Es kann für Aufgaben zur Stimmungs-/Meinungs-/Kommentaranalyse verwendet werden.
Direkte Verwendung:
8. ChnSentiCorp Ctrip Hotelbewertungsdatensatz
Der Datensatz enthält mehr als 7.000 Hotelbewertungsdaten von Ctrip.com, darunter mehr als 5.000 positive und mehr als 2.000 negative Bewertungen.
Direkte Verwendung:
9. Waimai_10k-Datensatz zur Benutzerbewertung der Lebensmittellieferplattform
Dieser Datensatz stammt aus Nutzerbewertungen, die von einer Essenslieferplattform gesammelt wurden, darunter etwa 4.000 positive und etwa 8.000 negative Bewertungen. Kann zur Tendenzanalyse von Stimmungen/Meinungen/Kommentaren verwendet werden.
Direkte Verwendung:
10. Vier-Formen Vier-Formen-Datensatz
Der Datensatz enthält 16.000 Bilder von 4 Formen: Quadrat, Stern, Kreis und Dreieck. Jedes Bild ist 200 x 200 Pixel groß. Die Daten wurden mit einer Garmin Virb 1080p-Actionkamera erfasst.
Direkte Verwendung:
Weitere aktualisierte Datensätze dieser Woche finden Sie unter:
Community-Artikel
Um die Anforderungen an Genauigkeit und Geschwindigkeit der Defekterkennung im industriellen Bereich gleichzeitig zu erfüllen, hat das Team von Professor Zhang Jinxia von der School of Automation der Southeast University ein automatisches Defekterkennungsmodell für elektrolumineszierende Bilder von Photovoltaikzellen vorgeschlagen, das auf der Suche nach neuronalen Strukturen und der Wissensdestillation basiert und eine Genauigkeitsrate von 91,74% aufweist. Aktuell sind die Forschungsergebnisse auf arXiv veröffentlicht.
Den vollständigen Bericht ansehen:
Der Gründer von RVC (Retrieval based Voice Conversion) (GitHub-Konto: RVC-Boss) hat ein Sprachklonprojekt namens GPT-SoVITS als Open Source veröffentlicht, das nach seinem Start große Popularität erlangte. Indem Sie nur eine 5-sekündige Sprachprobe bereitstellen, können Sie eine geklonte Stimme mit einer Ähnlichkeit von 80%~95% erhalten. Derzeit wurde das Tutorial zur Modellbereitstellung auf der offiziellen HyperAI-Website veröffentlicht.
Klicken Sie hier, um mit dem Klonen zu beginnen:
Es ist wieder Zeit der „Two Sessions“! Im Arbeitsbericht der Regierung wurde ausdrücklich vorgeschlagen, die Aktion „Künstliche Intelligenz +“ zu starten. Auch NVK-Abgeordnete und PKKCV-Mitglieder aus allen Gesellschaftsschichten machten Vorschläge zum Thema KI. Dieser Artikel fasst die Vorschläge und Anregungen einiger großer Namen aus der Technologiebranche zusammen.
Den vollständigen Bericht ansehen:
Das „Seminar zur Anwendung von KI-Technologie in der Chemie- und Materialwissenschaftsforschung“ findet vom 23. bis 25. April in Zhengzhou, Henan, statt. Zahlreiche Branchenexperten werden ihre ausführlichen Ansichten zu den Herausforderungen, Aussichten und Möglichkeiten der Anwendung von KI im Bereich der Materialchemie teilen.
Interessierte Entwickler können auf den unten stehenden Link klicken, um sich anzumelden.
Registrierungslink:
Beliebte Enzyklopädieartikel
1. Laplace-Operator
2. Weltmodellierung
3. Bilder pro Sekunde (FPS)
4. Diffusionsmodell
5. Mensch-in-the-Loop (HITL)
Hier sind Hunderte von KI-bezogenen Begriffen zusammengestellt, die Ihnen helfen sollen, „künstliche Intelligenz“ zu verstehen:
Live-Streaming-Vorschau der Super Neuro B Station
Datum | Zeit | Inhalt |
11. März Montag | 10:00 | NVIDIAs Pressekonferenzen im Laufe der Jahre |
Dienstag, 12. März | 10:0018:00 | Zusammenstellungskurs zum maschinellen Lernen Tesla AI Day |
Mittwoch, 13. März | 10:00 | Google IO-Konferenzen im Laufe der Jahre |
Donnerstag, 14. März | 10:00 | Stanford HAI Symposium |
Freitag, 15. März | 10:0020:00 | MIT Deep Learning Kurs Lassen Sie uns einen GPT-Tokenizer bauen |
Samstag, 16. März | 10:00 | Harvard CS50-Kurs (2023) |
Sonntag, 17. März | 10:00 | Harvard CS50-Kurs (2022) |
Super Neuro TV sendet rund um die Uhr live. Klicken Sie hier, um die „elektronischen Gurken“ im KI-Bereich zu erhalten:
http://live.bilibili.com/26483094
Das Obige ist der gesamte Inhalt der Auswahl des Herausgebers dieser Woche. Wenn Sie über Ressourcen verfügen, die Sie auf der offiziellen Website von hyper.ai veröffentlichen möchten, können Sie uns auch gerne eine Nachricht hinterlassen oder einen Artikel einreichen!
Bis nächste Woche!
Über HyperAI
HyperAI (hyper.ai) ist eine führende Community für künstliche Intelligenz und Hochleistungsrechnen in China.Wir haben uns zum Ziel gesetzt, die Infrastruktur im Bereich der Datenwissenschaft in China zu werden und inländischen Entwicklern umfangreiche und qualitativ hochwertige öffentliche Ressourcen bereitzustellen. Bisher haben wir:
* Bereitstellung von inländischen beschleunigten Download-Knoten für über 1200 öffentliche Datensätze
* Enthält über 300 klassische und beliebte Online-Tutorials
* Interpretation von über 100 AI4Science-Papierfällen
* Unterstützt die Suche nach über 500 verwandten Begriffen
* Hosting der ersten vollständigen chinesischen Apache TVM-Dokumentation in China
Besuchen Sie die offizielle Website, um Ihre Lernreise zu beginnen: