Wöchentliche Empfehlungen Der Redaktion | Kostenlose Sora-Alternative, Online-Grundlagen-Tutorial Zu Python, MCFEND-Datensatz Zur Erkennung Chinesischer Fake News Veröffentlicht

Nach ChatGPT hat OpenAI ein weiteres explosives Produkt veröffentlicht – das Sora-Videomodell. Während andere Modelle noch damit kämpfen, das Kontinuitätsproblem innerhalb weniger Sekunden zu überwinden, hat Sora die Videolänge bereits auf 60 Sekunden verlängert. Allerdings ist das Sora-Modell derzeit nur einer kleinen Gruppe von Forschern und Kreativen zugänglich.
Keine Sorge, HyperAI bietet Ihnen eine Open-Source-Lösung für KI-generierte Videos:Kombination aus stabiler Diffusion, Prompt Travel und AnimateDiff, Start mit einem Klick, kostenlos nutzbar!Genießen Sie ein visuelles Fest in 1 Sekunde, die Open-Source-Alternative zu Sora wartet auf Sie! Auf der offiziellen Website von hyper.ai sind jetzt Online-Bedienungs-Tutorials verfügbar. Kommen Sie und erleben Sie es!
Vom 25. bis 29. März gibt es Updates auf der offiziellen Website von hyper.ai:
* Hochwertige öffentliche Datensätze: 10
* Ausgewählte hochwertige Tutorials: 2
* Community-Artikelauswahl: 4 Artikel
* Beliebte Enzyklopädieeinträge: 5
Besuchen Sie die offizielle Website:hyper.ai
Ausgewählte öffentliche Datensätze
1. MCFEND Ein Multi-Source-Benchmark-Datensatz zur Erkennung von Fake News in China
Der MCFEND-Datensatz ist ein aus mehreren Quellen bestehender Benchmark-Datensatz zur Erkennung chinesischer Fake News, der gemeinsam von der Hong Kong Baptist University, der Chinese University of Hong Kong und anderen Institutionen erstellt wurde. Der Datensatz enthält 23.974 Nachrichten aus unterschiedlichen Quellen wie sozialen Plattformen, Instant-Messaging-Anwendungen und traditionellen Online-Nachrichtenmedien, die alle von 14 internationalen, maßgeblichen Faktencheck-Organisationen überprüft wurden.
Direkte Verwendung:
2. Fin-Eva Version 1.0 Chinesischsprachiges professionelles Datenauswertungsset im Finanzbereich
Der Datensatz Fin-Eva Version 1.0 ist ein gemeinsam von der Ant Group und der Shanghai University of Finance and Economics veröffentlichter Datensatz zur Finanzbewertung. Es deckt mehrere Finanzszenarien ab, beispielsweise Vermögensverwaltung, Versicherungen und Investmentforschung, und führt professionelle Finanzfachdisziplinen ein. Die Gesamtzahl der Bewertungsfragen liegt bei über 13.000.
Direkte Verwendung:
3. VidProM Großer Text-zu-Video-Eingabeaufforderungsdatensatz
Der VidProM-Datensatz ist der erste groß angelegte Datensatz zur Text-zu-Video-Eingabeaufforderung für echte Benutzer, der gemeinsam von der University of Technology Sydney und der Zhejiang University entwickelt wurde. Es enthält 1,67 Millionen einzigartige Text-zu-Video-Aufforderungen und 6,69 Millionen Videos, die von vier hochmodernen Diffusionsmodellen generiert wurden.
Direkte Verwendung:
4. FindingEmo-Datensatz zur Bildemotionserkennung
FindingEmo ist ein neuer Bilddatensatz, der von der KU Leuven und anderen Institutionen speziell für Aufgaben zur Emotionserkennung erstellt wurde. Der Datensatz enthält Anmerkungen zu 25.000 Bildern.
Direkte Verwendung:
5. GPD-Datensatz zu Menschenmengenfluss und Verkehrsgeschwindigkeit
Die neueste Errungenschaft des Center for Urban Science and Computing Research, Department of Electronic Engineering, Tsinghua University, „Spatio-Temporal Few-Shot Learning via Diffusive Neural Network Generation“, wurde von ICLR2024 angenommen. Die Studie schlug das GPD-Modell (Generative Pre-Trained Diffusion) vor, um räumlich-zeitliches Lernen in datenarmen Szenarien zu erreichen. Dieser Datensatz enthält die Open-Source-Daten und den Code des Dokuments.
Direkte Verwendung:
6. AlgoPuzzleVQA Multimodaler Algorithmus-Puzzle-Datensatz
Der AlgoPuzzleVQA-Datensatz ist ein multimodaler Schlussfolgerungsdatensatz, der von der Singapore University of Technology and Design erstellt wurde, um die Fähigkeit multimodaler Sprachmodelle zum Lösen algorithmischer Rätsel, die visuelles Verständnis, Sprachverständnis und komplexe algorithmische Schlussfolgerungen erfordern, zu testen und zu bewerten.
Direkte Verwendung:
7. UltraSafety Large Model Safety Evaluation Dataset
Der UltraSafety-Datensatz wurde gemeinsam von der Renmin University of China, der Tsinghua University und Tencent erstellt, um die Sicherheit großer Modelle zu bewerten und zu verbessern. Der Datensatz basiert auf 1.000 sicheren Seed-Anweisungen von AdvBench und MaliciousInstruct, und weitere 2.000 Anweisungen werden mit Self-Instruct gebootet.
Direkte Verwendung:
8. NAIP-S2 USNationaler Fernerkundungsdatensatz mit superhoher Auflösung
NAIP-S2 ist ein vom Allen Institute for Artificial Intelligence veröffentlichter Fernerkundungsdatensatz mit superhoher Auflösung, der gepaarte NAIP- und Sentinel-2-Bilder der kontinentalen Vereinigten Staaten enthält. Dieser Datensatz bietet umfassende Anwendungsmöglichkeiten im Bereich der Fernerkundung, insbesondere bei der Oberflächenüberwachung, dem Ressourcenmanagement und der Bewertung von Umweltveränderungen, und liefert hochpräzise Datenunterstützung.
Direkte Verwendung:
9. CLicK-Datensatz zur koreanischen Kultur und Sprachintelligenz
Der CLicK-Datensatz wurde vom Korea Advanced Institute of Science and Technology erstellt, um die Lücke bei der Bewertung kultureller und sprachlicher Kenntnisse für große koreanische Modelle zu schließen. Der Datensatz enthält 1.995 Frage-Antwort-Paare aus offiziellen koreanischen Prüfungen und Lehrbüchern und deckt zwei Kategorien ab: Sprache und Kultur, die in 11 Unterkategorien unterteilt sind. Jede Probe enthält detaillierte Anmerkungen, die auf die kulturellen und sprachlichen Kenntnisse hinweisen, die zur Beantwortung der Frage erforderlich sind.
Direkte Verwendung:
10. In der TacticAI-Forschung verwendete Daten
Dieser Datensatz enthält die relevanten Daten, die im Rahmen der Studie „TacticAI: Football Tactical Artificial Intelligence Assistant“ gesammelt wurden.
Direkte Verwendung:
Weitere öffentliche Datensätze finden Sie unter:
Ausgewählte öffentliche Tutorials
1. Zufallszahlen in Python generieren
Echte Zufallszahlen sind in Computern schwer zu erreichen, da Computer nur bestimmte Operationen ausführen können. Pseudozufälligkeit ist möglich und kann programmgesteuert simuliert werden. Dieses Tutorial zeigt Ihnen Schritt für Schritt, wie Sie in Python Zufallszahlen generieren.
Online ausführen:
2. Schrittweise Entwicklung neuronaler Netzwerke mit PyTorch
PyTorch ist eine leistungsstarke Python-Bibliothek zum Erstellen von Deep-Learning-Modellen, die den Prozess der Definition, des Trainings und der Inferenz in neuronalen Netzwerken vereinfacht. Dieses Tutorial zeigt Ihnen, wie Sie einen CSV-Datensatz laden, ein mehrschichtiges Perzeptronmodell definieren und es in PyTorch trainieren und auswerten. Außerdem erhalten Sie eine Anleitung zum Erstellen eines Deep-Learning-Modells für neuronale Netzwerke.
Online ausführen:
Community-Artikel
Dieses Tutorial ist eine Kombination aus der Open-Source-KI-Videogenerierungslösung Stable Diffusion + Prompt Travel + AnimateDiff, die jeder kostenlos nutzen kann. Starten Sie die Open-Source-Alternative Sora mit einem Klick und genießen Sie das visuelle Fest in 1 Sekunde.
Online ausführen:
Das Team von Professor Liu Shao von der Abteilung für Pharmazie des Xiangya-Krankenhauses der Central South University hat ein integriertes molekulares Netzwerk-Framework (IMN4NPD) entwickelt, mit dem die pharmakologischen Komponenten natürlicher Arzneimittel umfassend erforscht werden können. Es beschleunigt nicht nur die Dereplikation umfangreicher Cluster in molekularen Netzwerken, sondern bietet auch Anmerkungen zu Selbstschleifen und gepaarten Knoten, die bei bestehenden Forschungsmethoden oft übersehen werden. Die entsprechenden Ergebnisse wurden in der Fachzeitschrift „Bioinformatics“ veröffentlicht.
Den vollständigen Bericht ansehen:
Forscher der Central South University haben eine Methode namens AdaDR vorgeschlagen, die eine Neupositionierung von Medikamenten durch die tiefe Integration von Knotenmerkmalen und topologischen Strukturen durchführt und die interaktiven Informationen zwischen ihnen auf der Grundlage adaptiver Graphfaltungsoperationen simuliert, wodurch die Ausdruckskraft des Modells verbessert wird. Das entsprechende Papier wurde in der „American Chemical Society“ veröffentlicht.
Den vollständigen Bericht ansehen:
Eckbälle sind oft eine hervorragende Gelegenheit, Trainertaktiken umzusetzen. Als Reaktion darauf haben Google DeepMind und der Liverpool Football Club gemeinsam TacticAI auf den Markt gebracht, das geometrische Deep-Learning-Methoden sowie prädiktive und generative Modelle verwendet, um Profis taktische Erkenntnisse zu Eckbällen zu liefern. Die Ergebnisse der Studie zeigen, dass das von TacticAI vorgeschlagene taktische Layout in allen Fällen von 90% von menschlichen Expertenbewertern bevorzugt wird. Die Genauigkeit der Ballannahmevorhersage liegt bei 74% und die Schusschance erhöht sich um 13%. Die entsprechenden Ergebnisse wurden in der Fachzeitschrift „Nature“ veröffentlicht.
Den vollständigen Bericht ansehen:
Beliebte Enzyklopädieartikel
1. Gepaarter t-Test
2. Repräsentationslernen
3. Rotationspositionskodierung RoPE
4. Kognitive Suche
5. Fallbasiertes Denken (CBR)
Hier sind Hunderte von KI-bezogenen Begriffen zusammengestellt, die Ihnen helfen sollen, „künstliche Intelligenz“ zu verstehen:
Vorschau auf die Live-Übertragung von Station B
Datum | Zeit | Inhalt |
1. April Montag | 10:00 | Harvard CS50-Kurs (2023) |
Dienstag, 2. April | 10:00 | Harvard CS50-Kurs (2022) |
Mittwoch, 3. April | 10:00 | MIT Deep Learning-Kurs |
Donnerstag, 4. April | 10:00 | NVIDIAs Pressekonferenzen im Laufe der Jahre |
Freitag, 5. April | 10:0018:00 | Zusammenstellungskurs zum maschinellen Lernen Tesla AI Day |
Samstag, 6. April | 10:00 | Google IO-Konferenzen im Laufe der Jahre |
7. April Sonntag | 10:00 | Stanford HAI Symposium |
Super Neuro TV sendet rund um die Uhr live. Klicken Sie hier, um die „elektronischen Gurken“ im KI-Bereich zu erhalten:
http://live.bilibili.com/26483094
Das Obige ist der gesamte Inhalt der Auswahl des Herausgebers dieser Woche. Wenn Sie über Ressourcen verfügen, die Sie auf der offiziellen Website von hyper.ai veröffentlichen möchten, können Sie uns auch gerne eine Nachricht hinterlassen oder einen Artikel einreichen!
Bis nächste Woche!
Über HyperAI
HyperAI (hyper.ai) ist eine führende Community für künstliche Intelligenz und Hochleistungsrechnen in China.Wir haben uns zum Ziel gesetzt, die Infrastruktur im Bereich der Datenwissenschaft in China zu werden und inländischen Entwicklern umfangreiche und qualitativ hochwertige öffentliche Ressourcen bereitzustellen. Bisher haben wir:
* Bereitstellung von inländischen beschleunigten Download-Knoten für über 1200 öffentliche Datensätze
* Enthält über 300 klassische und beliebte Online-Tutorials
* Interpretation von über 100 AI4Science-Papierfällen
* Unterstützt die Suche nach über 500 verwandten Begriffen
* Hosting der ersten vollständigen chinesischen Apache TVM-Dokumentation in China
Besuchen Sie die offizielle Website, um Ihre Lernreise zu beginnen: