HyperAI

Wöchentliche Empfehlungen Der Redaktion | Deepmoney-Finanzmodell Online Ausführen, KI-Präferenzen Und Andere Hochwertige Datensätze Online

特色图像

Derzeit basieren die meisten Forschungsergebnisse zu Finanzmodellen im Bereich der KI auf öffentlichem Wissen. In der tatsächlichen Finanzpraxis ist die Interpretierbarkeit dieses öffentlichen Wissens für den aktuellen Markt jedoch oft erheblich unzureichend. Ein ideales großes Finanzmodell sollte in der Lage sein, Nachrichten oder Datenereignisse zu verstehen und sie sowohl aus subjektiver als auch aus quantitativer Perspektive sofort zu bewerten.
Zu diesem Zweck wurde Deepmoney geschaffen. Es handelt sich um ein groß angelegtes Sprachmodellprojekt mit dem Schwerpunkt auf Investitionen im Finanzbereich. Auf der offiziellen Website von hyper.ai finden Sie jetzt Online-Tutorials zur Bedienung. Kommen Sie vorbei und erleben Sie es!

Vom 18. bis 22. März gibt es Updates auf der offiziellen Website von hyper.ai:

* Hochwertige öffentliche Datensätze: 10

* Auswahl an hochwertigen Tutorials: 3

* Community-Artikelauswahl: 3 Artikel

* Beliebte Enzyklopädieeinträge: 10

Besuchen Sie die offizielle Website:hyper.ai

Ausgewählte öffentliche Datensätze

1. OpenHermesPreferences: KI-Präferenzen-Datensatz Der OpenHermesPreferences-Datensatz wurde von Argilla in Zusammenarbeit mit dem Hugging Face H4-Team erstellt und enthält ungefähr 1 Million KI-Präferenzdaten. Dieser Datensatz kann zum Trainieren von Präferenzmodellen oder zum Anpassen von Sprachmodellen mithilfe von Techniken wie der direkten Präferenzoptimierung verwendet werden.

Direkte Verwendung:

https://my5353.com/30168

2. LongAlign 10K großes Modell, langer Kontext-Alignment-Datensatz

LongAlign-10k ist ein von der Tsinghua-Universität vorgeschlagener Datensatz, der die Herausforderungen bewältigen soll, denen große Modelle bei Ausrichtungsaufgaben mit großem Kontext gegenüberstehen. Es enthält 10.000 lange Befehlsdaten mit einer Länge zwischen 8k und 64k. Der Datensatz dient dazu, die Leistung großer Modelle in langen Kontexten und ihre Fähigkeit, Aufgabenanweisungen mit einer Länge von 10.000 bis 100.000 zu befolgen, zu bewerten.

Direkte Verwendung:

https://my5353.com/30247

3. CyberMetric Large Model Cybersecurity Evaluation Dataset

Der CyberMetric-Datensatz enthält 10.000 Fragen, die dazu dienen, das Wissen großer Modelle zur Cybersicherheit umfassend zu bewerten. Der Datensatz wurde mithilfe verschiedener großer Modelle erstellt und von Experten im Bereich Cybersicherheit validiert, um seine Relevanz und Genauigkeit sicherzustellen.

Direkte Verwendung:

https://my5353.com/30251

4. 2020 China Boden-Photovoltaik-Kraftwerk 10m National Scale Map Dataset

Die China Agricultural University hat in Zusammenarbeit mit dem Institute of Geographic Sciences and Natural Resources Research der Chinesischen Akademie der Wissenschaften eine nationale Kartierungsmethode entwickelt, um den Mangel an hochauflösenden Open-Source-Daten zur Verteilung der nationalen bodengestützten Photovoltaikkraftwerke in China zu beheben. Sie haben den nationalen Klassifizierungsdatensatz für bodengestützte Photovoltaikkraftwerke mit einer Auflösung von 10 Metern für 2020 erfolgreich veröffentlicht. Diese Leistung zeigt nicht nur die räumlichen Verteilungsmerkmale der Photovoltaikkraftwerke meines Landes genau auf, sondern liefert auch wertvolle Datenressourcen für Energieplanung, Landnutzung, Fernerkundungsüberwachung und Umweltforschung mit einer Klassifizierungsgenauigkeit von 89%. Dieser Schritt schließt die Datenlücke auf diesem Gebiet in China und ist für die damit verbundene Forschung von großer Bedeutung.

Direkte Verwendung:

https://my5353.com/30283

5. Klassifizierung von Pflanzenkrankheiten Bilddatensatz zur Klassifizierung von Pflanzenkrankheiten

Der Datensatz enthält klassifizierte Bilder von fünf Pflanzenkrankheiten, die wie folgt gekennzeichnet wurden: bakterielle Maniokwelke (CBB), Maniok-Braunstreifenkrankheit (CBSD), Maniok-Grünfleckenkrankheit (CGM), Maniok-Mosaikkrankheit (CMD) und gesund. Damit können Machine-Learning-Modelle zur Erkennung von Pflanzenkrankheiten trainiert oder Algorithmen für die automatisierte Pflanzendiagnose entwickelt werden.

Direkte Verwendung:

https://my5353.com/30293

6. Erkennung von Tomatenblattkrankheiten Datensatz zur Bilderkennung von Tomatenblattkrankheiten

Bei diesem Datensatz handelt es sich um einen Bilderkennungsdatensatz zur Blattkrankheit von Tomaten. Die Bilder sind in die folgenden Kategorien unterteilt: gesund, Bakterienflecken, Frühfäule, gesund, Spätfäule, Laubschimmel, Zielpunkt und Schwarzfleckenkrankheit. Die Bilder sind im YOLO v5 PyTorch-Format annotiert.

Direkte Verwendung:

https://my5353.com/30306

7. AMAZON REVIEWS 2023 Großer Amazon-Rezensionsdatensatz

AMAZON REVIEWS 2023 ist ein umfangreicher Amazon-Bewertungsdatensatz, der 2023 von McAuley Lab gesammelt wurde und mehr als 570 Millionen Bewertungen und 48 Millionen Produkte aus 33 verschiedenen Kategorien enthält.

Direkte Verwendung:

https://my5353.com/30267

8. DiFF-Diffusionsmodell-generierter Datensatz zur Gesichtsfälschung

DiFF ist ein hochwertiger, groß angelegter Bilddatensatz zur Gesichtsfälschung, der gemeinsam von der Shandong University, der National University of Singapore und anderen Institutionen entwickelt wurde. Es wird auf Basis des Diffusionsmodells generiert und enthält mehr als 500.000 Bilder. Dieser Datensatz eignet sich für die Erkennung von Gesichtsfälschungen, feindliche Angriffe und die Abwehr von Deep Fakes sowie für das Training anderer damit verbundener Computer Vision-Aufgaben.

Direkte Verwendung:

https://my5353.com/30260

9. MIntRec2.0 Multimodaler Dialogdatensatz zur Absichtserkennung

MIntRec2.0 ist ein groß angelegter multimodaler Mehrparteien-Benchmark-Datensatz, der von der Tsinghua-Universität und anderen vorgeschlagen wurde und speziell dazu verwendet wird, die Absicht in Gesprächen zu erkennen und nicht beabsichtigte Inhalte zu erkennen. Im Vergleich zum vorherigen MIntRec ist das Datenvolumen von MIntRec2.0 auf 15.000 gestiegen, deckt 30 Absichtskategorien ab und enthält ungefähr 9.300 In-Intent- und 5.700 Out-of-Intent-annotierte Sätze, die mehrere Modalitäten wie Text, Video und Audio umfassen.

Direkte Verwendung:

https://my5353.com/30166

10. Mehrsprachiger medizinischer Datensatz von ApolloCorpora

ApolloCorpora ist ein mehrsprachiger medizinischer Datensatz, der gemeinsam vom Shenzhen Big Data Research Institute und dem Forschungsteam der Chinesischen Universität Hongkong erstellt wurde. Der Datensatz umfasst sechs Hauptsprachen, die von 6,1 Milliarden Menschen weltweit gesprochen werden, darunter Englisch, Chinesisch, Hindi, Spanisch, Französisch und Arabisch.

Direkte Verwendung:

https://my5353.com/30285

Weitere öffentliche Datensätze finden Sie unter:

https://hyper.ai/datasets

Ausgewählte öffentliche Tutorials

1. Führen Sie Deepmoney-34b-full online aus

Deepmoney ist ein groß angelegtes Sprachmodellprojekt mit dem Schwerpunkt auf Investitionen im Finanzbereich. Deepmoney-34b-full wird basierend auf dem 01-ai Open-Source-Modell Yi-34B-200K trainiert, das in zwei Phasen unterteilt ist: pt (vollständiges Parametertraining) und sft (Lora-Feintuning). Es kann jetzt mit einem Klick auf der offiziellen Super Neuro-Website geklont und verwendet werden.

Online ausführen:

https://my5353.com/t30314

2. Führen Sie Deepmoney-miqu-70b online aus

Dieses Modell wird auf Grundlage von miqu-1-70b-sf von huggingface.co trainiert, wobei nur SFT (Lora-Feinabstimmung) durchgeführt wird. Es kann jetzt mit einem Klick auf der offiziellen SuperNeural-Website geklont und verwendet werden.

Online ausführen:

https://my5353.com/t30314

3. Führen Sie Deepmoney-67b-full online aus

Das Modell wird auf Basis der Open Source-Version von deepseek-ai auf Basis von deepseek-llm-67b-base trainiert. Es ist in zwei Phasen unterteilt: PT (Lora-Training) und SFT (Lora-Training). Es kann jetzt mit einem Klick auf der offiziellen SuperNeural-Website geklont und verwendet werden.

Online ausführen:

https://my5353.com/t30310

Community-Artikel

1. NVIDIA Huang Renxun hat GB200 veröffentlicht, das eine 30-mal höhere Argumentationsfähigkeit als H100 und einen 25-mal geringeren Energieverbrauch aufweist und AI4S-Funktionen in Mikrodienste umwandelt

Die diesjährige GTC AI-Konferenz 2024 fand wie geplant statt. Vom 18. bis 21. März fanden über 900 Veranstaltungen und mehr als 20 Fachvorträge statt. Dieser Artikel ist eine Zusammenfassung der Grundsatzrede von Jensen Huang bei GTC.

Den vollständigen Bericht ansehen:

https://my5353.com/p30224

2. Das Argonne National Laboratory generiert 120.000 Kandidatenmaterialien für die Kohlenstoffabscheidung in 33 Minuten und veröffentlicht ein generatives KI-Framework zur Beschleunigung der MOF-Innovation

Ein Forschungsteam des Argonne National Laboratory in den USA hat ein generatives KI-Framework namens GHP-MOFsassemble vorgeschlagen, das neue MOF-Strukturen zufällig generieren und zusammensetzen, hochstabile MOF-Strukturen durch molekulardynamische Simulationen prüfen und mithilfe von Kristallgraph-Neuralnetzen (CGCNN) und großkanonischen Monte-Carlo-Simulationen (GCMC) die Adsorptionskapazität von MOFs für Kohlendioxid testen kann. Die zugehörige Arbeit wurde in „Nature“ veröffentlicht.

Den vollständigen Bericht ansehen:

https://my5353.com/p30269

3. Princeton University veröffentlicht KI-Controller, der das Risiko eines Plasmarisses 300 Millisekunden im Voraus vorhersagt

Forscher der Princeton University haben einen KI-Controller zur adaptiven Vorhersage und Steuerung entwickelt, der das potenzielle Risiko eines Plasmarisses 300 Millisekunden im Voraus vorhersagen und rechtzeitig eingreifen kann. Die entsprechenden Ergebnisse wurden in „Nature“ veröffentlicht.

Den vollständigen Bericht ansehen:

https://my5353.com/p30296

Beliebte Enzyklopädieartikel

1. Datengravitation

2. Massives Multi-Task-Sprachverständnis (MMLU)

3. Expertenmischung (MoE)

4. Quantenneuronales Netzwerk

5. Neuronales Strahlungsfeld (NeRF)

Hier sind Hunderte von KI-bezogenen Begriffen zusammengestellt, die Ihnen helfen sollen, „künstliche Intelligenz“ zu verstehen:

https://hyper.ai/wiki

Vorschau auf die Live-Übertragung von Station B

DatumZeitInhalt
25. März
Montag
10:0017:00MIT Deep Learning Kurs 2020MIT Deep Learning Course 2021Original anzeigenÜbersetzung anzeigen Wie finden Sie diese Übersetzung?
Dienstag, 26. März10:00Python-API-Entwicklung – Umfassender Kurs für Anfänger
Mittwoch, 27. März10:0014:00SQL-Tutorial - Anfängerkurs Generative KI Komplettkurs
Donnerstag, 28. März21:00Flutter-Kurse für Anfänger
Freitag, 29. März10:00Flutter-Kurse für Anfänger
Samstag, 30. März10:00Harvard CS50 – Python-Kurs zur künstlichen Intelligenz
Sonntag, 31. März10:00Lernen Sie PyTorch für Deep Learning an einem Tag

Super Neuro TV sendet rund um die Uhr live. Klicken Sie hier, um die „elektronischen Gurken“ im KI-Bereich zu erhalten:

http://live.bilibili.com/26483094

Das Obige ist der gesamte Inhalt der Auswahl des Herausgebers dieser Woche. Wenn Sie über Ressourcen verfügen, die Sie auf der offiziellen Website von hyper.ai veröffentlichen möchten, können Sie uns auch gerne eine Nachricht hinterlassen oder einen Artikel einreichen!

Bis nächste Woche!

Über HyperAI

HyperAI (hyper.ai) ist eine führende Community für künstliche Intelligenz und Hochleistungsrechnen in China.Wir haben uns zum Ziel gesetzt, die Infrastruktur im Bereich der Datenwissenschaft in China zu werden und inländischen Entwicklern umfangreiche und qualitativ hochwertige öffentliche Ressourcen bereitzustellen. Bisher haben wir:

* Bereitstellung von inländischen beschleunigten Download-Knoten für über 1200 öffentliche Datensätze

* Enthält über 300 klassische und beliebte Online-Tutorials

* Interpretation von über 100 AI4Science-Papierfällen

* Unterstützt die Suche nach über 500 verwandten Begriffen

* Hosting der ersten vollständigen chinesischen Apache TVM-Dokumentation in China

Besuchen Sie die offizielle Website, um Ihre Lernreise zu beginnen:

https://hyper.ai/