Wöchentliche Empfehlungen Der Redaktion | MathPile Mathematical Reasoning Corpus Open Source, Union Eye Hospital Führt Den Einsatz Von KI Zur Unterstützung Der Erkennung Von 13 Augenhintergrunderkrankungen An

Kürzlich hat das Generative Artificial Intelligence Research Laboratory (GAIR) der Shanghai Jiao Tong UniversityDer hochwertige und vielfältige vortrainierte Datensatz MathPile, der auf den Bereich der Mathematik zugeschnitten ist, und seine kommerzielle Version MathPile-Commercial sind Open Source.Es steht jetzt auf der offiziellen Website von hyper.ai zum Download bereit! Es gibt noch mehr, wie zum Beispiel MathVista , Math23K und andere beliebte mathematische Datensätze warten auf Ihre Verwendung~
Vom 19. bis 23. Februar gibt es Updates auf der offiziellen Website von hyper.ai:
* Hochwertige öffentliche Datensätze: 10
* AI4S-Papierhüllen: 4
* Beliebte Enzyklopädieeinträge: 10
Besuchen Sie die offizielle Website:hyper.ai
Ausgewählte öffentliche Datensätze
1. MathPile – Vortrainiertes Korpus für mathematisches Denken
Das Generative Artificial Intelligence Laboratory der Shanghai Jiao Tong University hat den MathPile-Datensatz veröffentlicht. Dabei handelt es sich um ein hochwertiges, vielfältiges, vortrainiertes Korpus speziell für den Bereich der Mathematik, das etwa 9,5 Milliarden Token enthält und die mathematischen Denkfähigkeiten großer Modelle verbessern soll.
Direkte Verwendung:
https://hyper.ai/datasets/29543
2. MathPile – Kommerzielles Vortrainingskorpus für mathematisches Denken (kommerzielle Version)
MathPile-Commercial ist eine kommerzielle Version von MathPile, die durch Entfernen der Dokumente in MathPile entsteht, die eine kommerzielle Nutzung verbieten (die neueste Version, v0.2). Insbesondere testete das Forschungsteam die Quelldaten auf nichtkommerzielle Nutzung, indem es die Lizenzinformationen in den Metadaten der arXiv-Quelle verwendete und eine Schlüsselwortübereinstimmung mit anderen Quellen anwandte.
Direkte Verwendung:
https://hyper.ai/datasets/29545
3. KI-generierte Bilddatensätze
Dieser Datensatz enthält 19 von Copilot generierte Bilder von Jungen. Copilot ist ein KI-Begleiter, der fantasievolle und innovative Inhalte erstellt. Diese Bilder eignen sich für Aufgaben zur Gesichts- und Posenerkennung, da sie sich in Gesichtsausdrücken, Posen, Hintergründen, Beleuchtung und Okklusionen unterscheiden.
Direkte Verwendung:
https://hyper.ai/datasets/29527
4. Ein vielfältiger KI-generierter Porträtdatensatz
Der Datensatz enthält 140 hochwertige Bilder, die sorgfältig mithilfe fortschrittlicher KI-Algorithmen erstellt wurden, darunter 70 Frauenporträts und 70 Männerporträts. Jedes Bild in diesem Datensatz demonstriert die bemerkenswerte Fähigkeit der KI, die Komplexität des menschlichen Erscheinungsbilds nachzuahmen.
Direkte Verwendung:
https://hyper.ai/datasets/29529
5. THUCNews Chinesischer Textklassifizierungsdatensatz
THUCNews wird durch Filtern der historischen Daten des RSS-Abonnementkanals von Sina News von 2005 bis 2011 generiert und enthält 740.000 Nachrichtendokumente (2,19 GB), alle im UTF-8-Klartextformat. Auf Grundlage des ursprünglichen Klassifizierungssystems von Sina News hat das Forschungsteam es neu organisiert und in 14 mögliche Kategorien unterteilt: Finanzen, Lotterie, Immobilien, Aktien, Heim, Bildung, Technologie, Gesellschaft, Mode, aktuelle Angelegenheiten, Sport, Horoskope, Spiele und Unterhaltung.
Direkte Verwendung:
https://hyper.ai/datasets/29521
6. ShareGPT 90.000 chinesischer und englischer zweisprachiger Mensch-Maschine-Frage-Antwort-Datensatz
ShareGPT-Chinese-English-90k ist ein hochwertiger zweisprachiger Mensch-Maschine-Frage-Antwort-Datensatz in Chinesisch und Englisch, der Benutzerfragedaten in realen und komplexen Szenarien abdeckt. Mit diesem Datensatz können hochwertige Konversationsmodelle trainiert werden.
Direkte Verwendung:
https://hyper.ai/datasets/29523
7. SMP-2017 Chinesischer Datensatz zur Erkennung von Gesprächsabsichten
Bei diesem Datensatz handelt es sich um den Datensatz der Aufgabe 1 der SMP2017 Chinese Human-Computer Dialogue Technology Evaluation (ECDT). Ziel der Evaluierung ist es, die Entwicklung der Forschung im Zusammenhang mit chinesischen Mensch-Computer-Dialogsystemen zu fördern.
Direkte Verwendung:
https://hyper.ai/datasets/29515
8. Toutiao-Textklassifizierungsdatensatz
Dieser Datensatz ist ein Klassifizierungsdatensatz der chinesischen Nachrichten von Toutiao (Kurztext). Die Datenquelle ist der Toutiao-Client. Es enthält 15 Kategorien und 382.688 Texte, der Erfassungszeitpunkt ist Mai 2018.
Direkte Verwendung:
https://hyper.ai/datasets/29517
Weitere aktualisierte Datensätze dieser Woche finden Sie unter:
ScienceAI-Papier-Fallstudien
Die Diagnose von Augenkrankheiten hängt in hohem Maße von der Bilderkennung ab und die Augenheilkunde eignet sich sehr gut für die Anwendung von Technologien wie Deep Learning. Um den potenziellen Wert des Deep Learning bei der Diagnose von Augenhintergrunderkrankungen weiter zu erforschen, leitete Chen Youxin, Leiter der Abteilung für Augenheilkunde am Peking Union Medical College Hospital, eine Zusammenarbeit zwischen fünf Augenheilkundezentren im ganzen Land, der Beijing Zhiyuan Huitu Technology Co., Ltd. und Professor Li Xirong von der School of Information der Renmin University of China, um gemeinsam ein Deep-Learning-System zu entwickeln. Das System unterstützt junge Augenärzte dabei, ihre diagnostische Konsistenz um etwa 12% zu verbessern und bietet eine neue Methode zur automatischen Erkennung von 13 wichtigen Augenhintergrunderkrankungen. Das entsprechende Paper ist in der Fachzeitschrift „Nature“ erschienen.
Den vollständigen Bericht ansehen:
Die Auswirkungen der ökologischen Umwelt auf die menschliche Gesundheit sind subtil. Die Forschungsgruppe von Professor Wu Xifeng von der School of Public Health der Zhejiang-Universität verwendete ein Convolutional-Neural-Network-Modell, um die sichtbare Grünfläche anhand des Green View Index von Street View-Bildern zu bewerten und untersuchte dann, ob ein positiver Zusammenhang zwischen dem Grad der sichtbaren Grünfläche am Arbeitsplatz und dem metabolischen Syndrom bei Erwachsenen besteht. Das Forschungsteam verwendete ein logistisches Regressionsmodell, um den Grad der sichtbaren Begrünung im Freien in der Arbeitsumgebung von mehr als 50.000 Erwachsenen in Hangzhou zu bewerten und bestätigte den positiven Zusammenhang zwischen beiden. Die entsprechenden Ergebnisse wurden in der Fachzeitschrift „Environment International“ veröffentlicht.
Den vollständigen Bericht ansehen:
Institut für Künstliche Intelligenz der Shanghai Jiao Tong University KI für die Wissenschaft Professor Yang Xiaokang und andere Teammitglieder schlugen ein Konzept für den Bau intelligenter wissenschaftlicher Einrichtungen vor, das innovative Funktionen wie große Modelle in wissenschaftlichen Bereichen, generative Simulation und Inversion, autonome intelligente unbemannte Experimente und groß angelegte vertrauensvolle wissenschaftliche Forschungszusammenarbeit umfasst. Die entsprechenden Forschungsergebnisse wurden im „Journal of the Chinese Academy of Sciences“ veröffentlicht.
Den vollständigen Bericht ansehen:
4. Ausgewählt von Amazon-Ingenieuren, eine Sammlung von über 40 LLM-Papieren
Immer mehr Unternehmen und traditionelle Branchen beginnen zu erforschen, wie sie große Sprachmodelle auf ihr eigenes Geschäft anwenden können. Die rasch wachsende Marktnachfrage hat außerdem zu einer weiteren Vertiefung und Innovation der Forschung in verwandten Bereichen geführt und die Aktualisierung von Artikeln auf Plattformen wie arXiv erfolgt häufiger. Damit jeder schneller auf hochwertige Dokumente zugreifen kann, haben der Amazon-Ingenieur Eugene Yan und andere eine Leseliste für Dokumente im Sprachmodell erstellt, um kontinuierlich hochaktuelle Dokumente auszutauschen. Aktuell liegen über 40 hochwertige Beiträge vor.
Sehen Sie sich die vollständige Zusammenfassung des Dokuments an:
Beliebte Enzyklopädieartikel
1. Rückruf Rückrufrate
2. Menschliches Feedback-Verstärkungslernen RLHF
3. Allgemeine künstliche Intelligenz (AGI)
4. Retrieval-Verbesserung generiert RAG
5. Neuronales Strahlungsfeld (NeRF)
Hier sind Hunderte von KI-bezogenen Begriffen zusammengestellt, die Ihnen helfen sollen, „künstliche Intelligenz“ zu verstehen:
Das Obige ist der gesamte Inhalt der Auswahl des Herausgebers dieser Woche. Wenn Sie über Ressourcen verfügen, die Sie auf der offiziellen Website von hyper.ai veröffentlichen möchten, können Sie uns auch gerne eine Nachricht hinterlassen oder einen Artikel einreichen!
Bis nächste Woche!
Über HyperAI
HyperAI (hyper.ai) ist eine führende Community für künstliche Intelligenz und Hochleistungsrechnen in China.Wir haben uns zum Ziel gesetzt, die Infrastruktur im Bereich der Datenwissenschaft in China zu werden und inländischen Entwicklern umfangreiche und qualitativ hochwertige öffentliche Ressourcen bereitzustellen. Bisher haben wir:
* Bereitstellung von inländischen beschleunigten Download-Knoten für über 1200 öffentliche Datensätze
* Enthält über 300 klassische und beliebte Online-Tutorials
* Interpretation von über 100 AI4Science-Papierfällen
* Unterstützt die Suche nach über 500 verwandten Begriffen
* Hosting der ersten vollständigen chinesischen Apache TVM-Dokumentation in China
Besuchen Sie die offizielle Website, um Ihre Lernreise zu beginnen: