HyperAI

Das AI4S-Team Der Shanghai Jiao Tong University Schlug Das Konzept „intelligenter Wissenschaftlicher Einrichtungen“ Vor, Um Einen Interdisziplinären KI-Forschungsassistenten Einzurichten

特色图像

In den letzten Jahren hat sich die Anwendung künstlicher Intelligenz in der wissenschaftlichen Forschung immer weiter vertieft und gleichzeitig die Breite ihrer Anwendungsbereiche erweitert, von der Proteinfaltung bis zur Entdeckung neuer Materialien, von der Krankheitsvorhersage bis zu Prognose und Behandlung, von der astronomischen Erkundung bis zur Analyse von Naturkatastrophen ... Hinter der Blüte der KI für die Wissenschaft stehen einerseits in- und ausländische KI-Unternehmen, die Forschung und Entwicklung im Bereich der wissenschaftlichen Forschung betrieben haben, wodurch die Hemmschwelle für den Einsatz von KI-Tools gesenkt wurde; Andererseits haben wissenschaftliche Forscher im Zuge der Akzeptanz von „KI-Helfern“ ein effizientes Kooperationsmodell mit ihnen entwickelt.

Eine Analyse von Nature zeigt, dass in der Scopus-Datenbank der Anteil der Artikel, die künstliche Intelligenz oder mit künstlicher Intelligenz in Zusammenhang stehende Schlüsselwörter im Titel oder Abstract erwähnen, von 21 TP3T vor zehn Jahren auf heute 81 TP3T gestiegen ist. Betrachtet man jedoch die großen Modelle und anderen Tools, die von den Technologiegiganten, vertreten durch Google DeepMind, veröffentlicht wurden, sowie die entsprechenden Forschungsergebnisse, die von Forschungsteams in- und ausländischer Universitäten veröffentlicht wurden, so zielen die meisten davon auf spezifische Probleme in spezifischen Bereichen ab und sind nicht reproduzierbar.

Professor Lin Zhouchen von der School of Intelligence der Peking-Universität sagte in einem Interview mit HyperAI: „Den aktuellen KI-Tools mangelt es an Einheitlichkeit. Selbst wenn wir uns nur auf die Mathematik konzentrieren, gibt es bereits große Unterschiede zwischen KI-Tools, die für die Zahlentheorie und Geometrie entwickelt wurden, ganz zu schweigen von interdisziplinären KI-Tools. KI-Tools sind noch nicht so grundlegend wie die heutigen Computer, auf die leicht zugegriffen werden kann. Zu den aktuellen Computersprachen gehören C, Java, Python usw., und es ist durchaus möglich, Probleme in mehreren Disziplinen wie Mathematik, Physik und Chemie basierend auf einer dieser Sprachen zu lösen, was ihre Vielseitigkeit widerspiegelt. Dies ist jedoch bei KI-Tools nicht der Fall. Schauen Sie sich einfach die Alpha-Serie von Google DeepMind an, um dies zu erfahren.“

In Anbetracht dessenProfessor Yang Xiaokang und andere vom AI for Science-Team am Institut für Künstliche Intelligenz der Shanghai Jiao Tong University haben ein Konzept für den Bau intelligenter wissenschaftlicher Einrichtungen vorgeschlagen.Es bildet innovative Funktionen wie große Modelle in wissenschaftlichen Bereichen, generative Simulation und Inversion, autonome intelligente unbemannte Experimente und groß angelegte vertrauenswürdige wissenschaftliche Forschungszusammenarbeit. Ähnliche Forschungsergebnisse wurden veröffentlicht inBulletin der Chinesischen Akademie der Wissenschaften》.

Papieradresse:
http://www.bulletin.cas.cn/previewFile?id=52965146&type=pdf&lang=zh
Folgen Sie dem offiziellen Konto und antworten Sie mit „AI4S“, um das vollständige Dokument zu erhalten

Balance zwischen Innovation und Empowerment

Das AI for Science-Team der Shanghai Jiao Tong University schlug vor, dass zwei Kernprobleme dringend gelöst werden müssen, um die Quellinnovation der Grundlagenforschung und die bedeutenden nachgelagerten technologischen Innovationen im intelligenten Zeitalter zu erreichen:


*Wie kann eine neue wissenschaftliche Geheimdiensteinrichtung auf der Grundlage des Forschungsparadigmas „KI für die Wissenschaft“ aufgebaut werden? 

*Wie kann die neue Generation der KI genutzt werden, um traditionelle wissenschaftliche Einrichtungen zu stärken?

Die Gesamtidee intelligenter wissenschaftlicher Einrichtungen

Was Innovationen angeht,Es ist notwendig, die Kreativität und Vielseitigkeit der neuen Generation von KI (insbesondere generative KI und große Modelle) im Bereich der Grundlagenforschung systematisch und ganzheitlich freizusetzen, innovative Funktionen wie spontane Hypothesengenerierung, automatische Gesetzesableitung, autonome unbemannte Experimente und selbstgesteuerte, vertrauensvolle Zusammenarbeit zu realisieren und iterative wissenschaftliche Forschung im extrem großen Maßstab und mit hoher Geschwindigkeit zu fördern.

Unter traditionellen wissenschaftlichen Einrichtungen und ForschungsparadigmenDer gesamte wissenschaftliche Forschungsprozess ist mit Schwierigkeiten verbunden, beispielsweise mit Schwierigkeiten bei der Kommunikation wissenschaftlicher Fragen, Schwierigkeiten bei der Durchführung wissenschaftlicher Experimente und Schwierigkeiten beim Austausch wissenschaftlicher Daten. Besonders ausgeprägt sind derartige Schwierigkeiten in einigen hochtechnologischen Großforschungsanlagen und deren hochkomplexen wissenschaftlichen Forschungsumgebungen. Die Nutzung der neuen Generation künstlicher Intelligenz zur Schaffung eines effizienten geschlossenen Kreislaufs aus „wissenschaftlichen Problemen (Wissenschaftler) – experimentellen Geräten (Experimentatoren) – wissenschaftlichen Forschungsdaten und Literatur (wissenschaftliche Forschungseinrichtungen und Vermittler)“ ist nicht nur ein Standardmerkmal neu errichteter wissenschaftlicher Einrichtungen, sondern stellt auch eine neue Nachfrage und neue Chance im Prozess der Modernisierung und Renovierung bestehender wissenschaftlicher Einrichtungen dar.

Daher berücksichtigt die Idee des Teams, eine „AI enabled Scientific Facility“ (AISF) aufzubauen, zwei Aspekte: „die Schaffung hochintelligenter neuer wissenschaftlicher Einrichtungen“ und „die Stärkung bestehender großer wissenschaftlicher Einrichtungen“.

Architekturkonzept intelligenter wissenschaftlicher Einrichtungen

Wie in der Abbildung oben dargestellt, bilden intelligente wissenschaftliche Einrichtungen eine dreischichtige Architektur wissenschaftlicher intelligenter Einrichtungen, in die Menschen eingebunden sind.


*Basisstützschicht, durch Hochleistungsrechnen und Rechenleistungsnetzwerke, um Rechenleistungsunterstützung zu bilden; 

*Wissenschaftliche Modellebene, interdisziplinäre und modalübergreifende wissenschaftliche Modelle und „KI-Forschungsassistenten“ aufzubauen;
* Experimentelle AnwendungsschichtDurch KI-gesteuerte Roboter und intelligente Versuchsumgebungen können autonome unbemannte Experimente und eine wissenschaftliche Forschungszusammenarbeit mehrerer Parteien erreicht werden.

4 innovative Funktionen

Basierend auf der dreischichtigen Architektur können intelligente wissenschaftliche Einrichtungen vier wichtige neue Funktionen erfüllen, die das traditionelle Paradigma nicht bietet, nämlich große wissenschaftliche Modelle, generative Simulation und Inversion, autonome unbemannte Experimente mit hohem Durchsatz und eine vertrauensvolle wissenschaftliche Forschungszusammenarbeit im großen Maßstab.

Innovative Funktionen intelligenter wissenschaftlicher Einrichtungen

Wissenschaftliches Modell

Als „KI-Assistent“, der menschliche Wissenschaftler bei der Durchführung wissenschaftlicher Forschung unterstützt, muss das wissenschaftliche Großmodell über einen interdisziplinären Wissenshintergrund verfügen, modalitätsübergreifende Dateneingaben verarbeiten können, den Aufruf externer wissenschaftlicher Tools beherrschen und Feedback und Auswertung kombinieren, um eine kontinuierliche Weiterentwicklung zu erreichen.

Gesamtarchitektur des wissenschaftlichen Modells

Wie in der Abbildung oben gezeigt, erfordert der Aufbau eines großen wissenschaftlichen Modells die Entwicklung von vier spezialisierten Fähigkeiten auf der Grundlage des grundlegenden großen Sprachmodells und die Erstellung entsprechender Bewertungsmaßstäbe.

Die erste besteht in der Fähigkeit, Eingaben über verschiedene Disziplinen und Modalitäten hinweg zu vereinheitlichen.Die durch wissenschaftliche Forschung generierten Daten umfassen im Allgemeinen neben Textdaten auch multimodale Daten wie Formeln, Diagramme und Molekülformeln. Die einheitliche Eingabe dieser modalübergreifenden Daten und die anschließende gemeinsame Modellierung interdisziplinären Fachwissens ist ein anspruchsvolles Problem, das bei der Erstellung eines großen wissenschaftlichen Modells dringend gelöst werden muss.

Der zweite Punkt ist die Fähigkeit, effektiv auf externe wissenschaftliche Instrumente zurückzugreifen.Bei großen Modellen besteht das Problem, dass scheinbar sinnvolle, aber tatsächlich fehlerhafte Inhalte ausgegeben werden. Ein praktikabler technischer Ansatz zur Lösung dieses Problems besteht darin, große Modelle als Planungs- und Argumentationsmaschinen zu verwenden und die Glaubwürdigkeit und Genauigkeit durch den Einsatz verschiedener Arten externer wissenschaftlicher Tools zu verbessern.

Der dritte Grund ist die Fähigkeit des Modells, kontinuierlich Feedback zu geben und sich weiterzuentwickeln.Einerseits können wissenschaftliche Großmodelle hochwertiges Feedback von Forschern nutzen, um das Fachwissen im wissenschaftlichen Bereich zu verbessern, die Fähigkeit zur Modellierung und Ableitung wissenschaftlicher Erkenntnisse zu verbessern und das Niveau der Generierung wissenschaftlicher Inhalte, der Literaturinduktion und der Argumentation zu steigern. Andererseits können sie experimentelles Feedback nutzen, um ihre Fähigkeit zur Entwicklung wissenschaftlicher Hypothesen und zur Optimierung experimenteller Pläne kontinuierlich zu verbessern.

Die vierte ist Illusion (Halluzination) Eliminationsfähigkeit.Halluzination bezeichnet das Phänomen, dass modellgenerierte Inhalte nicht mit realen Fakten oder Benutzereingaben übereinstimmen. Die effektive Überprüfung von Expertenwissen und die Nutzung hochpräziser Fachkenntnisse für das bestärkende Lernen zur Iteration und Aktualisierung großer Modelle ist eine wichtige Methode zur Beseitigung wissenschaftlicher Illusionen. Darüber hinaus ist eine gezielte Optimierung und Integration auf der Grundlage des Basismodells zur Verbesserung der Glaubwürdigkeit und Genauigkeit des Modells in bestimmten Bereichen ebenfalls ein wichtiger Weg zur Korrektur wissenschaftlicher Illusionen.

endlich,Der Evaluations-Benchmark wissenschaftlicher Großmodelle prüft einerseits das modal- und disziplinübergreifende Datenverständnis und die Modellierungsfähigkeiten wissenschaftlicher Großmodelle; Zum anderen wird bewertet, ob die großen wissenschaftlichen Modelle in der Lage sind, mithilfe wissenschaftlicher Werkzeuge komplexe Aufgaben präzise und zuverlässig zu erledigen, und ob sie in der Lage sind, die Generierung falscher und schädlicher Inhalte zu verhindern.

Generative Simulation und Inversion

Die Verwendung von Simulations- und Computersimulationstools zur Erzielung der Schlussfolgerung zwischen „Theorie und Phänomen“ ist eines der wichtigsten Paradigmen der wissenschaftlichen Forschung. Herkömmliche Simulationsmethoden auf Basis numerischer Berechnungen weisen in vielen realen Szenarien Einschränkungen und Herausforderungen hinsichtlich der Lösungsgeschwindigkeit und -genauigkeit auf.

Generative Simulation und Inversion des Simulationsraums

Wie in der obigen Abbildung dargestellt, ist das generative neuronale Netzwerk die Grundstruktur.Das Problem der numerischen Lösung komplexer Systeme kann in ein Datenanpassungsproblem umgewandelt werden.Um die Lösung zu beschleunigen, wird eine effiziente Abbildung vom Hypothesenraum zum Simulationsraum erstellt. Darüber hinaus kann die generative Rendering-Technologie auch die Generierung von Darstellungen wissenschaftlicher Phänomene vom Simulationsraum in den Beobachtungsraum realisieren und dann ein Closed-Loop-Lernen über die drei Räume „Hypothese-Simulation-Beobachtung“ hinweg realisieren, um die Umkehrung von Gesetzen voranzutreiben.

Autonomes intelligentes unbemanntes Experimentalsystem

Das autonome, intelligente und unbemannte Experimentiersystem zielt darauf ab, die technologischen Errungenschaften in den Bereichen KI und Robotik mit wissenschaftlichen Experimenten zu kombinieren und die Effizienz und Wiederverwendbarkeit von Experimenten durch unbemannte, standardisierte und groß angelegte Experimentierprozesse zu verbessern.

Intelligentes unbemanntes Selbstbedienungs-Experimentiersystem

Der Aufgabenablauf der unbemannten experimentellen Betriebsplattform und des intelligenten Systems umfasst im Wesentlichen drei Schritte:
*Automatische Optimierung von Lösungen 

*Autonome Missionsplanung
*Unbemannter Versuchsbetrieb

Gleichzeitig, abhängig von der Betriebsgenauigkeit,Unbemannte experimentelle Operationen können in zwei räumliche Skalen unterteilt werden: mikroskopisch und makroskopisch.Objekte unbemannter Experimente im mikroskopischen Maßstab sind in der Regel winzige Partikel wie lebende Zellen und Proteine, und oft werden feste Versuchsplattformen verwendet. Das Kernproblem besteht darin, den Durchsatz hochpräziser Operationen zu verbessern. Bei unbemannten Versuchsabläufen im Makromaßstab steht die Vollständigkeit des Versuchsprozesses im Vordergrund. Dabei kommen hauptsächlich mobile Roboter zum Einsatz, die mit Roboterarmen ausgestattet sind, um sich autonom zwischen Versuchsgeräten zu bewegen und vollautomatisierte Multitasking-Experimente durchzuführen.

Darüber hinaus ist die Entwicklung intelligenter Systemsoftware auf der Grundlage der Hardwareplattform ein weiteres grundlegendes Problem der autonomen intelligenten unbemannten Versuchsplattform. Die Software steuert die Prozesse der Selbstzustandswahrnehmung, der Wahrnehmung der äußeren Umgebung, der mobilen Navigation, der Instrumentenpositionierung, der experimentellen Betriebsplanung und der Steuerungsausführung. Tiefes Verstärkungslernen und Imitationslernen können autonomes Lernen durch die Erfahrungskurve der Umweltinteraktion oder die Expertenlehrkurve durchführen und eine Zuordnungsbeziehung zwischen Beobachtungsinformationen und optimalen Aktionen aufbauen.

Groß angelegte wissenschaftliche Forschungszusammenarbeit

Intelligente wissenschaftliche Einrichtungen unterstützen den Datenaustausch, um die Entwicklung und Erprobung von KI-Modellen zu erleichtern. Allerdings müssen eine Reihe von Maßnahmen ergriffen werden, um die geistigen Eigentumsrechte und Interessen der Datenentwickler zu identifizieren und zu schützen. In den letzten Jahren hat die dezentralisierte Wissenschaft (DeSci) viel Aufmerksamkeit von Forschern auf sich gezogen. DeSci zielt darauf ab, Web3-Tools, einschließlich Smart Contracts und Blockchain, zu nutzen, um Probleme des geistigen Eigentums in der wissenschaftlichen Forschung zu lösen und den Austausch und die Verbreitung wissenschaftlicher Daten zu fördern.

In der vom Forschungsteam vorgeschlagenen intelligenten wissenschaftlichen AnlagenarchitekturDie Blockchain-Technologie bietet die Grundlage für die Schaffung einer sicheren und vertrauenswürdigen kollaborativen Umgebung. Federated-Learning-Technologie kann das Dateninselproblem in einer dezentralen kollaborativen Umgebung lösen und Datensicherheit sowie Effizienz der wissenschaftlichen Forschung gewährleisten. Internet-Schwarmintelligenz kann verschiedene wissenschaftliche Forschungsmodule in eine einheitliche Plattform integrieren, um eine effiziente groß angelegte wissenschaftliche Forschungszusammenarbeit zu erreichen.

Groß angelegtes System zur wissenschaftlichen Forschungszusammenarbeit

Die Entwicklung von KI für die Wissenschaft praktizieren und fördern

Als erste Phase der Umsetzung des Konzepts intelligenter wissenschaftlicher Einrichtungen hat die Shanghai Jiao Tong University die offene wissenschaftliche Datenplattform „AI for Science“ aufgebaut, die vier Unterplattformen umfasst: wissenschaftliche Rechenleistungsbasis, wissenschaftliche Daten, künstliche Intelligenz und wissenschaftliche Zusammenarbeit. Auf Grundlage dieser Plattform hat es das „Magnolia Science Model“ entwickelt und im Juli bzw. Dezember 2023 die Versionen 1.0 und 2.0 veröffentlicht, die die Bereiche Chemie, Flüssigkeiten, Recht, wissenschaftsübergreifende Bewertungsbenchmarks und andere Bereiche abdecken.

In,Das vor kurzem veröffentlichte „Magnolia Science Model 2.0“ umfasst „Open Source Law (BAI-Law-13B)“ und „Chemical Synthesis 2.0 (BAI-Chem 2.0)“.

BAI-Law-13B wurde einem Domänen-Vortraining unterzogen, bei dem große Mengen maßgeblicher Daten aus dem chinesischen Internet, Open-Source-Codes, Gerichtsdokumente, Rechtsdokumente und Rechtsbücher verwendet wurden, um das BAI-Law-13B-Base-Modell zu bilden. Auf dieser Grundlage wurden die Überwachung und Feinabstimmung juristischer Anwendungsszenarien wie das Erinnern an Rechtswissen, das Verstehen von Rechtswissen und die Anwendung von Rechtswissen integriert, um das Modell BAI-Law-13B-SFT zu bilden. Es wird berichtet, dass im Benchmark für die umfassende rechtliche Bewertung durch Dritte LawBench  Im Test übertraf es alle Open-Source-Großmodelle aus China und alle großen juristischen Modelle aus China.

BAI-Chem 2.0 ermöglicht eine schnelle und effiziente Entwicklung von Arzneimittelmolekülen und kann pro Sekunde 30 medikamentenähnliche, hochaffine Moleküle für das Ziel entwerfen. Die Genauigkeit der Top1-Einzelschritt-Retrosynthese im öffentlichen Datensatz des USPTO-Testsatzes ist im Vergleich zum aktuellen Bestwert in der Literatur um 15% verbessert. Die Ausbeutevorhersage R² für experimentelle Hochdurchsatzdaten erreichte 0,88; die Genauigkeit der Katalysatorempfehlung erreichte 93,7%. Derzeit hat BAI-Chem 2.0 die Nassexperimentverifizierung effektiv verbunden, eine experimentelle Optimierung online realisiert und die Effizienz chemischer Experimente schnell verbessert.

Die frühe Aufmerksamkeit, die dem Thema „KI für die Wissenschaft“ gewidmet wurde, und die Einrichtung eines entsprechenden Forschungsteams zeigen, welche Bedeutung die Shanghai Jiao Tong University der hochmodernen KI-Anwendung AI4S beimisst. Derzeit hat das Team nicht nur relevante Ergebnisse erzielt, sondern auch weiterhin mit verwandten Unternehmen zusammengearbeitet. Man geht davon aus, dass die interdisziplinäre und plattformbasierte Zusammenarbeit im „Konzept intelligenter wissenschaftlicher Einrichtungen“ in naher Zukunft tatsächlich verwirklicht wird.

Quellen:
1.https://news.sjtu.edu.cn/jdzh/20240124/193351.html
2.https://cloud.baidu.com/news/news_85aaa2be-241d-45c2-8aa1-3c8bbcfbd09b