HyperAI

Ausführlicher Austausch Von Forschungspionieren Des HUST/Shanghai AI Lab/Shanghai Jiaotong University: Neueste Erfolge, Erfahrungen Mit Der Einreichung Von Beiträgen Bei Top-Konferenzen, Herausforderungen Der Interdisziplinären Zusammenarbeit …

特色图像

Künstliche Intelligenz integriert mehrere Disziplinen wie Informatik, Mathematik, Statistik und Kognitionswissenschaft und ihre Entwicklung hängt in hohem Maße von der Förderung interdisziplinärer Talente ab. In den letzten Jahren hat der Aufstieg der KI in der Wissenschaft allen das disruptive Potenzial der tiefen Integration von künstlicher Intelligenz und grundlegenden Disziplinen vor Augen geführt. Heute verhelfen viele herausragende Wissenschaftler mit ihrem multidisziplinären Hintergrund der wissenschaftlichen Forschung zu neuen Höhen. Zum Beispiel:

* Außerordentlicher Professor Huang Hong von der Huazhong University of Science and Technology verfügt über akademische Erfahrung in Rundfunk- und Fernsehtechnik, Informationstechnik und Informatik.Heute konzentriert sie sich auf datengesteuerte wissenschaftliche Forschung, darunter Data Mining, Big Data-Analyse, Analyse sozialer Netzwerke usw.

* Zhou Dongzhan, ein junger Forscher am AI for Science Center des Shanghai Artificial Intelligence Laboratory, begann seine Karriere in der Physik.Hat sich der künstlichen Intelligenz zugewandt und arbeitet nun an der Anwendung von KI in den Materialwissenschaften;

* Zhou Bingxin, wissenschaftlicher Mitarbeiter am Institut für Naturwissenschaften der Shanghai Jiao Tong University,Ihr Bachelorstudium absolvierte sie im Fach Finanzwesen, ihr Masterstudium im Fach Datenanalyse und ihr Doktoratsstudium konzentrierte sich auf maschinelles Lernen und Deep Learning. Jetzt nutzt sie Deep Learning, um Probleme im biologischen Bereich zu lösen, etwa Proteindesign und -modifikation auf der Grundlage von Deep-Learning-Algorithmen.

Huang Hong: Unsere Forschung sollte in der Lage sein, praktische Probleme wirklich zu lösen

Als außerordentlicher Professor und Doktor-/Masterbetreuer an der Huazhong University of Science and Technology beschäftigt sich außerordentlicher Professor Huang Hong seit vielen Jahren intensiv mit den Bereichen Data Mining und Big Data-Analyse und hat als Erst-/Korrespondenzautor zahlreiche Artikel in führenden internationalen Fachzeitschriften und auf Konferenzen wie TKDE, TKDD, WWW, IJCAI und WSDM veröffentlicht. Ihr Weg als wissenschaftliche Forscher verlief jedoch nicht reibungslos.

Außerordentlicher Professor Huang Hong

Außerordentliche Professorin Huang Hong erinnerte sich an ihre frustrierenden Erfahrungen während des Graduiertenstudiums und sagte, sie habe eine Arbeit 28 Mal überarbeitet. Als sie es zum 25. Mal überarbeitete, fühlte sie sich überfordert. Später beruhigte sie sich mit der Ermutigung ihrer Freunde und Mentoren, überprüfte die Arbeit noch einmal und stellte fest, dass es noch viele Details gab, die verbessert werden mussten. Durch kontinuierliche Anpassungen und Verbesserungen gelang es ihr schließlich, es zu veröffentlichen.

Nach Ansicht von Associate Professor Huang Hong liegt der Schlüssel zur wissenschaftlichen Forschung darin, zu erkennen, ob die Idee Ihres Artikels ein Problem in einem bestimmten Aspekt wirklich lösen kann und ob sie eine vernünftige Forschungsmotivation liefert. Basierend auf diesem Konzept,Ihre Forschung konzentriert sich auf zwei Richtungen: erstens, innovative Methoden in der Big Data-Analyse und im Data Mining; zweitens die Entwicklung datengesteuerter Anwendungen zur Lösung praktischer sozialer Probleme.

Im Bereich der methodischen Innovation konzentriert sich das Team von Associate Professor Huang Hong hauptsächlich auf Graph-Neuralnetzwerke und die Modellierung komplexer Systeme. Sie ist davon überzeugt, dass man im aktuellen Zeitalter von Big Data den Wert der Daten effektiver ausschöpfen kann, indem man eine Graphstruktur zur Darstellung der Dinge um uns herum verwendet, das heißt, indem man Dinge abstrakt als Knoten modelliert, die Beziehungen zwischen diesen Knoten analysiert und dann eine Graphstruktur erstellt.

Darüber hinaus entwickelt ihr Team auch datengesteuerte Anwendungen, beispielsweise zur Analyse sozialer Netzwerke. Zwischen 2009 und 2012 erreichte die Entwicklung sozialer Netzwerke ihren Höhepunkt und Plattformen wie Weibo, Twitter und Facebook entstanden nach und nach. Dies veranlasste das Team von Associate Professor Huang Hong auch dazu, die Daten dieser Plattformen zu verwenden, um die Entwicklung der Netzwerkstruktur zu analysieren und Benutzerempfehlungen, Analysen der öffentlichen Meinung und andere Arbeiten durchzuführen.

„Während der COVID-19-Pandemie haben wir die Kommentare der internationalen Nachrichtenmedien zu China analysiert und die Veränderungen in der Haltung ausländischer Netzwerke gegenüber China untersucht. So konnten wir Daten gewinnen, die zum Verständnis externer Positionen beitragen“, sagte Associate Professor Huang Hong.

Eine weitere interessante Fallstudie ist die Analyse des sozioökonomischen Status von Einzelpersonen und dessen Nutzung für die Stadtplanung.„Wir arbeiten mit der Telekommunikationsabteilung zusammen, um die mobilen Verkehrsprotokolldaten der Benutzer zu erhalten, die Aktivitätsbereiche der Benutzer durch Analyse ihrer GPS-Standorte zu identifizieren und sie mit Informationen zu den Immobilienpreisen in diesen Bereichen zu kombinieren, um auf das Niveau des Gebiets in der Stadt zu schließen.“ Um ein einfaches Beispiel zu nennen: Wenn sich eine Person häufig in einem Finanzviertel aufhält, kann das bedeuten, dass sie einen hohen sozioökonomischen Status hat. Wenn sie sich hingegen oft in der Nähe von Schulen oder Bildungseinrichtungen aufhält, kann es sich bei ihr um einen Schüler oder Lehrer handeln. Auf dieser Grundlage können Forscher den sozioökonomischen Status von Einzelpersonen umfassend beurteilen und Referenzen für die Stadtplanung liefern.

Im Bereich der industriellen IntelligenzDas Team von Associate Professor Huang Hong nutzt außerdem künstliche Intelligenz, um Fehler in Industrieanlagen automatisch zu erkennen und zu diagnostizieren, wodurch die Effizienz und Genauigkeit der Anlagenwartung erheblich verbessert wird.

Außerordentlicher Professor Huang Hong schloss mit den Worten: „Sie müssen an der Forschung interessiert sein, die Sie betreiben möchten.“ Ihrer Meinung nach ist wissenschaftliche Forschung im Grunde ein langweiliger Prozess, der viel Geduld erfordert, aber wenn man wirklich daran interessiert ist, hat man die nötige Eigenmotivation, durchzuhalten. „Das ist auch die Eigenschaft, auf die ich bei der Rekrutierung von Studierenden am meisten Wert lege.“

Zhou Dongzhan: Lassen Sie KI neue Ideen generieren wie Wissenschaftler

Auch Dr. Zhou Dongzhan stimmt der Ansicht von Associate Professor Huang Hong zu: „Wenn man kein Interesse hat, ist es tatsächlich schwierig, einen besseren Job zu machen.“ Ihrer Meinung nach besteht der entscheidende Punkt bei der Wahl einer Forschungsrichtung nicht darin, zu beurteilen, ob das Gebiet „angesagt“ oder „populär“ ist. In populären Bereichen kann es in der Branche immer noch zu beispielhaften Ergebnissen kommen, und auch in Nischenbereichen können neue Probleme aufgedeckt werden. Wir sollten aus unserer Komfortzone ausbrechen, homogene Forschung vermeiden und uns dafür entscheiden, solidere Ergebnisse zu erzielen.

Derzeit konzentriert sich Dr. Zhou Dongzhans Forschung auf die Anwendung von KI-Technologien wie großen Sprachmodellen und multimodalen Modellen in der Materialwissenschaft.Die wichtigsten Ergebnisse sind in der folgenden Abbildung dargestellt:

Letzten Januar,Das Shanghai Artificial Intelligence Laboratory hat ein großes Sprachmodell im Bereich der Chemie namens „Shusheng Jianyuan“ eingeführt.Erkunden Sie topaktuelle Themen, die allgemeine Großmodelle mit professionellen Feldern kombinieren. Das chemische Sprachmodell eignet sich gut für viele zentrale chemische Aufgaben (Moleküle und Reaktionen betreffend) und viele Indikatoren übertreffen GPT-4. Angesichts der Bedeutung externen Wissens in der chemischen Forschung,Das Team hat dem Sprachmodell den Retrieval Augmented Generation (RAG)-Mechanismus hinzugefügt.Um Probleme mit Modellhalluzinationen zu reduzieren. Angesichts der Vielfalt chemischer DatenmodalitätenDarüber hinaus entwickelte das Team ein multimodales Versionsmodell.Diese Version des Modells weist gute Ergebnisse bei der molekularen Erkennung und beim multimodalen chemischen Denken auf und viele Indikatoren übertreffen GPT-4v. Angesichts der Bedeutung der Verwendung wissenschaftlicher Werkzeuge für Modelle,Das Team hat ein Agent-Toolkit entwickelt.Integrieren Sie mehr als 50 chemische Tools aus den Bereichen Suche, Berechnung, Moleküle und Reaktionen, damit das Modell die zugehörigen Aufgaben effizienter ausführen kann.

Auf Grundlage der oben genannten Forschungsergebnisse möchte das Laborteam die KI dazu bringen, komplexere Aufgaben zu übernehmen, anstatt das große Sprachmodell nur auf der Frage-Antwort-Ebene zu belassen. Daher begann das Team zu untersuchen, ob KI wie Wissenschaftler neue wissenschaftliche Forschungshypothesen generieren kann.

Wie in der obigen Abbildung dargestellt, wird KI verwendet, um automatisch Forschungshypothesen basierend auf gegebenem Forschungshintergrund und gegebenen Problemen zu generieren. Wenn Sie beispielsweise einen bestimmten Batterietyp untersuchen und nach Materialien und Komponenten suchen, die bestimmte Eigenschaften aufweisen, können Sie hochwertige wissenschaftliche Ideen generieren, indem Sie einfach Forschungskontext und Inspiration entkoppeln und das MOOSE-CHEM-System und seine integrierten Multi-Agent-Operationen kombinieren.

Untersuchungen haben ergeben, dass die Formulierung wissenschaftlicher Hypothesen ein komplexer Denkprozess ist, der sich nur schwer direkt in einem einzigen Schritt umsetzen lässt. Daher zerlegte das Team den Prozess, suchte iterativ nach Inspiration und Hypothesen und durchsuchte die generierten Hypothesen weiter, um sicherzustellen, dass die endgültigen wissenschaftlichen Hypothesen fundierter und vielfältiger waren.

Gleichzeitig erstellte das Team auch eine wissenschaftliche Hypothese, die durch die Benchmark-Evaluierung generiert wurde. Wie in der folgenden Abbildung gezeigt, ergab die Studie, dass Modelle mit besserer Leistung über stärkere Abruffunktionen verfügen.

Darüber hinaus bestätigte die Studie auch, dass das Modell bei elektrochemischen Aufgaben ausführbare wissenschaftliche Hypothesen und nicht nur allgemeine Konzepte generieren kann. Zu den wissenschaftlichen Hypothesen gehören beispielsweise die Kernkomponenten des Materials, wie metallisches Ruthenium, Stickstoffdotierung usw.,Das Laborteam arbeitet bereits mit relevanten Forschungsgruppen zusammen und hofft, die praktische Anwendung des Systems voranzutreiben und es zu einem echten wissenschaftlichen Forschungsassistenten zu machen.

Das Laborteam arbeitet daran, KI die Entwicklung wissenschaftlicher Forschungsideen zu ermöglichen und sogar wissenschaftliche Innovationen zu fördern. Im Rückblick auf seine eigene akademische Laufbahn gab Zhou Dongzhan zu, dass seine Einstellung zur wissenschaftlichen Forschung stark vom Physiker Wu Jianxiong beeinflusst worden sei: „Die Abweichung der Forschungsergebnisse kann auf ein sehr kleines Detailproblem zurückzuführen sein.“ Daher betont sie stets, dass die Aufmerksamkeit auf Details und gründliches Denken der Schlüssel zum Durchbruch in der wissenschaftlichen Forschung seien.

Zhou Bingxin: Selbst entwickeltes Proteinmodell steht an erster Stelle der globalen Autoritätsliste

Auf dem Weg eines jeden Menschen kann es ein „Idol“ geben, das einen subtilen Einfluss auf das Studium, die Karriere und sogar die Lebensplanung hat. Dr. Zhou Bingxin sprach über ihr „Idol der wissenschaftlichen Forschung“ und sagte: „Der Grund, warum ich mich für die wissenschaftliche Forschung entschieden habe, wurde größtenteils von meinem Doktorvater beeinflusst.“ Nach Zhou Bingxins Eindruck ist ihr Doktorvater eine sehr verantwortungsbewusste Person, ernsthaft, geduldig, zugänglich und antwortet innerhalb von Sekunden auf Nachrichten der Studenten. Er half ihr sogar, den Code Wort für Wort zu ändern und die Herleitung der Formel Zeile für Zeile zu überprüfen. „Ich hoffe, dass ich in Zukunft wie mein Mentor sein kann und die Ausbildung der Studierenden als etwas sehr Wichtiges betrachte.“

Wenn es um die Wahl der Richtung wissenschaftlicher Forschung geht, glaubt Zhou Bingxin, dass es nicht den einen „richtigen Weg“ gibt. Der Schlüssel liegt darin, den Weg zu finden, der am besten zu Ihnen passt, und dabei zu bleiben. „Es hängt davon ab, was Sie lieber tun möchten und von Ihrer Risikobereitschaft. Solange Sie glücklich sind, besteht kein Grund, dem Trend blind zu folgen.“

Zhou Bingxin stellte außerdem einige Forschungsergebnisse des Teams aus den letzten Jahren vor, insbesondere die Erforschung der KI bei der Proteinmodifikation.

In der Industrie werden Enzyme unter anderem in der Arzneimittelentwicklung, der Krankheitsüberwachung und dem Kunststoffabbau eingesetzt. Natürliche Proteine stammen jedoch aus der Natur und haben ihre eigene spezifische Lebensumgebung (wie beispielsweise hohen Druck und hohe Temperaturen), die den industriellen Anforderungen möglicherweise nicht gerecht wird. Daher müssen sie modifiziert werden, um ihre katalytische Aktivität, thermische Stabilität, Bindungsaffinität und Substratselektivität zu verbessern.

In den letzten Jahren hat sich das Proteindesign mithilfe künstlicher Intelligenz allmählich herausgebildet.Wie in der folgenden Abbildung gezeigt, kann das selbstüberwachte Modell, vereinfacht ausgedrückt, zunächst eine große Menge an Proteindaten (Sequenz, Struktur, evolutionäre Informationen) erlernen. Anschließend wird eine kleine Menge gekennzeichneter Datensätze im Zusammenhang mit nachgelagerten Aufgaben (Vorhersage der Proteinaktivität) zum Trainieren eines Vorhersagemodells verwendet. Je nach Bedarf (Aktivitätssteigerung) wird die Struktur bzw. Sequenz des Proteins neu optimiert oder komplett neu gestaltet.

Nachdem eine Proteinsequenz modifiziert wurde, kann sie in Expressionssysteme wie E. coli und Hefe transfiziert werden, damit das biologische Team sie exprimieren und reinigen kann. Das gereinigte Protein wird dann auf seine biochemischen Eigenschaften wie Aktivität, Stabilität und Bindungsaffinität getestet, die von der spezifischen Anwendung des Proteins abhängen. Auch Algorithmen können diesen Prozess unterstützen, indem sie beispielsweise die Expressivität, Löslichkeit und Aktivität eines bestimmten Proteins vorhersagen. Schließlich muss im Experiment nur die vom Algorithmus empfohlene Proteinsequenz verwendet werden, was weitere Kosten sparen kann.

Wie in der Abbildung unten gezeigt,Die Arbeit des Teams von Zhou Bingxin konzentriert sich auf verschiedene Module des Protein-Engineerings, einschließlich, aber nicht beschränkt auf die Ableitung von Sequenzen aus der Proteinstruktur und die Ableitung von Sequenzen aus der Funktion.„Wir hoffen, unsere eigenen Werkzeuge zu entwickeln und zu erforschen, wie wir diese Werkzeuge mit nachfolgenden biologischen Experimenten zu einem vollständigen Zyklus kombinieren können, um so eine iterative Optimierung zwischen Trockenexperimenten (Computersimulationen) und Nassexperimenten (tatsächlichen biologischen Experimenten) zu erreichen.“

Bisher haben die vom Team entwickelten Werkzeuge sowohl in Trocken- als auch in Nassexperimenten hervorragende Ergebnisse erzielt.Auf der weltweit maßgeblichen Liste ProteinGym beispielsweise belegten die Models des Unternehmens den ersten bzw. zweiten Platz.

Darüber hinaus das vom Team entwickelte Wachstumshormon,Die weltweit erste wirklich groß angelegte Produktion (5.000 Liter) von KI-entwickeltem Protein wurde erreicht.Darüber hinaus gelang es ihnen, das Enzym EPS-G7 zu modifizieren, seine Spezifität und katalytische Aktivität zu verbessern und die Produktionskosten um 90% zu senken, wodurch die Beschränkungen des Importmonopols aufgehoben wurden.

Neben der Transformation eines einzelnen Punktes oder weniger Punkte,Sie erstellten außerdem die komplette Proteinsequenz.Beispielsweise werden die Proteine der Ago-Serie (Hochtemperaturüberleben), die zum Scheren von Nukleinsäuren verwendet werden, so modifiziert, dass sie bei Raumtemperatur eine gute Aktivität beibehalten und sich für Scherarbeiten in Nukleinsäure-Testkits eignen.

Das größte Problem zwischen KI-Praktikern und Wissenschaftlern ist die Kommunikation

Es ist erwähnenswert, dass das Fachgebiet von Dr. Zhou Bingxin stark interdisziplinär ist. Um die Kommunikation zwischen KI- und Wissenschaftspraktikern zu fördern, hat sein Team eine große Menge an Daten, Tools und Modulen zur Erkennung nachgelagerter Aufgaben zusammengestellt.Und integrierte es in eine Tool-Bibliothek namens VenusFactory.

Aus Sicht von Dr. Zhou Bingxin sind Kommunikationsfähigkeiten bei der Zusammenarbeit zwischen KI und Wissenschaft von entscheidender Bedeutung. „Als ich anfing, interdisziplinär in der Biologie zu arbeiten, wollten viele Partner aus der Biologie mit uns zusammenarbeiten, aber ich verstand nicht, was sie meinten. Heute kann ich die wissenschaftlichen Probleme, die sie aufwerfen, auf Grundlage meines eigenen Verständnisses in technische Probleme umwandeln und entsprechende Algorithmen zu ihrer Lösung finden.“

Auch Dr. Zhou Dongzhan stimmt dieser Ansicht zu. Sie betonte: „Bei der Zusammenarbeit mit Universitäten, Forschungsinstituten oder Unternehmen ist es entscheidend, sicherzustellen, dass beide Parteien das Problem auf derselben Ebene verstehen. Wir müssen unseren Partnern im wissenschaftlichen Bereich den aktuellen Stand der KI-Technologie vermitteln und auch dem technischen Team klar machen, wo die kritischsten Probleme liegen.“

Außerordentlicher Professor Huang Hong fügte hinzu, dass es sehr wichtig sei, grundlegende Kenntnisse in der interdisziplinären Zusammenarbeit zu beherrschen. Sie erinnerte sich an ihre Zusammenarbeit mit dem Team von Professor Luo Jiade vom Institut für Soziologie der Tsinghua-Universität. In der Anfangsphase schlug das Soziologieteam Forschungsfragen vor und das technische Team leistete Unterstützung bei der Datenanalyse und war für das experimentelle Design verantwortlich. Mit der Zeit eignete sich das technische Team nach und nach die Grundkenntnisse der Soziologie an und begann, selbstständig Fragen zu stellen und mit dem Soziologieteam zu diskutieren. Aus diesem Ideenkonflikt gingen zahlreiche Forschungsergebnisse hervor.

Erwähnenswert ist, dass ICLR 2025 und andere Top-Konferenzen ihre Ergebnisse vor Kurzem bekannt geben und dass es auch mehrere wichtige Konferenzen gibt, deren Fristen noch nicht abgelaufen sind.Wir haben diese Gelegenheit auch genutzt, um die Lehrer ihre Erfahrungen mit der Einreichung von Beiträgen bei führenden KI-Konferenzen teilen zu lassen, wie unten gezeigt:

1. Lesen Sie den Call for Papers sorgfältig durch.Klären Sie die Voraussetzungen für die Annahme von Artikeln bei verschiedenen Top-Konferenzen, um keine Einreichungsmöglichkeiten zu verlieren.

2. Achten Sie auf die Details des Artikels.Das Format sollte stimmen, die Bilder klar und das Layout ansprechend sein.

3. Klären Sie den Abgabetermin.Alle Experimente sollten mindestens eine Woche im Voraus abgeschlossen sein, um die Integrität des Papiers sicherzustellen und den Spielraum für Fragen der Gutachter zu verringern.

4. Forschungsfragen,Ob die Idee des Artikels wirklich ein bestimmtes Problem löst; ob die Forschungsmotivation vernünftig ist.

5. Hinweise zum Verfassen von Hausarbeiten

* Vorgeschlagene Gliederung der Arbeit: Stellen Sie zunächst den Hintergrund vor. Zweitens, wie waren die bisherigen Studien und welche Probleme gab es? Drittens: Was ist unsere Aufgabe? Wir sorgen dafür, dass Ihre Idee beim Gutachter ankommt und dieser überzeugt wird.

* Um die Logik des Artikels sicherzustellen, müssen außerdem jede Forschungsfrage und die anschließende experimentelle Überprüfung miteinander verknüpft und in sich konsistent sein.

6. Über Ablehnung:Es ist normal, dass Ihr Manuskript abgelehnt wird. Rezensenten haben unterschiedliche Vorlieben. Sie können es noch ein paar Mal versuchen.