Dreier Unternehmen verbunden: 30-Millionen-Zellen-Atlas und künstliche Intelligenz für Bioinformatik veröffentlicht
Miraomics, Pythia Biosciences und LatchBio haben eine Zellatlas-Datenbank mit 30 Millionen Zellen veröffentlicht, die über 150 Indikationen, 200 Gewebearten und 27 Messverfahren abdeckt. Diese Daten stammen aus öffentlichen Quellen und wurden strukturiert und annotiert, um für fortgeschrittene Bioinformatik und maschinelles Lernen nutzbar zu sein. Die Zellatlas-Datenbank ist derzeit die größte Sammlung von scRNA-Seq-Daten im Internet und bietet die vielfältigste Quelle von Krankheiten, Geweben und Patienten. Der Fortschritt in der Biologieingentechnik hängt zunehmend von datenhungrigen statistischen Modellen ab, die es ermöglichen, die komplexen Eigenschaften lebender Systeme zu analysieren, die über die Fähigkeiten unbeholfener menschlicher Kognition hinausgehen. Obwohl zielgerichtete industrielle Datenerzeugungsanstrengungen, wie Störungsatlas, einen möglichen Weg bieten, sind sie noch nicht breit genug, um in vielen praktischen translatorischen Kontexten, insbesondere bei Indikationen mit kleinen Patientengruppen, verallgemeinert zu werden. Lösungsanbieter wie Pythia und Miraomics nutzen ihr tiefes Wissen zur Kuration molekularer Daten, um öffentlich verfügbare Studien für groß angelegte Bioinformatik und maschinelles Lernen zu strukturieren. Mit Hilfe von Latch’s weißen Dateninfrastruktur und dem Datenportal bereiten sie Millionen von Zellen auf und vertreiben sie an ihre Kunden aus der Biopharmaindustrie und Biotechnologie. Tristan Gill, Co-Gründer und CEO von Pythia, betonte: „Durch die Zusammenarbeit mit vorausschauenden Partnern wie LatchBio und Miraomics können wir unseren hochwertigen, fachkundig currierten wissenschaftlichen Inhalt einem breiteren Segment der Forschergemeinschaft zur Verfügung stellen und lebensrettende Durchbrüche beschleunigen. Dies markiert den Anfang vieler Veröffentlichungen, bei denen Teile der Pythiomics Multi-Omics-Datenbank über die Latch-Plattform bequem zugänglich gemacht werden.“ Eugene Bolotin, Co-Gründer und CEO von Miraomics, ergänzte: „Wir freuen uns, diese wichtige Veröffentlichung hochwertiger, currierter Daten bekannt zugeben, die Tausende von Stunden Kurationseffort repräsentieren. Sie ermöglichen neue Entwicklungsgelegenheiten für fortschrittliche KI-Werkzeuge und neue Erkenntnisse in der Grundlagenforschung, der Krankheitsprogression und der Arzneimittelentwicklung.“ LatchBio hat außerdem ein Suite von agenterisch arbeitenden Werkzeugen zur Kuration molekularer Daten veröffentlicht, die die Kuration pro Datensatz um etwa 40-fach beschleunigt und die Annotation durch die Einbeziehung von Informationen aus gesamten Artikeln und unstrukturierten Ergänzungen verbessert. Dieses Framework kann in einigen Fällen die Kuration vollständig automatisieren. Eine Weiße Papier mit Details zu dessen Design und Funktion ist hier zu finden: http://latch.bio/latch-curate. Kenny Workman, Co-Gründer und CTO von LatchBio, erklärte: „Unser Ziel ist es, die öffentlichen molekularen Daten der Welt so zu organisieren, dass sie für kleinere Biotech-Unternehmen, große Pharmakonzerne und innovative KI-Labors unmittelbar auf Basis der Nutzung zugänglich sind.“ Diese Veröffentlichung markiert einen wichtigen Meilenstein in der Kuration und Verteilung molekularer Daten. Sie ermöglicht Fortschritte in der Biologieingentechnik und der Entwicklung neuer KI-Werkzeuge, die wiederum tiefergehende Einblicke in grundlegende biologische Prozesse, die Progression von Krankheiten und die Entdeckung von neuen Medikamenten liefern. Die Zusammenarbeit zwischen Miraomics, Pythia Biosciences und LatchBio zeigt die effiziente Nutzung öffentlicher Ressourcen und die Fähigkeit, umfangreiche Daten in nutzbare und hochwertige Formate zu transformieren. Die LatchBio-Suite zur Kuration molekularer Daten revolutioniert den Prozess und setzt neue Maßstäbe in der Qualität und Konsistenz der Datenannotation.