Command Palette
Search for a command to run...
FusionProt: Fusionssequenz- und struktureller Informationen für die einheitliche Lernung proteinrepräsentativer Darstellungen
Dan Kalifa Uriel Singer Kira Radinsky

Abstract
Proteine spielen eine entscheidende Rolle bei biologischen Prozessen, und das Verständnis der komplexen Mechanismen in lebenden Organismen ist von zentraler Bedeutung. Eine präzise Darstellung von Proteinen ist für Fortschritte in der Arzneimittelentwicklung, der synthetischen Biologie sowie der Aufklärung von Krankheitsmechanismen von entscheidender Bedeutung. Die derzeit gängigen Methoden konzentrieren sich hauptsächlich auf ein-dimensionale (1D) Strukturen, wobei der Fokus auf Aminosäuresequenzen liegt. Dieser Ansatz vernachlässigt jedoch die essenziellen dreidimensionalen (3D) Strukturmerkmale, die die Funktion und Interaktionen von Proteinen maßgeblich bestimmen. Erste Versuche, sowohl die 1D- als auch die 3D-Modaliäten zu nutzen, haben im Vergleich zu Darstellungen auf Basis einer einzigen Modality nur begrenzte Vorteile gezeigt. In dieser Arbeit stellen wir FusionProt vor – einen neuartigen Ansatz für die Lernung von Proteinrepräsentationen, der gleichzeitig vereinheitlichte Darstellungen der 1D- und 3D-Strukturen von Proteinen erlernt. FusionProt integriert einen innovativen, lernbaren Fusionstoken, der als adaptiver Brückenkopf fungiert und einen iterativen Austausch von Informationen zwischen einem Protein-Sprachmodell und dem 3D-Strukturgraphen des Proteins ermöglicht. Dieser Token wird in den Trainingsprozess beider Modalitäten integriert, wodurch eine nahtlose Informationsweitergabe gewährleistet und durch iterative Lernzyklen eine umfassende Repräsentation ermöglicht wird. Empirische Evaluierungen an verschiedenen biologischen Aufgaben zeigen, dass FusionProt eine state-of-the-art-Leistung erzielt und somit einen signifikanten Fortschritt im Bereich der Proteinrepräsentationslernung darstellt.
KI mit KI entwickeln
Von der Idee bis zum Start — beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und den besten GPU-Preisen.