Command Palette
Search for a command to run...
TACK Targeted Chimera Knowledge Base Dataset
TACK (TArgeting Chimeras Knowledge) ist ein standardisierter Wissensdatenbank-Datensatz und Benchmark-Set, der 2026 vom AI Laboratory for Molecular Engineering veröffentlicht wurde. Dieser Datensatz wurde speziell für die maschinelle Lernaufgabe der Vorhersage der PROTAC-Abbauaktivität entwickelt. Zugehörige Forschungsarbeiten umfassen… TACK: Eine statistische Auswertung der Abbauaktivität auf einem neuartigen TArgeting Chimeras Knowledge-DatensatzEs zielt darauf ab, die Probleme der Datenknappheit, des Mangels an strengen Evaluierungen und der begrenzten Abdeckung in bestehenden PROTAC-Benchmarks für maschinelles Lernen zu beheben. Es findet breite Anwendung in Bereichen wie der Vorhersage der PROTAC-Abbauaktivität, der Forschung zum gezielten Proteinabbau (TPD), der KI-gestützten Wirkstoffentwicklung (AIDD), dem computergestützten Wirkstoffdesign (CADD), dem virtuellen Wirkstoffscreening, dem Multitask-Learning, der Vorhersage molekularer Eigenschaften, der Forschung zu Graph-Neuronalen Netzen und dem Testen von Benchmarks für maschinelles Lernen. Dieser Datensatz umfasst 6.561 Einträge, darunter 4.184 DC50-Einträge, 2.377 Dmax-Einträge und 1.563 Multitask-Einträge. Er beinhaltet 3.514 einzigartige PROTAC-Moleküle, 164 Zielproteine (POIs), 9 E3-Ubiquitin-Ligasen (E3-Ligasen) und 155 Zelllinien mit vielfältigen chemischen Strukturmerkmalen und unterschiedlichen biologischen Versuchsbedingungen. Basierend auf den Aktivitätskriterien DC₅₀ ≤ 100 nM und Dmax ≥ 80% wurden ca. 55%-Proben als aktiv eingestuft.
Datensatzzusammensetzung
Es enthält drei Datensätze zur Unterstützung verschiedener Arten von Vorhersageaufgaben zur PROTAC-Abbauaktivität:
- DC50: Enthält ausschließlich Kennzahlen zur Effizienz des Proteinabbaus (DC₅₀) mit insgesamt 4.184 Datensätzen.
- Dmax: Enthält ausschließlich die Daten zum maximalen Degradationseffizienzindex (Dmax) mit insgesamt 2.377 Datensätzen.
- Multitask: Enthält gepaarte DC₅₀- und Dmax-Daten für dasselbe PROTAC-Molekül unter identischen experimentellen Bedingungen, insgesamt 1.563 Datensätze. Geeignet für Multitask-Learning und binäre Klassifizierungsstudien.
Zitat
@misc{ribes2026tackstatisticalevaluationdegradation,
title={TACK: A statistical evaluation of degradation activity on a novel TArgeting Chimeras Knowledge dataset},
author={Stefano Ribes and Nils Dunlop and Rocío Mercado},
year={2026},
eprint={2605.19579},
archivePrefix={arXiv},
primaryClass={q-bio.QM},
url={https://arxiv.org/abs/2605.19579},
}
KI mit KI entwickeln
Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.