HyperAIHyperAI

Command Palette

Search for a command to run...

TACK Targeted Chimera Knowledge Base Dataset

Datum

vor einer Stunde

Paper-URL

2605.19579

Lizenz

MIT

TACK (TArgeting Chimeras Knowledge) ist ein standardisierter Wissensdatenbank-Datensatz und Benchmark-Set, der 2026 vom AI Laboratory for Molecular Engineering veröffentlicht wurde. Dieser Datensatz wurde speziell für die maschinelle Lernaufgabe der Vorhersage der PROTAC-Abbauaktivität entwickelt. Zugehörige Forschungsarbeiten umfassen… TACK: Eine statistische Auswertung der Abbauaktivität auf einem neuartigen TArgeting Chimeras Knowledge-DatensatzEs zielt darauf ab, die Probleme der Datenknappheit, des Mangels an strengen Evaluierungen und der begrenzten Abdeckung in bestehenden PROTAC-Benchmarks für maschinelles Lernen zu beheben. Es findet breite Anwendung in Bereichen wie der Vorhersage der PROTAC-Abbauaktivität, der Forschung zum gezielten Proteinabbau (TPD), der KI-gestützten Wirkstoffentwicklung (AIDD), dem computergestützten Wirkstoffdesign (CADD), dem virtuellen Wirkstoffscreening, dem Multitask-Learning, der Vorhersage molekularer Eigenschaften, der Forschung zu Graph-Neuronalen Netzen und dem Testen von Benchmarks für maschinelles Lernen. Dieser Datensatz umfasst 6.561 Einträge, darunter 4.184 DC50-Einträge, 2.377 Dmax-Einträge und 1.563 Multitask-Einträge. Er beinhaltet 3.514 einzigartige PROTAC-Moleküle, 164 Zielproteine (POIs), 9 E3-Ubiquitin-Ligasen (E3-Ligasen) und 155 Zelllinien mit vielfältigen chemischen Strukturmerkmalen und unterschiedlichen biologischen Versuchsbedingungen. Basierend auf den Aktivitätskriterien DC₅₀ ≤ 100 nM und Dmax ≥ 80% wurden ca. 55%-Proben als aktiv eingestuft.

Datensatzzusammensetzung

Es enthält drei Datensätze zur Unterstützung verschiedener Arten von Vorhersageaufgaben zur PROTAC-Abbauaktivität:

  • DC50: Enthält ausschließlich Kennzahlen zur Effizienz des Proteinabbaus (DC₅₀) mit insgesamt 4.184 Datensätzen.
  • Dmax: Enthält ausschließlich die Daten zum maximalen Degradationseffizienzindex (Dmax) mit insgesamt 2.377 Datensätzen.
  • Multitask: Enthält gepaarte DC₅₀- und Dmax-Daten für dasselbe PROTAC-Molekül unter identischen experimentellen Bedingungen, insgesamt 1.563 Datensätze. Geeignet für Multitask-Learning und binäre Klassifizierungsstudien.

Zitat

@misc{ribes2026tackstatisticalevaluationdegradation,
title={TACK: A statistical evaluation of degradation activity on a novel TArgeting Chimeras Knowledge dataset},
author={Stefano Ribes and Nils Dunlop and Rocío Mercado},
year={2026},
eprint={2605.19579},
archivePrefix={arXiv},
primaryClass={q-bio.QM},
url={https://arxiv.org/abs/2605.19579},
}

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp