HyperAIHyperAI

Command Palette

Search for a command to run...

Base De Données De Connaissances TACK Targeted Chimera

Date

il y a une heure

URL du document

2605.19579

Licence

MIT

TACK (TArgeting Chimeras Knowledge) est un ensemble de données de référence et une base de connaissances standardisée, publiés par le Laboratoire d'IA pour l'ingénierie moléculaire en 2026. Cet ensemble de données a été spécifiquement conçu pour la prédiction de l'activité de dégradation de PROTAC par apprentissage automatique. Parmi les articles de recherche associés, on peut citer… TACK : Évaluation statistique de l’activité de dégradation sur un nouvel ensemble de données TArgeting Chimeras KnowledgeCe projet vise à pallier les problèmes de rareté des données, de manque d'évaluation rigoureuse et de couverture limitée des benchmarks d'apprentissage automatique PROTAC existants. Il est largement utilisé dans des domaines tels que la prédiction de l'activité de dégradation des PROTAC, la recherche sur la dégradation ciblée des protéines (TPD), la découverte de médicaments assistée par l'IA (AIDD), la conception de médicaments assistée par ordinateur (CADD), le criblage virtuel de médicaments, l'apprentissage multitâche, la prédiction des propriétés moléculaires, la recherche sur les réseaux neuronaux graphiques et les tests de performances en apprentissage automatique. Cet ensemble de données contient 6 561 enregistrements, dont 4 184 enregistrements DC50, 2 377 enregistrements Dmax et 1 563 enregistrements multitâches. Il comprend 3 514 molécules PROTAC uniques, 164 protéines cibles (POI), 9 ligases E3 d'ubiquitine et 155 lignées cellulaires, présentant une grande diversité de caractéristiques structurales chimiques et de conditions expérimentales biologiques. Sur la base des critères d'activité DC₅₀ ≤ 100 nM et Dmax ≥ 80%, environ 551 échantillons TP3T ont été identifiés comme actifs.

Composition de l'ensemble de données

Il contient trois sous-ensembles de données pour prendre en charge différents types de tâches de prédiction de l'activité de dégradation PROTAC :

  • DC50 : Contient uniquement des mesures d'efficacité de dégradation des protéines (DC₅₀), totalisant 4 184 enregistrements.
  • Dmax : Inclut uniquement les données de l'indice d'efficacité de dégradation maximal (Dmax), totalisant 2 377 enregistrements.
  • Multitâche : Contient des données appariées de DC₅₀ et Dmax pour une même molécule PROTAC dans des conditions expérimentales identiques, soit un total de 1 563 enregistrements. Convient aux études d’apprentissage multitâche et de classification binaire.

Citation

@misc{ribes2026tackstatisticalevaluationdegradation,
title={TACK: A statistical evaluation of degradation activity on a novel TArgeting Chimeras Knowledge dataset},
author={Stefano Ribes and Nils Dunlop and Rocío Mercado},
year={2026},
eprint={2605.19579},
archivePrefix={arXiv},
primaryClass={q-bio.QM},
url={https://arxiv.org/abs/2605.19579},
}

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp