HyperAIHyperAI

Command Palette

Search for a command to run...

TACKターゲットキメラ知識ベースデータセット

日付

1時間前

Paper URL

2605.19579

ライセンス

MIT

TACK(TArgeting Chimeras Knowledge)は、AI分子工学研究所が2026年に公開した標準化された知識ベースデータセットおよびベンチマークセットです。このデータセットは、機械学習を用いたPROTAC分解活性予測タスクのために特別に構築されました。関連する研究論文には、以下のようなものがあります。 TACK:新規TArgeting Chimeras Knowledgeデータセットにおける分解活性の統計的評価本手法は、既存のPROTAC機械学習ベンチマークにおけるデータ不足、厳密な評価の欠如、および対象範囲の限定といった課題に対処することを目的としています。PROTAC分解活性予測、標的タンパク質分解(TPD)研究、AI支援創薬(AIDD)、コンピュータ支援創薬(CADD)、仮想創薬スクリーニング、マルチタスク学習、分子特性予測、グラフニューラルネットワーク研究、機械学習ベンチマークテストなどの分野で幅広く活用されています。 このデータセットには、4,184件のDC50レコード、2,377件のDmaxレコード、および1,563件のマルチタスクレコードを含む、6,561件のレコードが含まれています。これには、3,514個のユニークなPROTAC分子、164個の標的タンパク質(POI)、9個のE3ユビキチンリガーゼ(E3リガーゼ)、および155個の細胞株が含まれており、豊富な化学構造特性と多様な生物学的実験条件を示しています。DC₅₀ ≤ 100 nMおよびDmax ≥ 80%の活性基準に基づいて、約55%サンプルが活性サンプルとしてラベル付けされました。

データセットの構成

これには、さまざまな種類のPROTAC分解活性予測タスクをサポートする3つのデータサブセットが含まれています。

  • DC50: タンパク質分解効率指標(DC₅₀)のみを含み、合計4,184件のレコードがあります。
  • Dmax: 最大劣化効率指数(Dmax)データのみを含み、合計2,377件の記録があります。
  • マルチタスク:同一の実験条件下で同一のPROTAC分子について得られた、DC₅₀とDmaxのペアデータ(合計1,563件)が含まれています。マルチタスク学習や二値分類研究に適しています。

引用

@misc{ribes2026tackstatisticalevaluationdegradation,
title={TACK: A statistical evaluation of degradation activity on a novel TArgeting Chimeras Knowledge dataset},
author={Stefano Ribes and Nils Dunlop and Rocío Mercado},
year={2026},
eprint={2605.19579},
archivePrefix={arXiv},
primaryClass={q-bio.QM},
url={https://arxiv.org/abs/2605.19579},
}

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています