컨볼루션 계층과 바이포머 네트워크를 포워드-포워드 및 백프로파게이션 학습과 통합하기

분자 성질 정확 예측은 신약 개발 및 계산 화학 분야에서 매우 중요하며, 유망한 화합물의 식별을 촉진하고 치료제 개발 속도를 가속화하는 데 기여한다. 기존의 머신러닝 기법은 고차원 데이터 처리에 한계를 보이며, 수동적인 특성 엔지니어링에 의존하는 경향이 있다. 또한 기존의 딥러닝 접근 방식은 복잡한 분자 구조를 충분히 포착하지 못하는 경우가 있어 연구적 격차가 존재한다. 본 연구에서는 원시 데이터로부터 복잡한 분자 표현을 직접 학습함으로써 분자 성질 예측의 정확도와 효율성을 향상시키기 위해 Deep-CBN이라는 새로운 프레임워크를 제안한다. 제안된 방법론은 컨볼루션 신경망(Convolutional Neural Networks, CNNs)과 BiFormer 어텐션 메커니즘을 결합하며, 전방-전방 알고리즘(forward-forward algorithm)과 역전파(backpropagation)을 함께 활용한다. 모델은 세 단계로 구성된다: (1) 특성 학습 단계에서는 SMILES 문자열에서 국소적 특징을 CNN을 통해 추출한다; (2) 어텐션 정밀화 단계에서는 전방-전방 알고리즘을 통합한 BiFormer 모듈을 활용하여 전역적 맥락 정보를 포착한다; (3) 예측 하위 네트워크 조정 단계에서는 역전파를 통해 최적화를 수행한다. Tox21, BBBP, SIDER, ClinTox, BACE, HIV, MUV 등 표준 벤치마크 데이터셋에서의 평가 결과, Deep-CBN은 거의 완벽에 가까운 ROC-AUC 점수를 달성하며, 기존 최첨단 기법들을 크게 능가함을 입증하였다. 이러한 결과는 본 모델이 복잡한 분자 패턴을 효과적으로 포착할 수 있음을 보여주며, 신약 개발 과정을 가속화하는 강력한 도구로 활용될 가능성을 제시한다.