4달 전

문맥 설명 네트워크

Maruan Al-Shedivat; Avinava Dubey; Eric P. Xing
문맥 설명 네트워크
초록

현대 학습 알고리즘은 데이터의 정확하면서도 복잡한 모델을 생성하는 데 탁월합니다. 그러나 이러한 모델을 실제 환경에 배포하기 위해서는 추가적인 주의가 필요합니다: 우리는 그들의 신뢰성, 견고성, 그리고 부적절한 편향의 부재를 보장해야 합니다. 이는 예측 성능 외에도 쉽게 검사하고 평가할 수 있는 동일한 정확도를 가진 모델 개발을 촉구합니다. 이를 위해, 우리는 컨텍스트 설명 네트워크(Contextual Explanation Networks, CEN)라는 구조 클래스를 소개합니다. CEN은 중간 단계에서 간단화된 확률 모델을 생성하고 활용하여 예측을 학습하는 방법입니다. 구체적으로, CEN은 중간 그래픽 모델의 매개변수를 생성하며, 이 매개변수들은 예측에 사용되며 설명 역할을 합니다. 기존的事後모델 설명 도구와 달리, CEN은 예측과 설명을 동시에 학습합니다. 우리의 접근 방식은 두 가지 주요 장점을 제공합니다: (i) 각 예측에 대해 유효한 인스턴스별 설명이 추가 계산 비용 없이 생성되고 (ii) 설명을 통한 예측이 규제자 역할을 하여 데이터가 부족한 상황에서 성능을 향상시킵니다. 우리는 제안된 프레임워크를 이론적 및 실험적으로 분석하였습니다. 이미지 및 텍스트 분류 및 생존 분석 작업에서 얻은 결과는 CEN이 최신 방법론들과 경쟁력을 갖추고 있으며, 각 예측 뒤에 숨겨진 추가적인 통찰력을 제공하여 의사결정 지원에 가치가 있음을 보여줍니다. 또한 우리는 사후 방법론들이 특정 경우에 잘못된 설명을 생성할 수 있다는 점에서 CEN이 일관성을 유지하며 이러한 사례들을 체계적으로 감지할 수 있음을 입증하였습니다.注:在翻译过程中,“事后”一词在韩文中通常表示“post-hoc”,为了保持科技文献的专业性和准确性,这里直接使用了韩文中的外来词“사후”。如果需要进一步调整以适应特定读者群体,请告知。