11일 전
연쇄방정식을 이용한 다중 대체: 실무에서의 문제점과 지침
{Ian R. White, Patrick Royston, Angela M. Wood}
초록
연쇄방정식을 이용한 다중 대체(Multiple imputation by chained equations, MICE)는 결측 데이터를 처리하는 유연하고 실용적인 접근법이다. 본 논문에서는 이 방법의 원리에 대해 설명하고, 정량적 변수뿐만 아니라 범주형 변수와 왜도를 가진 변수의 대체 방법을 제시한다. 또한 대체 모델을 어떻게 설정할지, 그리고 몇 개의 대체값을 필요로 하는지에 대한 지침을 제공한다. 다중 대체된 데이터를 실질적으로 분석하는 방법, 즉 모델 구축과 모델 검정 과정에 대해서도 설명한다. 더불어 이 방법의 한계점과 발생할 수 있는 함정들을 강조하며, 정신건강 분야의 실제 데이터셋을 활용하여 아이디어를 구체적으로 설명하고, Stata 코드 조각을 함께 제시한다.