
작물 수량은 유전자형, 환경 및 이들의 상호작용과 같은 여러 요인에 의해 결정되는 매우 복잡한 특성입니다. 정확한 수량 예측을 위해서는 수량과 이러한 상호작용 요인 간의 기능적 관계에 대한 기본적인 이해가 필요하며, 이러한 관계를 밝히기 위해서는 포괄적인 데이터셋과 강력한 알고리즘이 필요합니다. 2018 시엔젠타 작물 챌린지에서 시엔젠타는 2008년부터 2016년까지 2,247개 지역에서 재배된 2,267개 옥수수 하이브리드의 유전자형과 수량 성능을 기록한 몇 개의 대규모 데이터셋을 공개하고, 참가자들에게 2017년의 수량 성능을 예측하도록 요청했습니다. 우승팀 중 하나로서, 우리는 최신 모델링 및 솔루션 기술을 활용하는 깊은 신경망(DNN) 접근법을 설계했습니다. 우리의 모델은 검증 데이터셋에서 예측된 날씨 데이터를 사용하여 평균 수량의 12%와 표준 편차의 50%로 루트 평균 제곱 오차(RMSE)를 보이는 것으로 나타났습니다. 완벽한 날씨 데이터를 사용할 경우, RMSE는 평균 수량의 11%와 표준 편차의 46%로 감소할 것입니다. 또한, 훈련된 DNN 모델을 기반으로 특성 선택을 수행하여 입력 공간의 차원을 크게 줄였으며, 예측 정확도에 큰 영향 없이 이 작업을 성공적으로 수행했습니다. 우리의 계산 결과는 이 모델이 Lasso, 얕은 신경망(SNN), 회귀 트리(RT) 등 다른 인기 있는 방법들보다 크게 우월함을 시사했습니다. 결과는 또한 환경 요인이 유전자형보다 작물 수량에 더 큰 영향을 미친다는 것을 밝혔습니다.