AI 질문 답변 시"Some AI 모델은 다른 모델보다 50배 더 많은 온실가스 배출
대규모 언어 모델(LLM)의 AI 사용은 이미 우리 일상에 깊이 스며들었지만, 이 기술이 환경에 미치는 영향에 대해서는 잘 알려져 있지 않습니다. 독일 Hochschule München University of Applied Sciences(HMU)의 연구팀은 이미 훈련된 LLM들의 CO2 배출량을 측정하고 비교한 새로운 연구를 발표했습니다. 이 연구는 1,000개의 표준화된 질문을 통해 다양한 주제에 대해 14개의 LLM을 평가한 결과를 담고 있습니다. LLM은 각 단어나 단어의 일부를 숫자열로 변환하여 처리합니다. 이 과정은 물론 다른 컴퓨팅 프로세스에서도 CO2 배출이 발생합니다. 그러나 많은 사용자들은 이러한 기술이 상당한 탄소 발자국을 남기고 있다는 사실을 인식하지 못하고 있습니다. 연구팀은 LLM의 추론 방식이 환경적 영향을 크게 결정한다고 밝혔습니다. 특히, 명시적인 추론 과정이 에너지 소비와 탄소 배출을 크게 증가시키는 것으로 나타났습니다. 연구진은 7억에서 720억 개의 파라미터를 가진 14개의 LLM을 1,000개의 벤치마크 질문으로 평가했습니다. 파라미터는 LLM이 정보를 학습하고 처리하는 방식을 결정합니다. 추론 모델은 평균적으로 각 질문당 543.5개의 '사고 토큰'을 생성한 반면, 간결한 답변 모델은 37.7개의 토큰만 필요했습니다. 사고 토큰은 추론 LLM이 출력을 생성하기 전에 추가적으로 생성하는 토큰입니다. 토큰 발자국이 더 크면 항상 CO2 배출량도 더 많아집니다. 하지만 그렇다고 해서 답변의 정확성이 높아지는 것은 아닙니다. 복잡한 세부사항은 항상 정확성과 직접적인 연관성이 없는 경우가 많습니다. 가장 정확한 모델은 700억 개의 파라미터를 가진 추론 가능 모델인 Cogito로, 84.9%의 정확도를 달성했습니다. 이 모델은 비슷한 크기의 간결한 답변 모델보다 세 배 더 많은 CO2 배출을 초래했습니다. "현재 LLM 기술에는 명확한 정확성-지속 가능성의 절충이 내재되어 있다"고 Dauner는 말했습니다. "탄소 배출량이 500그램 CO2 규모 당 등가물 아래로 유지된 모든 모델은 1,000개의 질문 중 80% 이상을 정확하게 답변하지 못했다." CO2 규모 당 등가는 다양한 온실가스의 기후 영향을 측정하는 단위입니다. 주제에 따라서도 CO2 배출량이 크게 다릅니다. 복잡한 추론이 필요한 질문, 예를 들어 추상대수학이나 철학은 일반적으로 더 직접적인 주제, 예를 들어 고등학교 역사보다 최대 6배 더 많은 배출을 초래했습니다. 연구팀은 이 연구가 사용자가 AI 사용에 대해 더욱 정보화되고 신중한 결정을 할 수 있도록 하는 것을 목표로 삼고 있습니다. "사용자는 AI가 생성하는 출력의 정확한 CO2 비용을 알면, 자신을 액션 피규어로 변신하는 등의 일상적인 행동에서 이 기술의 사용을 더욱 선택적이고 신중하게 할 수 있을 것"이라고 Dauner는 결론을 맺었습니다. 모델 선택은 CO2 배출량에 큰 차이를 가져올 수 있습니다. 예를 들어, 700억 개의 파라미터를 가진 DeepSeek R1이 600,000개의 질문에 답하면 런던에서 뉴욕까지 왕복 비행기 여행과 같은 CO2 배출량을 생성합니다. 반면, Qwen 2.5(720억 파라미터)는 비슷한 정확도로 190만 개의 질문에 답할 수 있으며, 배출량은 비슷합니다. 연구 결과는 사용자의 AI 사용 패턴에 중요한 의미를 지닙니다. 사용자는 AI에게 간결한 답변을 요청하거나, 진정으로 그 파워가 필요한 작업에만 고용량 모델을 제한적으로 사용하여 배출량을大幅减少라고 표현할 수 있지만, 여기서는 한글로 "대폭 줄일 수 있습니다"라고 번역하였습니다. 研究结果可能受到所用硬件和当地能源结构的影响,因此这些发现的普遍性有限。然而,研究团队希望他们的工作能够鼓励人们在使用LLM时更加“选择性和深思熟虑”。在这里,我们将其翻译为: 研究结果可能受到所用硬件和当地能源结构的影响,因此这些发现的普遍性有限。然而,研究团队希望他们的工作能够鼓励人们在使用LLM时更加“选择性和深思熟慮”。 "사용자는 AI에게 간결한 답변을 요청하거나, 진정으로 그 파워가 필요한 작업에만 고용량 모델을 제한적으로 사용하여 배출량을 대폭 줄일 수 있다"고 Dauner는 강조했습니다. LLM의 환경 영향은 여전히 정확히 추정하기 어려우며,(ChatGPT 훈련에 사용된 에너지는 평균 미국인이 한 해 동안 사용하는 에너지의 30배에 달할 수 있다는 연구도 있습니다.) 그러나 이 연구는 사용자가 AI 사용 방법을 재고하도록 하는 중요한 단서를 제공합니다. Hochschule München University of Applied Sciences(HMU)는 독일의 공과대학으로, 이 연구를 통해 AI 기술의 환경적 영향에 대한 논의를 촉발하고자 합니다. 이 연구는 LLM 기술의 환경적 영향에 대한 이해를 높이는 데 기여하며, 사용자가 더욱 책임감 있게 이 기술을 활용할 수 있는 방향성을 제시합니다.