Reddit, 웨이백머신의 게시물 보존 차단 결정
Reddit가 인터넷 아카이브의 웨이백 머신이 자신의 콘텐츠를 무단으로 크롤링해 AI 기업들이 데이터를 훔쳐가는 상황을 발견하며, 웨이백 머신의 대부분 콘텐츠 인덱싱을 차단하기로 결정했다. 기존에는 공정한 목적의 기관인 인터넷 아카이브를 예외로 했지만, 최근 AI 기업들이 웨이백을 통해 Reddit의 게시글, 댓글, 프로필 정보를 무단으로 수집해 라이선스 비용을 회피하고 있다는 증거를 확보한 것으로 알려졌다. 이에 따라 웨이백 머신은 더 이상 게시물 상세 페이지, 댓글, 프로필 등을 크롤링할 수 없으며, 홈페이지만 인덱싱 가능하게 됐다. 이는 웨이백 머신이 Reddit의 인기 헤드라인과 게시물의 추세는 기록할 수 있지만, 실질적인 콘텐츠는 아카이브할 수 없게 된 셈이다. Reddit는 사용자 개인정보 보호와 삭제된 콘텐츠의 관리 등 플랫폼 정책 준수 여부를 전제로, 인터넷 아카이브의 접근을 제한했다고 설명했다. 이는 Reddit가 AI 기업과의 데이터 라이선스 계약을 통해 수익을 창출하고자 하는 전략의 일환으로, 기존에 구글, 오픈AI와 수백만 달러 규모의 계약을 체결한 바 있다. 또한 지난 6월에는 Anthropic를 상대로 무단 크롤링 혐의로 소송을 제기한 바 있다. 인터넷 아카이브 측은 현재까지 공식 반응을 내지 않았지만, 웨이백 머신의 마이클 그레엄 대표는 Reddit와 지속적인 논의를 진행 중이라고 밝혔다. 이 사건은 AI 시대에 데이터 접근과 저작권, 공공 기록 보존 사이의 갈등을 보여주는 대표적 사례로, 플랫폼의 데이터 통제가 점점 더 강화되고 있음을 시사한다.