연구진, 조기 근대 문헌 자동 변환 기술의 윤리적 활용 방안 제시
최근 20년 동안의 대량 디지털화는 학술 연구의 풍경을 크게 변화시켰습니다. 특정 키워드를 검색하여 자료를 찾을 수 있어 귀중한 시간을 절약할 수 있으며, 연구자들은 더 이상 아카이브나 도서관에 가야만 문헌을 살펴볼 필요가 없습니다. 그러나 디지털 전사의 확산은 새로운 노동 문제를 야기하기도 합니다. 최근 에 실린 한 논문은 연구자가 디지털화된 조기 근대 자료의 전사를 얻는 방법을 제시하면서, 비윤리적인 노동 관행을 피하는 방법에 대해 논하고 있습니다. 이 논문은 세레나 스트레커(Serena Strecker)와 킴벌리 리프턴(Kimberly Lifton)이 공동 집필한 "조기 근대 인쇄물의 디지털 아카이브 해제: 조기 근대 인쇄물의 자동 전사"라는 제목으로 시작됩니다. 스트레커와 리프턴은 전사 소프트웨어의 두 가지 주요 유형에 대한 간략한 역사로 글을 시작합니다. 광학 문자 인식(Optical Character Recognition, OCR) 소프트웨어는 19세기 말과 20세기 작품의 전사에 매우 효과적이었지만, 조기 근대 인쇄물의 불규칙성이 OCR을 이러한 자료의 신뢰성 있는 전사에 부적합하게 만들었습니다. 반면, 조기 근대 학자들은 손글씨 인식(Handwritten Text Recognition, HTR) 기술을 활용했습니다. HTR 소프트웨어 중 가장 앞선 것은 Transkribus입니다. Transkribus는 사용자가 공개된 전사 모델을 참조하거나 자체 모델을 훈련시킬 수 있도록 지원합니다. 스트레커와 리프턴은 16세기 예제 컬렉션의 여러 페이지를 대상으로 다양한 HTR 모델을 비교하며, Transkribus가 연구자가 원하는 자료의 요구 사항에 맞춘 목적별 전사 모델을 생성하는 데 필요한 기본 단계 5가지를 소개합니다. Transkribus의 공개 모델을 사용하면 연구자들은 고도로 정확한 자체 모델을 훈련시키기 위한 필수적인 훈련 데이터를 생성할 수 있습니다. 저자들은 이 과정을 통해 "조기 근대 인쇄물의 정확하고 자동화된 전사가 더 이상 목표가 아니라 현실이 되었기 때문에, 연구자들은 인간 노동과 머신 러닝 기술의 어떤 조합이 받아들여지고 지원되어 연구의 미래를 형성할 것인지 고려해야 한다"고 주장합니다. "조기 근대 연구 분야가 학계 내 불평등을 심화시키거나 식민주의의 지속적인 불평등을 유지하지 않으려면, 윤리적인 노동 관행을 고집해야 한다"는 결론을 내립니다. 이 논문은 조기 근대 인쇄물의 자동 전사가 가능해짐에 따라, 인간 노동과 기계 학습 기술의 균형 잡힌 조합을 통해 연구의 미래를 결정하는 것이 중요함을 강조합니다. 이를 통해 학계는 노동 불평등과 식민주의의 잔재를 줄일 수 있을 것으로 보입니다. 스트레커와 리프턴의 연구는 Transkribus를 통해 조기 근대 자료의 전사를 자동화할 수 있는 실질적인 방법을 제공합니다. 이는 특히 대학원생이나 전 세계 남부 지역의 노동자들에게 전사 작업을 외주화하는 것을 피할 수 있는 방안을 제시하는 데 중요한 역할을 할 것입니다. Transkribus는 사용자 친화적이며, 다양한 자료에 맞춰 쉽게 모델을 훈련시킬 수 있어 연구자들이 더욱 효율적으로 작업할 수 있게 합니다. 이 논문은 조기 근대 연구 분야에서의 디지털 전사의 중요성을 재조명하며, 기술 발전과 윤리적 고려 사항 사이의 균형을 맞추는 방법을 제시합니다. 이러한 접근은 디지털 시대의 학술 연구를 더욱 공정하고 혁신적으로 만드는 데 기여할 것으로 기대됩니다. 스트레커와 리프턴은 이번 연구를 통해 조기 근대 인쇄물의 전사를 자동화하는 과정에서 윤리적 책임을 강조합니다. Transkribus와 같은 도구를 활용함으로써, 연구자들은 전통적인 노동 구조를 개선하고, 다양한 배경의 학자들이 참여할 수 있는 더 평등한 연구 환경을 조성할 수 있을 것입니다. 에 게재된 이 논문은 조기 근대 연구 분야에서 디지털 기술의 윤리적 사용에 대한 깊은 이해를 제공합니다. Transkribus는 이미 많은 연구자들로부터 긍정적인 평가를 받고 있으며, 앞으로도 계속해서 이 분야에서 중요한 역할을 할 것으로 보입니다.