2달 전

AI 생성 텍스트 경계 검출에 대한 RoFT 연구

Kushnareva, Laida ; Gaintseva, Tatiana ; Magai, German ; Barannikov, Serguei ; Abulkhanov, Dmitry ; Kuznetsov, Kristian ; Tulchinskii, Eduard ; Piontkovskaya, Irina ; Nikolenko, Sergey
AI 생성 텍스트 경계 검출에 대한 RoFT 연구
초록

대형 언어 모델의 급속한 발전으로 인해 사람들은 인간이 쓴 것처럼 시작되지만 기계가 생성한 텍스트로 이어지는 문장을 점점 더 자주 접하게 되었습니다. 이러한 텍스트에서 인간이 작성한 부분과 기계가 생성한 부분 사이의 경계를 감지하는 것은 아직 많은 주목을 받지 못한 어려운 문제입니다. 우리는 이 간극을 메우기 위해 최신 인공 텍스트 감지 분류기를 경계 감지 환경에 적응시키는 여러 방법을 검토하고자 합니다. 이를 위해 다양한 주제와 여러 언어 모델의 생성물을 포함하는 'Real or Fake' 텍스트 벤치마크를 사용하여 모든 감지기의 한계까지 시험합니다. 우리는 이 다양성을 활용하여 모든 감지기가 크로스 도메인 및 크로스 모델 환경에서 얼마나 견고한지를 깊이 있게 조사하여, 미래 연구를 위한 기준선과 통찰력을 제공합니다. 특히, 퍼플렉서티 기반 접근법이 RoBERTa 모델의 지도 학습보다 도메인 특异性 데이터의 특성에 대해 더 견고하다는 것을 발견했습니다. 또한, 어떤 텍스트 특징들이 경계 감지 알고리즘을 혼동하고 크로스 도메인 환경에서 성능을 저하시키는지도 알아냈습니다.

AI 생성 텍스트 경계 검출에 대한 RoFT 연구 | 최신 연구 논문 | HyperAI초신경