2달 전

야생에서 텍스트 편집

Liang Wu; Chengquan Zhang; Jiaming Liu; Junyu Han; Jingtuo Liu; Errui Ding; Xiang Bai
야생에서 텍스트 편집
초록

본 논문에서는 자연 이미지에서 텍스트를 편집하는 문제에 관심을 두고 있으며, 이는 소스 이미지의 단어를 다른 단어로 대체하거나 수정하면서 실제적인 모습을 유지하는 것을 목표로 합니다. 이 작업은 배경과 텍스트 스타일을 모두 보존하여 편집된 이미지가 시각적으로 원본 이미지와 구별되지 않도록 하는 것이 어려움을 동반합니다. 이를 위해 우리는 세 가지 모듈로 구성된 엔드투엔드 학습 가능한 스타일 보존 네트워크(SRNet)를 제안합니다: 텍스트 변환 모듈, 배경 인페인팅 모듈 및 융합 모듈. 텍스트 변환 모듈은 원본 텍스트 스타일을 유지하면서 소스 이미지의 텍스트 내용을 대상 텍스트로 변경합니다. 배경 인페인팅 모듈은 원본 텍스트를 지우고, 적절한 질감으로 텍스트 영역을 채웁니다. 융합 모듈은 앞서 언급한 두 개의 모듈에서 얻은 정보를 결합하여 편집된 텍스트 이미지를 생성합니다. 우리所知, 이 연구는 자연 이미지에서 단어 수준으로 텍스트를 편집하는 첫 번째 시도입니다. 합성 데이터셋과 실제 데이터셋(ICDAR 2013)에서의 시각적 효과와 정량적 결과는 모듈 분해의 중요성과 필수성을 완전히 입증하였습니다. 또한 다양한 실제 응용 분야(텍스트 이미지 합성, 확장 현실(AR) 번역, 정보 숨김 등)에서 우리의 방법론이 유용함을 검증하기 위해 광범위한 실험을 수행하였습니다.注:在“我们所知”这部分,正确的韩语表达应该是“우리가 알고 있는 한”或者“우리의 지식에 따르면”。以下是修正后的版本:본 논문에서는 자연 이미지에서 텍스트를 편집하는 문제에 관심을 두고 있으며, 이는 소스 이미지의 단어를 다른 단어로 대체하거나 수정하면서 실제적인 모습을 유지하는 것을 목표로 합니다. 이 작업은 배경과 텍스트 스타일을 모두 보존하여 편집된 이미지가 시각적으로 원본 이미지와 구별되지 않도록 하는 것이 어려움을 동반합니다. 이를 위해 우리는 세 가지 모듈로 구성된 엔드투엔드 학습 가능한 스타일 보존 네트워크(SRNet)를 제안합니다: 텍스트 변환 모듈, 배경 인페인팅 모듈 및 융합 모듈. 텍스트 변환 모듈은 원본 텍스트 스타일을 유지하면서 소스 이미지의 텍스트 내용을 대상 텍스트로 변경합니다. 배경 인페인팅 모듈은 원본 텍스트를 지우고, 적절한 질감으로 택스트 영역을 채웁니다. 융합 모듈은 앞서 언급한 두 개의 모듈에서 얻은 정보를 결합하여 편집된 텍스트 이미지를 생성합니다. 우리가 알고 있는 한, 이 연구는 자연 이미지에서 단어 수준으로 텍스트를 편집하는 첫 번째 시도입니다. 합성 데이터셋과 실제 데이터셋(ICDAR 2013)에서의 시각적 효과와 정량적 결과는 모듈 분해의 중요성과 필수성을 완전히 입증하였습니다. 또한 다양한 실제 응용 분야(텍스트 이미지 합성, 확장 현실(AR) 번역, 정보 숨김 등)에서 우리의 방법론이 유용함을 검증하기 위해 광범위한 실험을 수행하였습니다.