HyperAIHyperAI
منذ 2 أشهر

التدريب المسبق هو كل ما تحتاجه للترجمة من صورة إلى صورة

Tengfei Wang; Ting Zhang; Bo Zhang; Hao Ouyang; Dong Chen; Qifeng Chen; Fang Wen
التدريب المسبق هو كل ما تحتاجه للترجمة من صورة إلى صورة
الملخص

نقترح استخدام التدريب المسبق لتعزيز الترجمة العامة من الصورة إلى الصورة. غالبًا ما تحتاج الطرق السابقة للترجمة من الصورة إلى الصورة إلى تصميم هندسي مخصص وتدريب نماذج ترجمة فردية من البداية، مما يجعلها تواجه صعوبة في إنتاج مشاهد معقدة بشكل عالي الجودة، خاصة عندما تكون البيانات التدريبية المترابطة غير كافية. في هذا البحث، نعتبر كل مشكلة ترجمة من الصورة إلى الصورة كمهمة ثانوية ونقدم إطارًا بسيطًا ومتنوعًا يتكيف مع نموذج التوزيع المسبق لاستيعاب أنواع مختلفة من الترجمات من الصورة إلى الصورة. كما نقترح التدريب المعادي لتعزيز تركيب النسيج في تدريب نموذج التوزيع، بالاشتراك مع العينات الإرشادية المُعَمَّمة لتحسين جودة الإنتاج. نقدم مقارنة تجريبية شاملة عبر مهام مختلفة على مقاييس صعبة مثل ADE20K وCOCO-Stuff وDIODE، مما يظهر أن الترجمة من الصورة إلى الصورة المستندة إلى التدريب المسبق (PITI) قادرة على تركيب صور ذات واقعية وإخلاص غير مسبوقين.

التدريب المسبق هو كل ما تحتاجه للترجمة من صورة إلى صورة | أحدث الأوراق البحثية | HyperAI