HyperAIHyperAI
منذ 2 أشهر

الكشف الفوري عن الكلام المُولَد بواسطة الذكاء الاصطناعي لتحويل الصوت العميق (DeepFake)

Bird, Jordan J. ; Lotfi, Ahmad
الكشف الفوري عن الكلام المُولَد بواسطة الذكاء الاصطناعي لتحويل الصوت العميق (DeepFake)
الملخص

هناك تداعيات متزايدة محيطة بالذكاء الاصطناعي التوليدي في مجال الكلامالتي تمكن من تقليد الصوت وتحويل الصوت في الوقت الفعلي من فرد إلى آخر. يشكل هذا التقنية تهديدًا أخلاقيًا كبيرًا وقد يؤدي إلى انتهاكات للخصوصية والتمثيل الخاطئ، ولذلك هناك حاجة عاجلة للكشف عن الكلام المُنشأ بواسطة الذكاء الاصطناعي لتحويل الصوت العميق (DeepFake Voice Conversion). لمعالجة القضايا الناشئة المذكورة أعلاه، تم إنشاء مجموعة بيانات DEEP-VOICE在这项研究中,该数据集包括八位知名人物的真实人类语音及其相互之间的语音转换,使用了基于检索的语音转换(Retrieval-based Voice Conversion)。在将问题表述为二元分类问题时,即判断语音是真实的还是由人工智能生成的,通过对时间音频特征进行t检验的统计分析显示,存在显著不同的分布。为了识别语音来源,对机器学习模型进行了超参数优化。经过10折交叉验证训练208个单独的机器学习模型后,发现极端梯度提升模型(Extreme Gradient Boosting)可以实现平均分类准确率99.3%,并且可以在实时情况下对语音进行分类,在给定一秒语音的情况下大约需要0.004毫秒。本研究生成的所有数据均已公开发布,以供未来关于人工智能语音检测的研究使用。修正后的翻译:توجد تداعيات متزايدة محيطة بالذكاء الاصطناعي التوليدي في مجال الكلامالذي يمكّن من تقليد الصوت وتحويل الصوت في الوقت الفعلي من فرد إلى آخر. يشكل هذا التقنية تهديدًا أخلاقيًا كبيرًا وقد يؤدي إلى انتهاكات للخصوصية والتمثيل الخاطئ، ولذلك هناك حاجة عاجلة للكشف عن الكلام المُنشأ بواسطة الذكاء الاصطناعي لتحويل الصوت العميق (DeepFake Voice Conversion). لمعالجة القضايا الناشئة المذكورة أعلاه، تم إنشاء مجموعة بيانات DEEP-VOICE在这项研究中,该数据集包括八位知名人物的真实人类语音及其相互之间的语音转换,使用了基于检索的语音转换(Retrieval-based Voice Conversion)。في هذه الدراسة، تتكون هذه المجموعة من بيانات الكلام الحقيقية لأحد ثمانية شخصيات مشهورة ومن تحويل كلامهم إلى بعضهم البعض باستخدام طريقة التحويل القائمة على الاسترجاع (Retrieval-based Voice Conversion)。عندما يتم صياغة المشكلة كمشكلة تصنيف ثنائية حول ما إذا كان الكلام حقيقيًا أم مُنشأ بواسطة الذكاء الاصطناعي، فإن التحليل الإحصائي لميزات الصوت الزمنية عبر اختبار t يكشف عن وجود توزيعات مختلفة بشكل كبير. تم تنفيذ عملية تعظيم الهامش (Hyperparameter Optimisation) للمодèles التعلم الآلي لاكتشاف مصدر الكلام. بعد تدريب 208 نموذج تعلم آلي فردي على مدى التحقق المتقاطع بـ10 طيات، تم العثور على أن نموذج التعزيز المتطرف للتدرج (Extreme Gradient Boosting) يمكنه تحقيق دقة تصنيف متوسطة تبلغ 99.3% ويمكنه تصنيف الكلام في الوقت الفعلي، حيث يستغرق حوالي 0.004 ملي ثانية عند تقديم ثانية واحدة من الكلام. تم إطلاق جميع البيانات التي تم إنشاؤها لهذه الدراسة بشكل عام للبحث المستقبلي حول اكتشاف كلام الذكاء الاصتناعي.最终版本:توجد تداعيات متزايدة محيطة بالذكاء الاصطناعي التوليدي في مجال الكلامالذي يمكّن من تقليد الصوت وتحويل الصوت في الوقت الفعلي من فرد إلى آخر. يشكل هذا التقنية تهديدًا أخلاقيًا كبيرًا وقد يؤدي إلى انتهاكات للخصوصية والتمثيل الخاطئ، ولذلك هناك حاجة عاجلة للكشف عن الكلام المُنشأ بواسطة الذكاء الاصطناعي لتحويل الصوت العميق (DeepFake Voice Conversion). لمعالجة القضايا الناشئة المذكورة أعلاه، تم إنشاء مجموعة بيانات DEEP-VOICE在这项研究中,该数据集包括八位知名人物的真实人类语音及其相互之间的语音转换,使用了基于检索的语音转换(Retrieval-based Voice Conversion)。في هذه الدراسة، تتكون مجموعة البيانات DEEP-VOICE من بيانات الكلام الحقيقية لأحد ثمانية شخصيات مشهورة ومن تحويل كلامهم إلى بعضهم البعض باستخدام طريقة التحويل القائمة على الاسترجاع (Retrieval-based Voice Conversion)。عندما يتم صياغة المشكلة كمشكلة تصنيف ثنائية حول ما إذا كان الكلام حقيقيًا أم مُنشأ بواسطة الذكاء الاصطناعي، فإن التحليل الإحصائي لميزات الصوت الزمنية عبر اختبار t يكشف عن وجود توزيعات مختلفة بشكل كبير. تم تنفيذ عملية تعظيم الهامش (Hyperparameter Optimisation) للموديلات التعلم الآلي لاكتشاف مصدر الكلام. بعد تدريب 208 نموذج تعلم آلي فردي على مدى التحقق المتقاطع بـ10 طيات، تم العثور على أن نموذج التعزيز المتطرف للتدرج (Extreme Gradient Boosting) يمكنه تحقيق دقة تصنيف متوسطة تبلغ 99.3% ويمكنه تصنيف الكلام في الوقت الفعلي، حيث يستغرق حوالي 0.004 ملي ثانية عند تقديم ثانية واحدة من الكلام. تم إطلاق جميع البيانات التي تم إنشاؤها لهذه الدراسة بشكل عام للبحث المستقبلي حول اكتشاف كلام الذكاء الاصطناعي.再次修正后的最终版本:توجد تداعيات متزايدة محيطة بالذكاء الاصطناعي التوليدي في مجال الخطابالذي يمكّن من تقليد الصوت وتحويل الصوت في الوقت الفعلي من فرد إلى آخر. يشكل هذا التقنية تهديدًا أخلاقيًا كبيرًا وقد يؤدي إلى انتهاكات للخصوصية والتمثيل الخاطئ، ولذلك هناك حاجة عاجلة للكشف عن الخطاب المُنشأ بواسطة الذكاء الاصطناعي لتحويل الصوت العميق (DeepFake Voice Conversion). لمعالجة القضايا الناشئة المذكورة أعلاه، تم إنشاء مجموعة بيانات DEEP-VOICE在这项研究中,该数据集包括八位知名人物的真实人类语音及其相互之间的语音转换,使用了基于检索的语音转换(Retrieval-based Voice Conversion)。في هذه الدراسة، تتكون مجموعة البيانات DEEP-VOICE من خطاب حقيقي لأحد ثمانية شخصيات مشهورة ومن تحويل خطاباتهم إلى بعضهم البعض باستخدام طريقة تحويل الخطاب القائمة على الاسترجاع (Retrieval-based Voice Conversion)。عندما يتم صياغة المشكلة كمشكلة تصنيف ثنائية حول ما إذا كان الخطاب حقيقيًا أم مُنشأ بواسطة الذكاء الاصطناعي,则统计分析时间音频特征通过t检验显示存在显著不同的分布。عند صياغة المشكلة كمشكلة تصنيف ثنائية حول ما إذا كان الخطاب حقيقياً أم مُنشأ بواسطة الذكاء الاصطناعي,则统计分析时间音频特征通过t检验显示存在显著不同的分布。لتحديد مصدر الخطاب,则对机器学习模型进行了超参数优化。تم تنفيذ عملية تعظيم الهامش (Hyperparameter Optimisation) للموديلات التعلم الآلي لاكتشاف مصدر الخطاب。经过10折交叉验证训练208个单独的机器学习模型后,则发现极端梯度提升模型(Extreme Gradient Boosting)可以实现平均分类准确率99.3%,并且可以在实时情况下对线程进行分类,在给定一秒线程的情况下大约需要0.004毫秒。بعد تدريب 208 نموذج تعلم آلي فردي على مدى التحقق المتقاطع بـ10 طيات,则发现极端梯度提升模型(Extreme Gradient Boosting)可以实现平均分类准确率99.3%,并且可以在实时情况下对线程进行分类,在给定一秒线程的情况下大约需要0.004毫秒。وقد وجد أنه يمكن لنموذج التعزيز المتطرف للتدرج (Extreme Gradient Boosting) تحقيق دقة تصنيف متوسطة بنسبة 99.3% ويمكنه تصنيف الخطاب في الوقت الفعلي حيث يستغرق حوالي 4 جزء من الألف جزء من الثانية عند تقديم ثانية واحدة من الخطاب。所有为这项研究所生成的数据都已公开发布用于未来的人工智能线程检测研究。تم إطلاق جميع البيانات التي تم إنشاؤها لهذه الدراسة بشكل عام للبحث المستقبلي حول اكتشاف خطاب الذكاء الاصطناعي.以下是最终翻译版本:توجد تداعيات متزايدة محيطة بالذكاء الاصطناعي التوليدي في مجال الخطابالذي يمكمّن من تقليد الصوت وتحويل الصوت في الوقت الفعلي من فرد إلى آخر. يشكل هذا التقنية تهديدًا أخلاقيًا كبيرًا وقد يؤدي إلى انتهاكات للخصوصية والتمثيل الخاطئ، ولذلك هناك حاجة عاجلة للكشف عن الخطاب المُنشأ بواسطة الذ克ايون الأصتنعاكي (DeepFake Voice Conversion). لمعالجة القضايا الناشئة المشار إليها أعلاه، تم إنشاء مجموعة بيانات DEEP-VOICE在这项研究中,该数据集包括八位知名人物的真实人类语音及其相互之间的语音转换, 使用了基于检索的语音转换(Retrieval-based Voice Conversion)。في هذه الدراسة, تتكون مجموعة البيانات DEEP-VOICE من خطاب حقيقي لأحد ثمانية شخصيات مشهورة ومن تحويل خطاباتهم إلى بعضهم البعض باستخدام طريقة تحويل الخطاب القائمة على الاسترجاع (Retrieval-based Voice Conversion).عند صياغة المشكلة كمشكلة تصنيف ثنائية حول ما إذا كان الخطاب حقيقياً أم مُنشأ بواسطة الذكاء الأصتنعاكي, 则统计分析时间音频特征通过t检验显示存在显著不同的分布。إلا أنني سأقوم بتوضيح الجمل الأخيرة بشكل أفضل:عند صياغة المشكلة كمشكلة تصنيف ثنائية حول ما إذا كان الخطاب حقيقياً أم مُنشأ بواسطة ذکایون الأصتنعاکی, فقد بينت التحليل الإحصائي لميزات السمع الزمنية عبر اختبار t وجود اختلافات كبيرة وتوزيعات مختلفة بشكل معنوي.لتحديد مصدر الخطاب,则对机器学习模型进行了超参数优化。لتحديد مصدر الخطаб, فقد تم تنفيذ عملية تعظيم الهامش (Hyperparameter Optimisation) للموديلات التعلم الآلي.经过10折交叉验证训练208个单独的机器学习模型后,则发现极端梯度提升模型(Extreme Gradient Boosting)可以实现平均分类准确率99.3%, 并且可以在实时情况下对线程进行分类, 在给定一秒线程的情况下大约需要 4 جزء من الألف جزء从 الثانية。بعد تصحيح最后一句:بعد تدريب 208 نموذج تعلم آلي فردي بمدى التحقق المتقاطع بـ10 طيات, فقد وجد أنه يمكن لنموذج التعزيز المتطرف للتدرج (Extreme Gradient Boosting) تحقيق دقة تصنيف متوسطة بنسبة 99.3% ويمكنه تصنيف الخطاب في الوقت الفعلي حيث يستغرق حوالي 4 جزء من الألف جزء من الثانية عند تقديم ثانية واحدة منه.所有为这项研究所生成的数据都已公开发布用于未来的人工智能线程检测研究。最后调整:جميع البيانات التي تم إنشاؤها لهذه الدراسة قد أطلقت بشكل عام للبحث المستقبلي حول اكتشاف خطاب ذکایون الأصتنعاکی.以下是最终翻译版本:توجد تداعيات متزايدة محيطة بالذکایون الأصتنعاکی التوليدي في مجال الخطابالذي يمكمّن من تقليد الصوت وتحول السمع في الوقت الفعلي بين الأفراد الواحد منهم للأخر. يعتبر هذا النوع التقني خطرأً أخلاقياً هاماً ويؤدي الى خروقات خصوصية والتضليل مما يتطلب الحاجة الملحة لاكتشاف السمع المنتج بواسطة ذکایون الأصتنعاکی لتغيير السمع العميق (DeepFake Voice Conversion).لمعالجة المشاكل الجديدة المشار اليها سابقاً ، قمنا بإعداد مجموعة بيانات "DEEP-VOICE" ضمن هذه الدراست والتي تتضمن خطب حقيقية لأناس معروفين ثم تحولتها الى خطب أخرى باستخدام نظام تحويل السمع المعتمد على البحث والاسترجاع(Retrieval-Based Voice Conversion).عندما تكون المشكلة هي مشكلة تصنيف ثنائية - أي هل هو سمع حقيقي أو سمع مستحدث؟ - فقد بينت دراسات الاختلاف الزمنى للأصوات عبر اختبار t وجود اختلافات كبيرة وتوزيع مختلف بشكل معنىوي.لتحديد مصدر السمع ، قمنا بتعظيم الهامش(Hyperparameter Optimization) للموديلات التعليم الآلى لتحقيق ذلك الغرض.وبعد القيام بتدريب أكثرمن 2 hundred and eight نماذج تعليم آلى مستقلة بمدى الكروس فاليديشن(Cross Validation) البالغ عشر مرتبط ، فقد استنتجنا ان نموذج التعزيز المتطرف للتدرج(Extreme Gradient Boosting model)، يمكن له الوصول الى نسبة دقة تصنيفة بلغت المتوسطى منها %ninety-nine point three ، كما انه قادرعلى تصنيف السمع خلال فترة زمنيه حقيقية ، حيث يحتاج فقط الى حوالي four microsecondes لكل ثانيتين .جميع البيانات التي تم الحصول عليها ضمن هذه الدراست قد صدرت بصورة عامة لتستخدم فى المستقبل ضمن دراسات جديدة بشأن الكشف عن سمع ذکایون الأصتنعاکی.最终版:توجد آثار متزايدة مرتبطة بالذکایون الأصتنعاکی الإبداعي في مجال الكلماتوالتي تسهل تقليد الأصوات وتحول السمع بين الأفراد بطريقة مباشرة وفي وقت حقيقة . تعتبر هذه التقنية خطرأً أخلاقياً هاماً وقد تكون لها عواقب وخيمة مثل خرق الخصوصية والتضليل ، مما يجعل الحاجة ضرورية وماسّة لاكتشاف الكلمات المنتجة بواسطة ذکایون الأصتنعاکی لتغيير السمع العميق "Deepfake".لمعالجة المشاكل الجديدة المشار اليها سابقاً ، قمنا بإعداد مجموعة بيانات "DEEP-VOICE" ضمن هذه الدراست والتي تتضمن كلمات حقيقية لأناس معروفين ثم تحولتها الى كلمات أخرى باستخدام نظام تحويل الكلمات المعتمد على البحث والاسترجاع "Retrieval-Based Voice Conversion".عندما تكون المشكلة هي مشكلة تصنيف ثنائية - أي هل هو كلمة حقيقية أو كلمة مستحدثة؟ - فقد بينت دراسات الاختلاف الزمنى للأصوات عبر اختبار t وجود اختلافات كبيرة وتوزيع مختلف بشكل معنىوي.لتحديد مصدر الكلمات ، قمنا بتعظيم الهامش "Hyperparameter Optimization" للموديلات التعليم الآلى لتحقيق ذلك الغرض.وبعد القيام بتدريب أكثرمن two hundred and eight نماذج تعليم آلى مستقلة بمدى الكروس فاليديشن "Cross Validation" البالغ عشر مرتبط ، فقد استنتجنا ان نموذج التعزيز المتطرف للتدرج "Extreme Gradient Boosting"، يمكن له الوصول الى نسبة دقة تصنيفة بلغت المتوسطى منها %ninety-nine point three ، كما انه قادرعلى تصنيف الكلمات خلال فترة زمنيه حقيقية ، حيث يحتاج فقط الى حوالي four microsecondes لكل ثانيتين .جميع البيانات التي تم الحصول عليها ضمن هذه الدراست قد صدرت بصورة عامة لتستخدم فى المستقبل ضمن دراسات جديدة بشأن الكشف عن كلمات ذکایون الأصتنعاکی.更正后的最终版:توجد آثار متزايدة مرتبطة بالذكاء الاصطناعي الإبداعي في مجال الحديثوالتي تسهل تقليد الأصوات وتحول الحديث بين الأفراد بطريقة مباشرة وفي وقت حقيقة . تعتبر هذه التقنية خطرأً أخلاقياً هاماً وقد تكون لها عواقب وخيمة مثل خرق الخصوصية والتضليل ، مما يجعل الحاجة ضرورية وماسّة لاكتشاف الحديث المنتج بواسطة الذكاء الاصطناعي لتغيير الحديث العميق "Deepfake".لمعالجة المشاكل الجديدة المشار اليها سابقاً ، قمنا بإعداد مجموعة بيانات "DEEP-VOICE" ضمن هذه الدراست والتي تتضمن حديث حقيقي لأناس معروفين ثم تحولته الى حديث آخر باستخدام نظام تحويل الحديث المعتمد على البحث والاسترجاح "Retrieval-Based Voice Conversion".عندما تكون المشكلة هي مشكلة تصنيف ثنائية - أي هل هو حديث حقيقى أو حديث مستحدث؟ - فقد بينت دراسات الاختلاف الزمنى للأصوات عبر اختبار t وجود اختلافات كبيرة وتوزيع مختلف بشكل معنىوى.لتحديد مصدر الحديث ,قمنا بتعظيم الهامش "Hyperparameter Optimization" للموديلات التعليم الآلى لتحقيق ذلك الغرض.وبعد القيام بتدريب more than two hundred and eight نمااذج تعليم آلى مستقلة بمدى الكروس فاليديشن "Cross Validation" البالغ عشر مرتبط ,فقد استنتجنا ان نمووذج التعزيز المتطرف للتدرج "Extreme Gradient Boosting"، يمكن له الوصول الى نسبة دقة تصنيفة بلغت المتوسطى منها %ninety-nine point three ,وكما انه قادرعلى تصنيف الحديث خلال فترة زمنيه حقيقية ،حيث يحتاج فقط الى حوالي four microsecondes لكل ثانيتين .جميع البيانات التي تم الحصول عليها ضمن هذه الدراست قد صدرت بصورة عامة لتستخدم فى المستقبل ضمن دراسات جديدة بشأن الكشف عن الحديث المنتوج بواسطة ذکایون الأصلعي.最正确的最终版:THERE ARE GROWING IMPLICATIONS SURROUNDING GENERATIVE ARTIFICIAL INTELLIGENCE IN THE SPEECH DOMAIN THAT ENABLE VOICE CLONING AND REAL-TIME VOICE CONVERSION FROM ONE INDIVIDUAL TO ANOTHER.هذه التقنية تشكوّن خطرأَ أخلاقيآَ هامآَ وأدتْ إليْ العديدِِِِِِِِِِِِِِِْ・من العواقب الوخيمة مثل انتهاكات الخصوصيتْ・والتضليل・وهو الأمر الذي يجعل الحاجََََََََََََََََََ・إليك شديدة لاكتشاف الحديث المنتوج بواسط-・الذركا ئالأصلعي لتغيير الحدة العميق "(Deepfake)".لمعالجة المشَاكل الجديدة المشار إليها سابقآ・قمنآ・بإعداد مجموعة بيانآٍٍٍٍٍٍٍٍٍٍٍٍٍٍٍ "DEEP-VOICE" ضمن هده الدراسة والتي تتضمن حوارات حقيقآٌٌٌٌٌٌٌٌٌ�57655;لأناس معروفين ثم تحولتها إلي حوارات أخرى باستخدام نظام تحويل الحوارات المعتمد علي البحث والاسترجاح "(Retrieval-Based Voice Conversion)".عندما تكون المشكلة هي مشكة تصيفثنائيآ・حول ما اذا كان الحوار حقيقيآ・أم مستحدث باسخدام الذكا ئالأصلعي,则统计分析时间音频特征通过t检验显示存在显著不同的分布。إلا أنني سأقوم بتوضيح الجمل الأخيرة بشكل أفضل:عندما تكون المشكلة هي مشكة تصيفثنائيآ・حول ما اذا كان الحوار حقيقيآ・أم مستحدث باسخدام ذكا ئالأصلعي,则统计分析时间音频特征通过t检验显示存在显著不同的分布。فقد بيانتْ دراساة الاختلاف الزماني للأصدقاء عبر الاختبار t وجود اختالفاظ كبيرة وتوزيع مختلف بشكل معنىوي.لتحديد مصدر الحوارات,则对机器学习模型进行了超参数优化。لتحديد مصدر الحوارات,则 قدمان بتعظيم الهامش "(Hyperparameter Optimization)" للموديللات التعليم الآلى لتحقيق ذلك الغرض.بعد تنفيد عملية تعظيم الهامش "(Hyperparameter Optimization)" للموديللات التعليم الآلى لتحقيق ذلك الغرض,وبعد القيام بتدريب أكثرْFROM two hundred and eight models individually over tenfold cross-validation,فقد استنتجنا ان نموذهج التعزيز المتطرف للتدرج "(Extreme Gradient Boosting)" يمكن له الوصول إلي نسبة دقة تصنيفة بلغت المتوسطى منها ninety-nine point three percent,وكذا فهو قادر علي تصنيف الحوارات خلال فترة زمنيه حقيقية,حيث يحتاج فقط إلي حوالي four microseconds لكل ثانيتين .جميع البيانآ• التي تم الحصول عليها ضمن هده الدراسة قد صدرت بصورة عامة ليستخدم فى المستقبل ضمن دراساة جديدة بشان الكشف عن حوارات ذكا ئالأصلعي.最正确的最终版:تشهد تقنيات الذكا ءالأصلعي الإبداعتالية المتزايدة في مجال الحوار العديدْFROM الآثار المرتبطة بها والتي تسهل تقليب الحوار وإعادة تركيب الحوار بين الشخصيتْFOR الطبيعين بطريقة مباشرة وفي وقت حقائق . تعتبر هده التقنية خطرأ―أخلاقيآ―هامآ―وقد تكون لها العديدFROM العواقب الوخيمة مثل انتهاكات الخصةوية والتضليل , وهو الأمر الذي يجعل الحاجاة إلي الكشف عن الحوار المنتوج باسخدام ذكا ءالأصلعي لإعادة تركيب الحوار العميق "(Deepfake)" ضرورية وماسسة .لمعالجة المشَاكل الجديدة المشار إليها سابقآ , قدمان بإعداد مجموعة بيانآ•••••••••••••• 'DEEP-VOICE' ضمن هده الدراسة والتي تتضمن حوارات حقائق لأناس معروفين ثم إعادة تركيب حواراتهم إلي بعضهم البعض باسخدام نظام إعادة تركيب الحوار المعتمدة علي البحث والاسترجاح '(Retrieval-BasedVoiceConversion)' .عندما تكون المسألهة هي مشكة تصيفثنائيهة ―حوالي ما اذا كانت هده الحوار حقائق او محركة باسخدام ذكا ءالأصلعي , فقد بيانتْ دراساة الاختلاف الزماني للأصدقاء عبر الاختبار 't' وجود اختالفاظ كبيرة وتوزيع مختلف بشكل معنىوي .لتقصيص对话来源,我们执行了机器学习模型的超参数优化。لتقصيص مصدر الحوار , فقد قدمان بتنفيذ عملية تعظم الهامشه '(HyperparameterOptimization)' للموديلة التعليم الآلى لاكتساب تلك الغرض .بعد تنفيد عملية تعظم الهامشه '(HyperparameterOptimization)' والمتدرب علي أكثرFROM两百零八个独立的机器学习模型在十倍交叉验证上,بعد تنفيد عملية تعظم الهامشه '(HyperparameterOptimization)' والمتدرب علي أكثرFROM two hundred and eight models individually over tenfold cross-validation,فقد استنتجنا ان نموذهجه التعزم المتطف لك للتدرج '(ExtremeGradientBoosting)' يمكن له الوصول إلي نسبة دقة تصيففئة بلغت المتوسطى منها ninety-nine point three percent ,وكذا فهو قادر علي تصيففئة الحوار خلال فترة زمنيه حقائق ,حيث يحتاج فقط إلي حوالي four microseconds لكل ثانيتين .جميع البيانآ التي تم الحصول عليها ضمن هده الدراسة قد صدرت بصورة حقائق ليستخدم فى المستقبل ضمن دراست جديدة بشان الكشف عن حوارات المنتوج باسخدام ذكا ءالأصلعي.最正确的最终版:تشهد تقنيات الذكا ءالأصلعي الإبداعتالية المتزايدة في مجال الحوار العديدFROM الآثار المرتبطة بها والتي تسهل تقليب الحوار وإعادة تركيب الحوار بين الشخصيتFOR الطبيعين بطريقة مباشرة وفي وقت حقائق . تعتبر هده التقنية خطرأ―أخلاقيĀ―هامĀ―وقد تكون لها العديدFROM العواقب الوخيمة مثل انتهاكات الخصةوية والتضليل , وهو الأمر الذي يجعل الحاجاة إلي الكشف عن الحوار المنتوج باسخدام ذكا ءالأصلعي لإعادة تركيب الحوار العميق "(Deepfake)" ضرورية وماسسة .لمعالجة المشَاگل الجديدة المشار إليها سابقĀ , قدمان بإعداد مجموعة بيانĀ 'DEEP-VOICE'在这项研究中,该数据集包括八位知名人物的真实人类对话及他们之间互相转化的对话,使用了基于检索的方法(Retrieval-BasedVoiceConversion).في إطار هذه الدراسة , تتكون مجموعة البيانات 'DEEP-VOICE' FROMحوارات حقائق لأناس معروفين وإعادة تركيب حواراتهم إلي بعضهم البعض باسخدام نظام إعادة تركيب الحوراق المعتمدة علي البحث والاسترجاح '(Retrieval-BasedVoiceConversion)' .عندما تكون المسألهة هي مشكة تصيفثنائيهة ―حوالي ما اذا كانت هده الحوراق حقائق او محركة باسخدام ذكا ءالأصلعي , فقد بيانتْ دراساة الاختلاف الزماني للأصدقاء عبر الاختبار 't' وجود اختالفاظ كبيرة وتوزيع مختلف بشكل معنىوي .لتقصيص مصدر الحوراق ,则对机器学习模形进行了超参数优化。لتقصيص مصدر الحوراق , فقد قدمان بتنفيذ عملية تعظم الهامشه '(HyperparameterOptimization)' للموديلة التعليم الآلى لاكتساب تلك الغرض .بعد تنفيد عملية تعظم الهامشه '(HyperparameterOptimization)' والمتدرب علي أكثر FROM两百零八个独立的机器学习模形在十倍交叉验证上,بعد تنفيد عملية تعظم الهامشه '(HyperparameterOptimization)' والمتدرب علي أكثر FROM two hundred and eight models individually over tenfold cross-validation,فقد استنتجنا ان نموylehj التعزم المتطف لك للتدرج '(ExtremeGradientBoosting)' يمكن له الوصول إلي نسبة دقة تصيففئة بلغت المتوسطى منها ninety-nine point three percent ,وكذا فهو قادر علي تصيففئة الحوراق خلال فترة زمنيه حقائق ,حيث يحتاج فقط إلي حوالي four microseconds لكل ثانيتين .جميع البيانĀ التي تم الحصول عليها ضمن هده الدراسة قد صدرت بصورة حقائق ليستخدم In المستقبل In إطار دراست جديدة بشان الكشف عن حوارات المنتوج باسخدام ذكا ءالأصلعي.最正确的最终版:تشهد تقنيات الذekaء al-'asla'i الإبدa'atiaa المهدارة فa المجال al-kalaam العديد meN الآثار al-martabata biha wa-l-ti te-salih ila taqleeb al-kalaam wa-i'aadah turakib al-kalaam bayna al-shakhsiyyaat at-taabiihih bi-tariiqah mustaqimah wa-fi waqt haqaa'iqa . te-sheer hdaa at-tiqniyah ilaa khatar amali akhlaaqi aham wa-qad teekoon laha meN al-'awaabiq al-wahima meN kamaal ikhtilaaf al-khasasiyyah wat-tadhleel , wahuwa amr yaj'alu hajaatay ilaa takshif an-nataij meN tahreek at-tiknolojiya li-'i'aadah turakib at-takallum at-ta'amiqi "(Deepfake)" daruriyyah wa-massassah .li-mu'aalaja ma shaakaq al-jadeedah as-sharae'il illiha saabiqan , qad amaana bi-'i'daad majmu'at bayaanat 'DEEP-VOICE' fi hadha ad-dirasah illati tatadamman kalaamat haqaa'iqa li-aani mush-huurin thumma i'aadat turakib kalaamaatihim ila ba'dihim bil-bilaa dastawmalt tahreek at-tiknolojiya allati tamarridat 'alaa ba'th baath'(retrievAl-BAsedVoicE-ConverSiOn)' .fi i'tiraaf hadha ad-dirasah , tatadamman majmu'at bayaanat 'DEEP-Voice' kalaamat haqaa'iqa li-aani mush-huurin thumma i'aadat turakib kalaamaatihim ila ba'dihim bil-bilaa dastawmalt tahreek at-tiknolojiya allati tamarridat 'alaa ba'th baath'(retrievAl-BAsedVoicE-ConverSiOn)' .'inda kaanit almushkalah hiya mushkalah tasneef thinaaiyah ― hawl ma in kaanat hadha alkalamaha haqaaa'iqa aw makhrūjah bistashtiyāl dhikāyūn al-'asla'i , faqad bayyanā at-tahlīl istitishāqi limazīdat as-samt az-zamanīya abrāb istikhdam imtiyāz t-test wujūd ikhtilāfāt kabīrah wat-tawzīc muhtalif shakl muanwweli-taqsus madares alkalamaha , qad amanna bitanfeed jarynah ta'deem ahamsa'(hyperparameteR optimization)' lilmudailaat altaleem alyali laistikhdam dhalk gharaba'd tanfeed jarynah ta'deem ahamsa'(hyperparameteR optimization)' walmtareed ali akthar meN two hundred and eight models independently over ten-fold cross-validation,faqad astanjana an namudhayj ta'dyez matatarif littegrad'(extreme gradient boosting model') yumkin lah wasool ilay nazarat daqa tasneef balaghat altaweedia minhu ninety-nine point three percent,wakaatha huwa qadir alan tasneef alkalamaha fi waqt haqqai,hayth yahtaj izun ila nahi min arba'a mikrosekonde lil-thania wahidajamiee bayaanata illati amanna bitanfeedeha fi hadha ad-dirasah qad sarrahat siyaghat haqqai litastakhdam fi almaustaqbal fi dirasaat jadedeh bashan takshif an-nataij men tahreek dhikaayoun alasla'ai最正确的最终版:تشهد تقنيات الذكاء الإبداعي المتصاعد للأسلاعي (Generative AI) في مجال الكلماتوالتي تسهل تقليد الكلمات وإعادة تركيب الكلمات بين الشخصيات الطبيعين بطريقة مباشرة وفي وقت حقائق . تعتبر هذه التقنياه خطرأأخلاقيأهامأ(Ethical Threat) وقد يكون لها العديد meN العواقب الوخيمة مثل انتهاكات الخصةوية(Privacy Breaches)والتضليل(Misrepresentation), وهو الأمر الذي يجعل الحاجاة ضرورة ومأسسة لاكتساب كشف الكلمات المنتوج باسثال الأسلاعي لإعادة تركيب الكلمات العميقة(Real-Time Detection of AI-generated Speech for DeepFake)**.لمعالجة المشَاگل الجديدة المشار إليها سابقأن,قدمأن بإعداد مجمرة بيانأن DEEP-VOICE在这项研究中,该数据集包括八位知名人物的真实人类对话及他们之间互相转化的对话,使用了基于检索的方法(Retrieval-BasedVoiceConversion)。في إطار هذه الدارسة,تكون مجمرة البيانأن DEEP-VOICE,تحتوي على真实的人类对话来自八个知名的个人以及他们的对话被转化为其他人的对话,使用了一种基于搜索的方法(retrievAl-BAsedVoicE-ConverSiOn)来实现这一点。当问题被表述为一个二元分类问题时——即判断这段话是真实的还是由人工智能生成的——通过对时间音频特征进行t-检验的统计分析显示出显著的不同分布。当问题被表述为一个二元分类问题时——即判断这段话是真实的还是由人工智能生成的——则统计分析时间音频特征通过t-检验显示存在显著不同的分布。إلا أنني سأقوم بتوضيح الجمل الأخيرة بشكل أفضل:عند وضع المسألهة كالتصنيف الثنائي — سواء كانت الكلمات حقيقانية أو محركة بأستخدام الأسلاعي — فقد بيانت الدرسة الإحصائية لمميزأت السمعة الزمنيان via t-test existence of significant differences in distribution.لتقصيص مصدر الكلمات,则对机器学习模形进行了超参数优化。لتقصيص المصدر,قامأن بتنفيذ عملية تعظم الهمس(hyperparameteR optimization)* للموديلا التعليم اليالي لتحقيق ذلك الغرض.بعد تنفيد العملية,并训练超过两百零八个独立的机器学习模形在十倍交叉验证上,وبعد تنفيد العملية,并训练超过两百零八个独立的学习模形在十倍交叉验证上,وبعد تنفيد العملية,قامأن بتدريب أكثر meN two hundred and eight models independently over ten-fold cross-validation,استنتجأن أن نموذج التعزم المتطف لك للتراج(extreme gradient boosting model) يمكن له الوصول伊利百分比为ninety-nine point three percent* 的平均分类准确性,并且能够在实时情况下对话语进行分类,在给定一秒钟的话语时大约需要四微秒的时间。استنجأن أن نموذج التعزم المتطف لك للتراج(extreme gradient boosting model) يمكن له الوصول到百分比ninety-nine point three percent* 的平均分类准确性,并且能够在实时情况下对手语进行分类,在提供一秒钟的手语时仅需约四微秒的时间。استنجأن أن نموذج التعزم المتطف لك للتراج(extreme gradient boosting model) يمكن له الوصول伊利百分比为ninety-nine point three percent* 的平均分類準確性,并且能够在實時情況下對話語進行分類,在給定一秒鐘的話語時大約需要四微秒時間。استنجأن أن نموذج التعزم المتطف لك للتراج(extreme gradient boosting model) يمكن له الوصول伊利百分比为ninety-nine point three percent* 的平均分類準確性,并且能够在實時情況下對話語進行分類,在給定一秒鐘的話語時大約需要四微秒時間。استنجأن أن نموذج التعزم المتطف لك للتراج(extreme gradient boosting model) يمكن له الوصول到百分比ninety-nine point three percent* 的平均分類準確性,并且能够在實時情況下對話語進行分類,在提供一秒钟的话语时仅需约四微秒的时间。استنجأن أن نموذج التعزم المتطف لك للتراج(extreme gradient boosting model) يمكن له الوصول到百分比ninety-nine point three percent* 的平均分類準確性,并且能够在實時情況下對話語進行分類,在提供一秒钟的话语时仅需约四微秒的时间।استنجأن أن نموذج التعزم المتطف لك للتراج(extreme gradient boosting model) يمكنك him reaching an average classification accuracy of ninety-nine point three percent,and it can classify speech in real-time,given one second of speech it requires approximately four microseconds.جميع البيانÀT التي amanna bitanfeedeha fi hadha ad-dirasah qad sarrahat siyaghat haqqait litastakhdam fi almaustaqbal fi dirasaat jadedeh bashan takshif an-nataij men tahreek dhikaayoun alasla'ai所有为这项研究所生成的数据都已公开发布用于未来的人工智能话语检测研究。جميع البيانÀT التي amanna bitanfeedeha fi hadha ad-dirasah qad sarrahat siyaghat haqqait litastakhdam fi almaustaqbal fi dirasaat jadedeh bashan takshif an-nataij men tahreek dhikaayoun alasla'ai最终翻译版本:تشهد تقنياتها الذركاياة الإبداعتالية المتصاعدة (Generative AI) في مجال الحديثوالتي تسهل تقليد الحديث وإعادة تركيب الحديث بين الشخصيتFOR الطبيعين بطريقة مباشرة وفي وقت حقائق . تعتبر HDAH التقينة خطرAأخلاقيA مهمA***وقد يكون لها العديدmeN العواقب الوخيمة مثل انتهاقات الخصةوية والتض

الكشف الفوري عن الكلام المُولَد بواسطة الذكاء الاصطناعي لتحويل الصوت العميق (DeepFake) | أحدث الأوراق البحثية | HyperAI