1. مقدمة البرنامج التعليمي

Qwen3-Omni-30B-A3B-Captioner هو نموذج وصف صوتي ضخم، أصدره فريق Alibaba Tongyi Qianwen في سبتمبر 2025. يُنشئ النموذج تلقائيًا، دون أي توجيهات، أوصافًا دقيقة وشاملة للكلام المعقد، والأصوات المحيطة، والموسيقى، والمؤثرات الصوتية للأفلام والتلفزيون. يمكنه تحديد مشاعر المتحدث، والعناصر الموسيقية (مثل الأسلوب والآلات الموسيقية)، والمعلومات الحساسة. وهو مناسب لتحليل المحتوى الصوتي، والتدقيق الأمني، والتعرف على النوايا، وتحرير الصوت، وغيرها من المجالات. الأوراق البحثية ذات الصلة هي:تقرير فني عن Qwen3-Omini".

يستخدم هذا البرنامج التعليمي بطاقة RTX A6000 واحدة كمورد.

3. خطوات التشغيل

1. بعد بدء تشغيل الحاوية، انقر فوق عنوان API للدخول إلى واجهة الويب

2. خطوات الاستخدام

إذا تم عرض "بوابة سيئة"، فهذا يعني أن النموذج قيد التهيئة. نظرًا لأن النموذج كبير الحجم، يرجى الانتظار لمدة 2-3 دقائق وتحديث الصفحة. ملاحظة: مدة الصوت محدودة بـ 30 ثانية. يستغرق توليد النتائج حوالي 3-5 دقائق.

وصف المعلمة

درجة حرارة:كلما كانت القيمة أصغر، كانت الترجمات أكثر "محافظة" وأكثر يقينًا؛ وكلما كانت القيمة أكبر، كانت أكثر عشوائية وإبداعًا.

أعلى-صاختر فقط من بين "الكلمات ذات الدرجات العالية" التي يصل احتمالها إلى p. كلما كان p أصغر، قلّت الخيارات، وكان النص أكثر تحفظًا.

توب-كاحتفظ فقط بالكلمات ذات الاحتمالية الأعلى (k). كلما كان عدد الكلمات (k) أقل، قلّت الخيارات المتاحة، وكان النص أكثر تحفظًا.

4. المناقشة

🖌️ إذا رأيت مشروعًا عالي الجودة، فيرجى ترك رسالة في الخلفية للتوصية به! بالإضافة إلى ذلك، قمنا أيضًا بتأسيس مجموعة لتبادل الدروس التعليمية. مرحبًا بالأصدقاء لمسح رمز الاستجابة السريعة وإضافة [برنامج تعليمي SD] للانضمام إلى المجموعة لمناقشة المشكلات الفنية المختلفة ومشاركة نتائج التطبيق↓

HyperAI

تشغيل هذا Notebook

التاريخ

منذ 5 أشهر

الحجم

1.37 GB

الوسوم

التعرف على الصوت

الترخيص

Apache 2.0

GitHub

QwenLM/Qwen3-Omni

رابط الورقة البحثية

github.com

1. مقدمة البرنامج التعليمي

يستخدم هذا البرنامج التعليمي بطاقة RTX A6000 واحدة كمورد.

2. أمثلة المشاريع

3. خطوات التشغيل

1. بعد بدء تشغيل الحاوية، انقر فوق عنوان API للدخول إلى واجهة الويب

2. خطوات الاستخدام

إذا تم عرض "بوابة سيئة"، فهذا يعني أن النموذج قيد التهيئة. نظرًا لأن النموذج كبير الحجم، يرجى الانتظار لمدة 2-3 دقائق وتحديث الصفحة. ملاحظة: مدة الصوت محدودة بـ 30 ثانية. يستغرق توليد النتائج حوالي 3-5 دقائق.

وصف المعلمة

درجة حرارة:كلما كانت القيمة أصغر، كانت الترجمات أكثر "محافظة" وأكثر يقينًا؛ وكلما كانت القيمة أكبر، كانت أكثر عشوائية وإبداعًا.
أعلى-صاختر فقط من بين "الكلمات ذات الدرجات العالية" التي يصل احتمالها إلى p. كلما كان p أصغر، قلّت الخيارات، وكان النص أكثر تحفظًا.
توب-كاحتفظ فقط بالكلمات ذات الاحتمالية الأعلى (k). كلما كان عدد الكلمات (k) أقل، قلّت الخيارات المتاحة، وكان النص أكثر تحفظًا.

4. المناقشة

تم المساهمة في هذا الدفتر من قبل مستخدمي المجتمع وهو مخصص لأغراض تعليمية وإعلامية فقط. إذا كان أي محتوى ينطوي على انتهاك لحقوق النشر، يرجى الاتصال بنا على [email protected] للمراجعة والإزالة الفورية.

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي

وحدات GPU جاهزة للعمل

أفضل الأسعار

ابدأ عرض الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا

سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين

مدعوم بواسطة MailChimp

HyperAI

تشغيل هذا Notebook

التاريخ

منذ 5 أشهر

الحجم

1.37 GB

الوسوم

التعرف على الصوت

الترخيص

Apache 2.0

GitHub

QwenLM/Qwen3-Omni

رابط الورقة البحثية

github.com

1. مقدمة البرنامج التعليمي

يستخدم هذا البرنامج التعليمي بطاقة RTX A6000 واحدة كمورد.

2. أمثلة المشاريع

3. خطوات التشغيل

1. بعد بدء تشغيل الحاوية، انقر فوق عنوان API للدخول إلى واجهة الويب

2. خطوات الاستخدام

إذا تم عرض "بوابة سيئة"، فهذا يعني أن النموذج قيد التهيئة. نظرًا لأن النموذج كبير الحجم، يرجى الانتظار لمدة 2-3 دقائق وتحديث الصفحة. ملاحظة: مدة الصوت محدودة بـ 30 ثانية. يستغرق توليد النتائج حوالي 3-5 دقائق.

وصف المعلمة

درجة حرارة:كلما كانت القيمة أصغر، كانت الترجمات أكثر "محافظة" وأكثر يقينًا؛ وكلما كانت القيمة أكبر، كانت أكثر عشوائية وإبداعًا.
أعلى-صاختر فقط من بين "الكلمات ذات الدرجات العالية" التي يصل احتمالها إلى p. كلما كان p أصغر، قلّت الخيارات، وكان النص أكثر تحفظًا.
توب-كاحتفظ فقط بالكلمات ذات الاحتمالية الأعلى (k). كلما كان عدد الكلمات (k) أقل، قلّت الخيارات المتاحة، وكان النص أكثر تحفظًا.

4. المناقشة

نشر Qwen-Image-2512 باستخدام vLLM-Omni

منذ 6 أيام

نشر Qwen-Image-Edit باستخدام vLLM-Omni

منذ 6 أيام

llama.cpp+openwebui Deploys Qwen3-VL-8B-Instruct-GGUF

منذ 6 أيام

نشر DeepSeek-R1-70B بنقرة واحدة

منذ 3 أشهر

Z-Image-Turbo: نموذج عالي الكفاءة لتوليد الصور بستة معلمات

منذ 2 أشهر

Dia2-TTS: خدمة توليف الكلام في الوقت الحقيقي

منذ 2 أشهر

جارفيس آرت - معاينة برنامج تنقيح الصور الذكي

منذ شهر واحد

شجرة عيد الميلاد ثلاثية الأبعاد تعتمد على التعرف على الإيماءات

منذ 2 أشهر

Krea-realtime-video: نموذج توليد الفيديو في الوقت الفعلي

منذ 3 أشهر

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

البرمجة التعاونية باستخدام الذكاء الاصطناعي

وحدات GPU جاهزة للعمل

أفضل الأسعار

ابدأ عرض الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا

سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين

مدعوم بواسطة MailChimp

Command Palette

Qwen3-Omni-30B-A3B-Captioner: وصف صوتي للنموذج الكبير

1. مقدمة البرنامج التعليمي

2. أمثلة المشاريع

3. خطوات التشغيل

1. بعد بدء تشغيل الحاوية، انقر فوق عنوان API للدخول إلى واجهة الويب

2. خطوات الاستخدام

4. المناقشة

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

Qwen3-Omni-30B-A3B-Captioner: وصف صوتي للنموذج الكبير

1. مقدمة البرنامج التعليمي

2. أمثلة المشاريع

3. خطوات التشغيل

1. بعد بدء تشغيل الحاوية، انقر فوق عنوان API للدخول إلى واجهة الويب

2. خطوات الاستخدام

4. المناقشة

ذات صلة دفاتر تفاعلية

نشر Qwen-Image-2512 باستخدام vLLM-Omni

نشر Qwen-Image-Edit باستخدام vLLM-Omni

llama.cpp+openwebui Deploys Qwen3-VL-8B-Instruct-GGUF

نشر DeepSeek-R1-70B بنقرة واحدة

Z-Image-Turbo: نموذج عالي الكفاءة لتوليد الصور بستة معلمات

Dia2-TTS: خدمة توليف الكلام في الوقت الحقيقي

جارفيس آرت - معاينة برنامج تنقيح الصور الذكي

شجرة عيد الميلاد ثلاثية الأبعاد تعتمد على التعرف على الإيماءات

Krea-realtime-video: نموذج توليد الفيديو في الوقت الفعلي

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

Qwen3-Omni-30B-A3B-Captioner: وصف صوتي للنموذج الكبير

1. مقدمة البرنامج التعليمي

2. أمثلة المشاريع

3. خطوات التشغيل

1. بعد بدء تشغيل الحاوية، انقر فوق عنوان API للدخول إلى واجهة الويب

2. خطوات الاستخدام

4. المناقشة

ذات صلة دفاتر تفاعلية

نشر Qwen-Image-2512 باستخدام vLLM-Omni

نشر Qwen-Image-Edit باستخدام vLLM-Omni

llama.cpp+openwebui Deploys Qwen3-VL-8B-Instruct-GGUF

نشر DeepSeek-R1-70B بنقرة واحدة

Z-Image-Turbo: نموذج عالي الكفاءة لتوليد الصور بستة معلمات

Dia2-TTS: خدمة توليف الكلام في الوقت الحقيقي

جارفيس آرت - معاينة برنامج تنقيح الصور الذكي

شجرة عيد الميلاد ثلاثية الأبعاد تعتمد على التعرف على الإيماءات

Krea-realtime-video: نموذج توليد الفيديو في الوقت الفعلي

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

ذات صلة دفاتر تفاعلية

نشر Qwen-Image-2512 باستخدام vLLM-Omni

نشر Qwen-Image-Edit باستخدام vLLM-Omni

llama.cpp+openwebui Deploys Qwen3-VL-8B-Instruct-GGUF

نشر DeepSeek-R1-70B بنقرة واحدة

Z-Image-Turbo: نموذج عالي الكفاءة لتوليد الصور بستة معلمات

Dia2-TTS: خدمة توليف الكلام في الوقت الحقيقي

جارفيس آرت - معاينة برنامج تنقيح الصور الذكي

شجرة عيد الميلاد ثلاثية الأبعاد تعتمد على التعرف على الإيماءات

Krea-realtime-video: نموذج توليد الفيديو في الوقت الفعلي

ذات صلة دفاتر تفاعلية

نشر Qwen-Image-2512 باستخدام vLLM-Omni

نشر Qwen-Image-Edit باستخدام vLLM-Omni

llama.cpp+openwebui Deploys Qwen3-VL-8B-Instruct-GGUF

نشر DeepSeek-R1-70B بنقرة واحدة

Z-Image-Turbo: نموذج عالي الكفاءة لتوليد الصور بستة معلمات

Dia2-TTS: خدمة توليف الكلام في الوقت الحقيقي

جارفيس آرت - معاينة برنامج تنقيح الصور الذكي

شجرة عيد الميلاد ثلاثية الأبعاد تعتمد على التعرف على الإيماءات

Krea-realtime-video: نموذج توليد الفيديو في الوقت الفعلي