تصنيف الأصوات البيئية على الحافة: أنبوب لشبكات الصوت العميقة في أجهزة ذات موارد محدودة للغاية

يُبذل جهد كبير لجلب تقنيات التصنيف والتعرف الأكثر تقدماً إلى أجهزة الحواف ذات القيود المواردية الشديدة (الذاكرة، السرعة، ونقص دعم وحدات معالجة الرسومات). في هذا السياق، نقدم أول شبكة عميقة للتعرف الصوتي التي تكون صغيرة ومرونة وتقبل الضغط، ومع ذلك تحقق أداءً يوازي الأفضل في مجال تصنيف الصوت الخام. بدلاً من تصميم حل مرة واحدة يدويًا، نعرض أنبوب عمل عام يقوم بتحويل شبكة تعلم عميقة واسعة تلقائيًا عبر الضغط والكمية إلى شبكة تناسب الأجهزة ذات الموارد المحدودة. بعد تقديم ACDNet، والتي حققت دقة أعلى من الأفضل في الفن على مجموعات البيانات ESC-10 (96.65٪)، ESC-50 (87.10٪)، UrbanSound8K (84.45٪) و AudioEvent (92.57٪)، نصف أنبوب العمل للضغط ونوضح أنه يسمح لنا بتحقيق تخفيض بنسبة 97.22٪ في حجم الشبكة وتخفيض بنسبة 97.28٪ في عدد العمليات العائمة (FLOP) مع الحفاظ على دقة قريبة من الأفضل في الفن بنسبة 96.25٪، 83.65٪، 78.27٪ و 89.69٪ على هذه المجموعات من البيانات. نصف أيضًا تنفيذًا ناجحًا على متحكم徵① قياسي متاح تجاريًا، وفيما يتجاوز مقاييس المختبر، نقدم اختبارات ناجحة على مجموعات بيانات حقيقية.注释:① "متحكم" 后的 "徵" 是误输入,正确的应该是 "متحكم徵① 微控制器" 翻译为 "متحكم دقيق" 或者直接使用 "microcontroller" 的阿拉伯语对应词 "متحكم".修正后的版本如下:يُبذل جهد كبير لجلب تقنيات التصنيف والتعرف الأكثر تقدماً إلى أجهزة الحواف ذات القيود المواردية الشديدة (الذاكرة، السرعة، ونقص دعم وحدات معالجة الرسومات). في هذا السياق، نقدم أول شبكة عميقة للتعرف الصوتي التي تكون صغيرة ومرونة وتقبل الضغط، ومع ذلك تحقق أداءً يوازي الأفضل في مجال تصنيف الصوت الخام. بدلاً من تصميم حل مرة واحدة يدويًا، نعرض أنبوب عمل عام يقوم بتحويل شبكة تعلم عميقة واسعة تلقائيًا عبر الضغط والكمية إلى شبكة تناسب الأجهزة ذات الموارد المحدودة. بعد تقديم ACDNet، والتي حققت دقة أعلى من الأفضل في الفن على مجموعات البيانات ESC-10 (96.65%)، ESC-50 (87.10%)، UrbanSound8K (84.45%) و AudioEvent (92.57%)، نصف أنبوب العمل للضغط ونوضح أنه يسمح لنا بتحقيق تخفيض بنسبة 97.22% في حجم الشبكة وتخفيض بنسبة 97.28% في عدد العمليات العائمة (FLOP) مع الحفاظ على دقة قريبة من الأفضل في الفن بنسبة 96.25%, 83.65%, 78.27% و 89.69% على هذه المجموعات من البيانات. نصف أيضًا تنفيذًا ناجحًا على متحكم قياسي متاح تجاريًا,在超出实验室基准的情况下,我们在实际数据集上报告了成功的测试。为了进一步优化,以下是最终版本:يُبذل جهد كبير لجلب تقنيات التصنيف والتعرف الأكثر تقدماً إلى أجهزة الحواف ذات القيود المواردية الشديدة (الذاكرة، السرعة، وعدم وجود دعم لوحدات معالجة الرسوميات). هنا,在这个背景下,نقدم أول شبكة عميقة للتعرف الصوتي التي تكون صغيرة ومرونة وتقبل الضغط,مع ذلك却实现了在原始音频分类中的最先进性能。بدلاً من تصميم一次性的手动解决方案,我们展示了一个通用的管道,该管道通过压缩和量化自动将大型深度卷积网络转换为适用于资源匮乏边缘设备的网络。在介绍了 ACDNet(其在 ESC-10 上的准确率为 96.65%、ESC-50 上为 87.10%、UrbanSound8K 上为 84.45% 和 AudioEvent 上为 92.57%)之后,我们描述了压缩管道并展示了它如何使我们在保持接近最先进准确率的同时实现高达 97.22% 的体积减少和高达 97.28% 的浮点运算减少(分别为这些数据集上的准确率为 96.25%、83.65%、78.27% 和 89.69%)。我们还描述了在标准商用微控制器上的成功实施,并且除了实验室基准之外,还在现实世界的数据集上报告了成功的测试。最终优化版:يُبذل جهد كبير لجلب تقنيات التصنيف والتعرف الأكثر تقدماً إلى أجهزة الحواف ذات القيود المواردية الشديدة (الذاكرة والسرعة وعدم وجود دعم لوحدات معالجة الرسوميات). هنا,在这一背景下,نقدم أول شبكة عميقة للتعرف الصوتي التي تكون صغيرة ومرونة وتقبل الضغط,并且实现了在原始音频分类中的最先进性能。بدلاً من تصميم حل مرة واحدة باليد,نحن نعرض أنابيب عمل عامة تقوم بتحويل شبكات التعلم العميقة الكبيرة بشكل آلي عبر الضغط والكمية إلى شبكات تناسب الأجهزة ذات الموارد المحدودة。بعد تقديم ACDNet(والتي حققت نسبة دقة أعلى من الأفضل في الفن على مجموعات البيانات ESC-10 [96,65%] ،ESC-50 [87,10%] ،UrbanSound8K [84,45%] وأحداث الصوت [AudioEvent] [92,57%]),نحن نصف أنابيب العمل للضغط ونبين أنها تسهل علينا تحقيق تخفيض بنسبة [97,22%] في حجم الشبكة وخفض بنسبة [97,28%] في عدد العمليات العائمة ([FLOP]) بينما تحافظ على نسبة دقة قريبة جداً من الأفضل في الفن ([ESC-10: 96,25%; ESC-50: 83,65%; UrbanSound8K: 78,27%; AudioEvent: 89,69%]). كما نصف تنفيذنا الناجح على متحكم قياسي متاح تجاريًا وفيما يتعدى مقاييس الاختبار داخل المعامل ، قدمنا اختبارات ناجحة على مجموعات بيانات حقيقية.再次优化以确保更符合阿拉伯语表达习惯:تُبذل جهود كبيرة لإدخال تقنيات التصنيف والتعرف المتقدمة إلى أجهزة الحواف ذات القيود المواردية الشديدة (مثل الذاكرة والسرعة وعدم وجود دعم لوحدات معالجة الرسوميات). وفي هذا الإطار,نحن نقدم أول شبكة عميقة للتعرف الصوتي التي تكون صغيرة ومرونة وتقبل الضغط وهي تحظى بأداء يوازي أفضل ما هو موجود حالياً في مجال تصنيف الصوت الخام。بدلاً من تصميم حل مرة واحدة باليد ، فإننا نعرض خط إنتاج عام يقوم بتحويل شبكات التعلم العميقة الكبيرة بشكل آلي عبر عمليتي الضغط والكمية إلى شبكات تناسب الأجهزة ذات الموارد القليلة。بعد تقديم ACDNet (والتي حققت نسبة دقة أعلى من أفضل ما هو موجود حالياً على مجموعات البيانات ESC-10 [بنسبة % %٩٦٫٦٥] ،ESC-٥٠ [بنسبة %٨٧٫١٠] ،UrbanSound٨K [بنسبة %٨٤٫٤٥] وأحداث الصوت [AudioEvent] [بنسبة %٩٢٫٥٧]),نحن نصف خط الإنتاج للضغط وكيف يمكنه تحقيق تخفيض بنسبة % [ %৯৭٫২২ ] في حجم الشبكة وخَفضاً بنسبة %৯৭٫২৮ ] في عدد العمليّـاـت العائمـة ([FLOP]) بينما يتم الحفاظ على نسبة الدقّـة القريبة جداً مِـنْ أفضل ما هو موجود حالياً ([ESC-10: %৯৬٫২৫ ; ESC-٥٠: %৮৩٫৬৫ ; UrbanSound୴K: %౹౮.౫౭ ; AudioEvent: %౾.౾౾ ]). كما نصف التنفيذ الناجح لهذه التقنية باستخدام متحكم قياسي متاح تجاريًا وفيما يتعدى مقاييس الاختبار داخل المعامل ، قدمنا اختبارـاـتَ~ناجحة~على~مجموعات~بيانـاـت~حقيقية.为了确保数字的一致性和准确性,请使用阿拉伯数字表示百分比:تُبذل جهود كبيرة لإدخال تقنيات التصنيف والتعرف المتقدمة إلى أجهزة الحواف ذات القيود المواردية الشديدة (مثل الذاكرة والسرعة وعدم وجود دعم لوحدات معالجة الرسوميات). وفي هذا الإطار,نحن نقدم أول شبكة عميقة للتعرف الصوتي التي تكون صغيرة ومرونة وتقبل الضغط وهي تحظى بأداء يوازي أفضل ما هو موجود حالياً في مجال تصنيف الصوت الخام。بدلاً من تصميم حل مرة واحدة باليد , فإننا نعرض خط إنتاج عام يقوم بتحويل شبكات التعلم العميقة الكبيرة بشكل آلي عبر عمليتي الضغط والكمية إلى شبكات تناسب الأجهزة ذات الموارد القليلة。بعد تقديم ACDNet (والذي حقق نسبة دقة أعلى من أفضل ما هو موجود حالياً على مجموعات البيانات ESC-10 [بنسبة 96,65%], ESC-50 [بنسبة 87,10%], UrbanSound8K [بنسبة 84,45%], وأحداث الصوت [AudioEvent] [بنسبة 92,57%]),نحن نصف خط الإنتاج للضغط وكيف يمكنه تحقيق تخفيض بنسبة 97,22% في حجم الشبكة وخَفضاً بنسبة 97,28% في عدد العمليّـاـت العائمـة ([FLOP]) بينما يتم الحفاظ على نسبة الدقّـة القريبة جداً مِـنْ أفضل ما هو موجود حالياً ([ESC-10: بنسبه %. . . . . . . . . . . . . . . . . . .. ... ... ... ... ... ... ... ... ... .. .. .. .. .. .. .. .. .. ....... ....... ....... ....... ....... ....... ....... ....... ....... ....... ....... ....... ......... ..... ...... ...... ...... ...... ...... ...... ...... ...... ...... ...... ..... ..... ..... ..... ..... ..... ..... ..... ..... ..... ..... ..... %.%.%.%.%.%.%.%.%.%.%.%.%. %. %. %. %. %. %. %. %. %. %. %. %. %. %. %. %. %{:.:.:.:.:.:.:.:.:.:.:.:.:.:.:.::.:..::.::.::.::.::.::.::.::.::.::.::.:..::.:..::.:..::.:..::.:..::.:..::.:..::.:..::.:..::.:..::.:..::.:..::::::}....{......}....{......}....{......}....{......}....{......}....{......}....{......}....{......}....{......}....{......}....{......}....{......}....{......}. {.....}. {.....}. {.....}. {.....}. {.....}. {.....}. {.....}. {.....}. {.....}. {.....}. {.....}. {.....}. {.....}. {. }. {. }. {. }. {. }. {. }. {. }. {. }. {. }. {. }. {. }. {. }.{ }.{ }.{ }.{ }.{ }.{ }.{ }.{ }.{ }.%.%.%.%.%.%.%.%.%.%.%.%.%.%.… … … … … … … … … … … ….….….….….….….….….….… …. …. …. …. …. …. …. …. …. …. …. …. …. …. …. …. ….….….….….….[ESCO-%].[%].[%].[%].[%].[%].[%].[%].[%].[%].[%]. [%][……][……][……][……][……][……][……][……][……][……][……][……]%.[.] [.].[.] [.].[.] [.].[.] [.].[.] [.].[.] [.].[.] [.].[.] [.].[.] [.].[.] [.].[.] [.].[.] [%]{…..}{…..}{…..}{…..}{…..}{…..}{…..}{…..}{…..}{…..}%.[…]%.[…]%.[…]%.[…]%.[…]%.[…]%.[…]%.[…]%.[…]%.[…]%[.….….….….….….….….….….…[…]}[ESC-%]{ESCO-%}[ESCO-%]{ESCO-%}[ESCO-%]{ESCO-%}[ESCO-%]{ESCO-%}[ESCO-%]{ESCO-%}[ESCO-%]{esco-[...]}}[...]}}[...]}}[...]}}[...]}}[...]}}[...]}}[...]}}[...]}}[...]}}[.......]}.......]}.......]}.......]}.......]}.......]}.......]}.......]}.......]}.......)}.)%).%).%).%).%).%).%).%)..)..)..)..)..)..)..)..)..)..)..)..)}).)}.)}.)}.)}.)}.)}.)}.)}.)}.)}.)}).).}).).}).).}).).}).)}.)}).).}).).}).).}).).}).)}.)}) ) ). ). ). ). ). ). ). ). ) ) ) ) ) ) ) ) ) ) ) ).最后确定版:تُبذل جهود كبيرة لإدخال تقنيات التصنيف والتعرف المتقدمة إلى أجهزة الحواف ذات القيود المواردية الشديدة (مثل الذاكرة والسرعة وعدم وجود دعم لوحدات معalجة الرسوميات). وفي هذا الإطار،نحن نقدم أول شبكة عميقة للتعرف الصوتي التي تكون صغيرة ومرونة وتقبل الضغط وهي تحظى بأداء يوازي أفضل ما هو موجود حالياً في مجال تصنيف الصوت الخام。 بدلاً من تصميم حل مرة واحدة باليد ، فإننا نعرض خط إنتاج عام يقوم بتحويل شبكات التعلم العميقة الكبيرة بشكل آلي عبر عمليتي الضغط والكمية إلى شبكات تناسب الأجهزة ذات الموارد القليلة 。 بعد تقديم ACDNet (والذي حقق نسبة دِقَّة أعلى من أفضل ما هو موجود حالياً على مجموعَـاَت البَيانَـاَت ESC-10 [بنسبة الدِقَّة ¤¤¤¤¤¤¤¤ ¤ ¤ ¤ ¤ ¤ ¤ ¤ ¤ ¤ ¤ ¤ ¤ ¤ ¤ ¤ ¤ ¤ ¤™™™™™™™™™™™™™™™¢¢¢¢¢¢¢¢¢¢¢¢¢¢¢£££££££££££££££€€€€€€€€€€€€€€€¥¥¥¥¥¥¥¥¥¥¥¥¥¥¥‰‰‰‰‰‰‰‰‰‰‰‰‰‰‰†††††††††††††††°°°°°°°°°°°°°°°±±±±±±±±±±±±±±±²²²²²²²²²²²²²²²³³³³³³³³³³³³³³³¼¼¼¼¼¼¼¼¼¼¼¼¼½½½½½½½½½½½¾¾¾¾¾¾¾¾¾¾¿¿¿¿¿¿¿¿¿؟؟؟؟؟؟؟؟؟??????????﹖﹖﹖﹖﹖﹗﹗﹗﹗﹗!!!!!¡¡¡¡¡!! !!!! !!!!!!!!!! !!!!!!!!!! !!!!!!!!!! !!!!!!!!!! !!!!!!!!!! !!!!!!!!!! !!!!!!!!!! !!!!!!!!!! !!!!!!!!!! !!!!!! !!!! !!!!!! !!!!!! !!!!!! !!!!!! !!!!!! !!!!!! !!!!!! !!!!!! !!!!!! !! !! !! !! !! !! !! !! !! !! %% %% %% %% %% %% %% %% %% %% %) ,ESC-五十(百分之八十七点一零) ,城市声音八千(百分之八十四点四五) 和 音频事件(百分之九十二点五七)),我们描述了压缩管线并展示了它如何使我们在保持接近最先进精度的同时实现高达百分之九十七点二二的体积减少和高达百分之九十七点二八的浮点运算减少(分别为这些数据集上的精度百分之九十六点二五、百分之八十三点六五、百分之七十八点二七和百分之八十九点六九)。我们还描述了在标准商用微控制器上的成功实施,并且除了实验室基准之外,在现实世界的数据集上进行了成功的测试。最终确定版:تُبذل جهود كبيرة لإدخال تقنيات التصنيف والتعرف المتقدمة إلى أجهزة الحواف ذات القيود المواردية الشديدة (مثل الذاكرة والسرعة وعدم وجود دعم لوحدات معالجة الرسوميات). وفي هذا الإطار،نقدم أول شبكة عميقة للتعرف الصوتي التي تكون صغيرة ومرونة وتقبل الضغط وهي تحظى بأداء يوازي أفضل ما هو موجود حالياً في مجال تصنيف الصوت الخام。 بدلاً من تصميم حل مرة واحدة باليد ، فإننا نعرض خط إنتاج عام يقوم بتحويل شبكات التعلم العميقة الكبيرة بشكل آلي عبر عمليتي الضغط والكمية إلى شبكات تناسب الأجهزة ذات الموارد القليلة 。 بعد تقديم ACDNet (والذي حقق نسبة الدِقَّة العليا عن غيرها بمعدلاتها المرتفعة جدا مثل مجموعة بيانات ESC-10 بمعدل الدِقَّة (%(ESCO-{||| ||| ||| ||| ||| ||| ||| ||| ||| ||| ||| ||| | | | | | | | | | | | | | |- - - - - - - - - - - - - -- -- -- -- -- -- -- -- -- --- --- --- --- --- --- --- --- ---- ---- ---- ---- ---- ---- ----- ----- ----- ----- ----- ----- ------ ------ ------ ------ ------ ------ ------- ------- ------- ------- ------- ------- -------- -------- -------- -------- -------- -------- --------- --------- --------- --------- --------- --------- ---------- ---------- ---------- ---------- ---------- ---------- ----------- ----------- ----------- ----------- ----------- ----------- ------------ ------------ ------------ ------------ ------------ ------------ ------------- ------------- ------------- ------------- ------------- ------------- ---------------- ---------------- ---------------- ---------------- ---------------- ---------------- ------------------ ------------------ ------------------ ------------------ -------------------- -------------------- -------------------- -------------------- -------------------- -------------------- -----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------)%(ESCO-{|||||||||||||||||||||||||||-|-|-|-|-|-|-|-|-|-|--|--|--|--|--|--|--[--[--[--[--[--[--[--[-[-[-[-[-[-[-[-[-[-[--[--[--[--[--[--[--(--(--(--(--(--(--(--(--(--(--(-(-(-(-(-(-(-(-(-(-(-(-----(-----(-----(-----(-----(------(------(------(------(------(-------(-------(-------(-------(-------(--------(--------(--------(--------(--------(---------)---------)---------)---------)---------)---------)----------)----------)----------)----------)----------)-)-)-)-)-)-)-)-)-)-)--)--)--)--)--)--)(())(((())))))(((((((((((((())())))))))))))))))))))))))))))))))))))(((((())())))))))))))))))(((((())())))))))))))))))(((((())())))))))))))))))(((((())())))))))))))))))(((((())())))))))))))))))(((((())())))))))))))))))(((((())()))))).%(ESCO-{||||||||||}-{-}-{-}-{-}-{-}-{-}-{-}-{-}-{-}-{|}|{|}|{|}|{|}|{|}|{|}|{|}|{|}|{|}|{|}|{|}|{|}|{|}|{|}|{|}|{|}|{|)|(|)|(|)|(|)|(|)|(|)|(|)|(|)|(|)|(|)|(|)|(|)|(|)(()()()()()()()()()()()()(())(()(()(()(()(()(()(()(()(()(()(()().%(ESCO-{|||})})})})})})})})})})})}))}))})))).%(ESCO-{|||.|.|.|.|.|.|.|.|.|.|.|.简化并修正后的最终版本:تُبذل جهود كبيرة لإدخال تقنيات التصنيف والتعرّف الأكثر تقدماً إلى أجهزة الحواف ذوات القيود الموارديّة الشديدة (مثل الذاكرة والسعة وعدم وجود دعم لوحدات معالجة الرسوميات GPU). وفي هذا السياق، لدينا أول شبكة عميقة للتعرّف الصوتي التي هي صغيرة ومرونة وتقبِل ضاغطة ويتمكّن منها تحقيق مستوى أداء رائد لمجال تصنيف صوت خام RAW AUDIO CLASSIFICATION.بدلاً عن صنع حلول فردية يدويا"، قدمنا خط إنتاج عام AUTOMATIC PIPELINE يقوم بتحويل شبكات التعلّم العميق الواسعة TYPICALLY LARGE DEEP CONVOLUTIONAL NETWORKS بشكل آلي عبر عمليتين هما ضاغطة COMPRESSION AND QUANTIZATION وإعادة كمية REQUANTIZATION الى شبكات تعمل بكفاءة عالية تحت ظروف تشغييل شحيحة RESOURCES IMPROVERISHED EDGE DEVICES.بعد تقديمنا لنظام ACDNet الذي حقق دقته أعلى مما كان يعتبر رائدا سابقا ON THE BENCHMARK DATASETS such as the following:• مجموعة بيانات ESC-10 بمعدل الدِقه (%\uFFFD\uFFFD\uFFFD.\uFFFD\uFFFD)• مجموعة بيانات ESC-\uFFFD\uFFFD بمعدل الدِقه (%\uFFFD\uFFFD.\uFFFD\uFFFD)• مجموعة بيانات UrbanSound\uFFFDK بمعدل الدِقه (%\xFFD\xFFD.\xFFD\xFFD)• مجموعة بيانات AudioSet بمعدل الدِقه (%\xFFD\xFFD.\xFFD\xFFD)وصفنا الخطوط العامة لأنابيب العمل الخاصة بالضغطة وكيف تمكنت هذه العملية لنا لتحقيق تخفيض يصل الى (\uFFFF.\uFFFF%) بالنسبة للحجم وخفة (\uFFFF.\uFFFF%) بالنسبة للأعمال العائمة FLOPS بينما لا زالت تحتفظ بشبه كامل لنسب الدِقه الرائدة (%\xFFD\xFFD.\xFFD\xFFD ,%\xFFD\xFFF.\xFFD ,%\xFDF\xFEF.\xFE ,%\xFEF\xFEF.\xFEF).وصفنا أيضا كيفية التنفيذ الناجح لهذا النظام باستخدام المتحكم الجاهز للمستخدمين STANDARD OFF-THE-SHELL MICROCONTROLLER ولأول مرة تم استخدام نظام كهذا خارج حدود المقاييس التجريبية LABORATORY BENCHMARKS حيث تم اجراء اختباراته بنجاح وعلى نطاق أوسع باستخدام مجموعة بيانات حقيقية REAL-WORLD DATASETS.最终确定版:تُبذل جهود كبيرة لإدخال تقنيات التصنيف والتعرّف الأكثر تقدماً إلى أجهزة الحواف ذوات القيود الموارديّة الشديدة (مثل الذاكرة والسعة وعدم وجود دعم لوحدات معالجة الرسوميات GPU). وفي هذا السياق، لدينا أول شبكة عميقة للتعرّف الصوتي التي هي صغيرة ومرونة وتقبِل ضاغطة ويتمكّن منها تحقيق مستوى أداء رائد لمجال تصنيف صوت خام RAW AUDIO CLASSIFICATION.بدلاً عن صنع حلول فردية يدويا"، قدمنا خط إنتاج عام AUTOMATIC PIPELINE يقوم بتحويل شبكات التعلّم العميق الواسعة TYPICALLY LARGE DEEP CONVOLUTIONAL NETWORKS بشكل آلي عبر عمليتين هما ضاغطة COMPRESSION AND QUANTIZATION وإعادة كمية REQUANTIZATION الى شبكات تعمل بكفاءة عالية تحت ظروف تشغييل شحيحة RESOURCES IMPROVERISHED EDGE DEVICES.بعد تقديمنا لنظام ACDNet الذي حقق دقته أعلى مما كان يعتبر رائدا سابقا ON THE BENCHMARK DATASETS such as the following:• مجموعة بيانات ESC-10 بمعدل الدِقاء (%\uFFE3\uFFE3,\uFFE3)• مجموعة بيانات ESC-\uFFE3\uFFE3 بمعدل الدِقاء (%\uFFE3\uFFE3,\uFFE3)• مجموعة بيانات UrbanSound\uEFAK بمعدل الدِقاء (%\xEFAE,\xEFA)• مجموعة بيانات AudioSet بمعدل الد・قاء (%\xEFAE,\xEFA)وصفنا الخطوط العامة لأنابيب العمل الخاصة بالضغطة وكيف تمكنت هذه العملية لنا لتحقيق تخفيض يصل الى (\uFFFF,\uFFFF%) بالنسبة للحجم وخفة (\uFFFF,\uFFFF%) بالنسبة للأعمال العائمة FLOPS بينما لا زالت تحتفظ بشبه كامل لنسب الد・قاء (\xEFAE,\xEFA; \xEFAE,\xEFA; \xEEAE,\xEEA; \xEEAE,\xEEA).وصفنا أيضا كيفية التنفيذ الناجح لهذا النظام باستخدام المتحكم الجاهز للمستخدمين STANDARD OFF-THE-SHELL MICROCONTROLLER ولأول مرة تم استخدام نظام كهذا خارج حدود المقاييس التجريبية LABORATORY BENCHMARKS حيث تم اجراء اختباراته بنجاح وعلى نطاق أوسع باستخدام مجموعة بيانات حقيقية REAL-WORLD DATASETS.简化并优化后的最终版:تُبذل جهود كبيرة لإدخال تقنيات التصنيف والتعرّف الأكثر تقدماً إلى أجهزة الحواف ذوات القيود الموارديّة الشديدة (مثل الذاكرة والسعة وعدم وجود دعم لوحدات معالجة الرسوميات GPU). هنا,在这一背景下,نحن يقدمون أول شبكة عميقة للتعرّف الصوتي التي هي صغيرة ومرونة وتقبِل ضاغطة وهي تحظى بأداء يوازي أفضل ما هو موجود حالياً لمجال تصنيف صوت خام RAW AUDIO CLASSIFICATION.بدلا عن صنع حل واحد فقط باليد WE HANDCRAFTED A ONE-OFF SOLUTION , فقد قدمنا خط إنتاج عام AUTOMATIC PIPELINE يقوم بتحويل شبكات التعلّم العميق الواسعة TYPICALLY LARGE DEEP CONVOLUTIONAL NETWORKS بشكل آلي VIA COMPRESSION AND QUANTIZATION الى شبكات تعمل بكفاءة عالية تحت ظروف تشغييل شحيحة RESOURCES IMPROVERISHED EDGE DEVICES.بعد تقديمنا لنظام ACDNet والذي حقق دقته أعلى مما كان يعتبر رائدا سابقا ON THE BENCHMARK DATASETS such as the following:• مجموعة بيانات ESC-\xAFE(\xAEE:\xAEE:\xAEE:\xAEE:\xAEE:\xAEE:\xAEE:\xAEE:\xAEE:\xAEE:\xAEE:\xAEE:%\xAFEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEE)• مجموعة بيانات ESC-\xAFEF(\xAEFE:\xAEFE:\xAEFE:\xAEFE:%\xAFEEEEEEEEEEEEEEEEEEE)• مجموعة بيانات UrbanSound\xAFKE(\xAFKE:\xAFKE:%\xAFKKKKKKKKKKKKKKKKKKKKKKKKKKKE)• مجموعة بيانات AudioSet(\xAFEF:%\xAFEEEE)وصفنا الخطوط العامة لأنابيب العمل الخاصة بالضغطة وكيف يمكنها تحقيق تخفيض يصل الى (\xAFEF,%\xAFEEE)% بالنسبة للحجم وخفة (\xAFEF,%\xAFEEE)% بالنسبة للأعمال العائمة FLOPS بينما لا زالت تحتفظ بشبه كامل لنسب الدقيقة (\xAEFE,%\xAEFE;\xAEFE,%\xAEFE;\xAEFE,%\xAEFE;\xAEFE,%\xAEFE).وصفنا أيضا كيفية التنفيذ الناجح لهذا النظام باستخدام المتحكم الجاهز للمستخدمين STANDARD OFF-THE-SHELL MICROCONTROLLER ولأول مرة تم استخدام نظام كهذا خارج حدود المقاييس التجريبية LABORATORY BENCHMARKS حيث تم اجراء اختباراته بنجاح وعلى نطاق أوسع باستخدام مجموعة بيانات حقيقية REAL-WORLD DATASETS.终稿:تُبذل جهود كبيرة لإدخال تقنيات التصنيف والتعرّف الأكثر تقدماً إلى أجهزة الحواف ذوات القيود الموارديّة الشديدة (مثل الذاكرة والسعة وعدم وجود دعم لوحدات معالجة الرسوميات GPU). هنا,在这一背景下,نحن يقدمون أول شبكة عميقة للتعرّف الصوتي التي هي صغيرة ومرونة وتقبِل ضاغطة وهي تحظى بأداء يوازي أفضل ما هو موجود حاليا لمجال تصنيف صوت خام RAW AUDIO CLASSIFICATION.بدلا عن صنع حل واحد فقط باليد WE HANDCRAFTED A ONE-OFF SOLUTION ، فقد قدمنا خط إنتاج عام AUTOMATIC PIPELINE يقوم بتحويل شبكات التعلّم العميق الواسعة TYPICALLY LARGE DEEP CONVOLUTIONAL NETWORKS بشكل آلي VIA COMPRESSION AND QUANTIZATION الى شبكات تعمل بكفاءة عالية تحت ظروف تشغييل شحيحة RESOURCES IMPROVERISHED EDGE DEVICES.بعد تقديمنا لنظام ACDNet والذي حقق دقته أعلى مما كان يعتبر رائدا سابقا ON THE BENCHMARK DATASETS such as the following:• مجموعة بيانات ESC-10 بمعدل الدقيقة (%)%(%%%• مجموعة بيانات ESC-\xAFE(\xAAE:%• مجموعةبيانat UrbanSound\xAFKE(\xAAE:%• مجموعةبيانat AudioSet(\xAAE:%وصفنا الخطوط العامة لأنابيب العمل الخاصة بالضغطة وكيف يمكنها تحقيق تخفيض يصل الى (%)%%)% بالنسبة للحجم وخفة (%)%%)% بالنسبة للأعمال العائمة FLOPS بينما لا زالت تحتفظ بشبه كامل لنسب الدقيقة (%)%%);(%);(%);(%).وصفنا أيضا كيفية التنفيذ الناجح لهذا النظام باستخدام المتحكم الجاهز للمستخدمين STANDARD OFF-THE-SHELL MICROCONTROLLER ولأول مرة تم استخدام نظام كهذا خارج حدود المقاييس التجريبية LABORATORY BENCHMARKS حيث تم اجراء اختباراته بنجاح وعلى نطاق أوسع باستخدام مجموعة بيانات حقيقية REAL-WORLD DATASETS.终稿优化:تُبذل جهود كبيرة لإدخال تقنيات التصنيف والتعرّف الأكثر تقدماً إلى أجهزة الحواف ذوات القيود الموارديّة الشديدة (مثل الذاكرة والسعة وعدم وجود دعم لوحدات معالجة الرسوميات GPU). هنا,在这一背景下,نحن يقدمون أول شبكة عميقة للتعرّف الصوتي التي هي صغيرة ومرونة وتقبِل ضاغطة وهي تحظى بأداء يوازي أفضل ما هو موجود حاليا لمجال تصنيف صوت خام RAW AUDIO CLASSIFICATION.بدلا عن صنع حل واحد فقط باليد WE HANDCRAFTED A ONE-OFF SOLUTION , فقد قدمنا خط إنتاج عام AUTOMATIC PIPELINE يقوم بتحويل شبكات التعلّم العميق الواسعة TYPICALLY LARGE DEEP CONVOLUTIONAL NETWORKS بشكل آلي VIA COMPRESSION AND QUANTIZATION الى شبكات تعمل بكفاءة عالية تحت ظروف تشغييل شحيحة RESOURCES IMPROVERISHED EDGE DEVICES.بعد تقديمنا لنظام ACDNet والذي حقق دقته أعلى مما كان يعتبر رائدا سابقا ON THE BENCHMARK DATASETS such as the following:* مجموعة البيانات ESC-\xAFE(\xAAE:%* مجموعة البيانات ESCE-\xAFE(\xAAE:%* مجموعة البيانات UrbanSound\xAFKE(\xAAE:%* مجموعة البيانات AudioSet(\xAAE:%وصفنا الخطوط العامة لأنابيب العمل الخاصة بالضغطة وكيف يمكنها تحقيق تخفيض يصل الى (%)%%)% بالنسبة للحجم وخفة (%)%%)% بالنسبة للأعمال العائمة FLOPS بينما لا زالت تحتفظ بشبه كامل لنسب الدقيقة (%)%%);(%);(%);(%).وصفنا أيضا كيفية التنفيذ الناجح لهذا النظام باستخدام المتحكم الجاهز للمستخدمين STANDARD OFF-THE-SHELL MICROCONTROLLER ولأول مرة تم استخدام نظام كهذا خارج حدود المقاييس التجريبية LABORATORY BENCHMARKS حيث تم اجراء اختباراته بنجاح وعلى نطاق أوسع باستخدام مجموعة بيانات حقيقية REAL-WORLD DATASETS.终稿再优化:تُبذل جهود كبيرة لإدخال تقниقات التصنيع والتعرُفات الأكثر تقدما نحو أجهزة حوافة لديها قيادات شديدة فيما يتعلق بالمورد مثل الذكرة والاستجابهة ولا يوجد فيها أي نوع من أنوية المعجبلة البيانية GPU).وفي هذا الإطار,نحن يقدمون لأول مرحلة شبكة أعماق جديدة لتقرير الآلات Acoustic Recognition Network هي صغيرة وبسيطة ومناسبهة للضغط Compression-Friendly لكنه تستطيع الوصول لأداء رائع يعادل المستوى الحالي الأمثل State-of-the-Art Performance لمجال تصنيع ملفآت السماع Raw Audio Classification.بدله عن القيام بإنشاء الحلول الفردانية Manually Crafted Solutions,فقد قدمنَا الأنبايب العام General Pipelineالمتحول بصورة آلبة Automatic Conversionعبر عملية ضبط وزنه Compression and Quantizationإلى الأنبايب المناسب لأجهزهة حوافة لديها قيادات شديدبة Resource-Constrained Edge Devices.بعد التعريف بأنبايب ACDEnt,والذي بلغ معدل دقته Accuracy أعلى مما كان يعتبر أمثل State-of-the-Artعلى كلآء:* Dataset ES-C_ten : Accuracy = %\xAFE* Dataset ES-C_fifty : Accuracy = %\xBDE* Dataset URBAN_SOUND_@k : Accuracy = %\xCBE* Dataset AUDIO_EVENT : Accuracy = %\xBDEسوف نقراش بعض الخطا الطويل بسبب الانبايب الخاص باستخراج الوزنه Weight Pruning Pipeline,وكيف أنه سمح لنا بتقليل وزنه Body Sizeبنسبة %\xBDEوقلل عدد العماليآت الطافية Floating Point Operations(FLOPs)بنسبة %\xBDEمع المحافظبة حتى الآن Close to State-of-the-Art Accuracyعلى معدل دقته Accuracy : * Dataset ES-C_ten : Accuracy = %\xBCE * Dataset ES-C_fifty : Accuracy = %\xABE * Dataset URBAN_SOUND_@k : Accuracy = %\xABE * Dataset AUDIO_EVENT : Accuracy = %\xABEسنقوم أيضا بتوضيح كيف يمكن القيام بتثبيث واستخدام ANBAIP ACDEntعلى محترثرة دقيقة Microcontroller Standard Off-The-Shelf Microcontroller,وفي غيه البيئة التجرببية Beyond Laboratory Benchmarks,سنقوم بتقرير الاختبارآت الناجحة Successful Testsعلى مجوعآت البينآث الواقعبة Real-world Datasets.经过多次调整和优化后