Xiaomi تتصدر العالم في مجال الذكاء الاصطناعي الصوتي

حققت شركة Xiaomi طفرة في مجال الذكاء الاصطناعي، وأصبح فريقها Big Model في طليعة تكنولوجيا الاستدلال الصوتي. وفي إنجاز رائع يُظهر براعة الشركة المتزايدة في مجال أبحاث الذكاء الاصطناعي المتطورة، تفوق أحدث نماذج شاومي على عمالقة الصناعة مثل OpenAI وGoogle في معيار رئيسي لفهم الصوت.

فقد أعلن الفريق عبر حساب Xiaomi Technology الرسمي أنهم تصدروا قائمة تقييم MMAU (MMAU) ذات الشهرة العالمية (فهم الصوت متعدد المهام والاستدلال). وقد حقق نموذجهم دقة قياسية بلغت 64.5% – متفوقاً بشكل كبير على نموذج GPT-4o من OpenAI (57.3%) ونموذج Gemini 2.0 Flash من Google (55.6%).

نهج التعلم المعزز الثوري

ما هو جدير بالملاحظة بشكل خاص في هذا الإنجاز هو الوتيرة التي تحقق بها. فعلى غرار DeepSeek-R1، قام الباحثون في Xiaomi بتوسيع نطاق خوارزميات التعلّم المعزز لتشمل مهام فهم الصوت متعدد الوسائط، وقد تحقق ذلك في غضون أسبوع واحد.

قام العلماء بتطبيق طريقة تحسين السياسة النسبية للمجموعة (GRPO) التي تسمح لنماذج الذكاء الاصطناعي بالتعلم بشكل مستقل من خلال آلية “التجربة والخطأ والمكافأة”. تسمح هذه الآلية بإنشاء قدرات تفكير مشابهة للتفكير البشري والتحقق متعدد الخطوات.

ويضيف الدكتور تشانغ وي، الباحث الرئيسي في المشروع: “التعلم المعزز جيد بشكل خاص في التعامل مع الفجوة الكبيرة بين توليد النتائج والتحقق منها. والتفكير الصوتي هو بالضبط مثل هذه المهمة، حيث يخلق التفكير النشط نتائج أكثر كفاءة من حفظ الأنماط.”

أكثر من مجرد التعرف على الصوت

تتطلب تطبيقات الذكاء الاصطناعي اليوم أكثر من مجرد التعرف على الصوت. يمكّن اختراق Xiaomi الذكاء الاصطناعي من:

  • تحديد الأعطال المحتملة في السيارة من خلال تحليل تسجيلات قمرة القيادة
  • استنتاج مزاج الملحن من خلال الاستماع إلى العروض الموسيقية
  • توقع مخاطر الاصطدام في الأماكن المزدحمة مثل محطات مترو الأنفاق

تستخدم مجموعة اختبار MMAU 10,000 مقطع صوتي من الكلام إلى الصوت المحيط إلى الموسيقى مع أزواج أسئلة وأجوبة مشروحة من قبل الإنسان لاختبار النموذج على 27 مهارة.

تعطيل مناهج الذكاء الاصطناعي التقليدية

أسفرت تجارب شاومي عن بعض النتائج المفاجئة التي تتحدى حكمة تطوير الذكاء الاصطناعي التقليدية:

  • تفوّق التعلّم المعزز بشكل ملحوظ على التعلّم تحت الإشراف على مجموعة بيانات تضم 38,000 عنصر فقط
  • أظهر نموذجهم المكون من 7 مليارات معلمة قدرة فائقة على التفكير المنطقي على الرغم من كونه أصغر بكثير من النماذج المنافسة الأخرى التي تزيد عن 100 مليار معلمة
  • في الواقع، أدى إجبار النموذج على توليد عمليات استدلال صريحة إلى خفض الأداء بنسبة 3.4%

على الرغم من أن دقة 64.5% عالية، إلا أنها لا تزال أقل من المعيار القياسي للخبراء البشريين البالغ 82.23%، مما يشير إلى أنه لا يزال هناك مجال كبير للتحسين.

التزام مفتوح المصدر

تماشياً مع فلسفة شاومي المتمثلة في الابتكار للجميع، قامت الشركة بفتح كود التدريب ومعلمات النموذج. وبهذا العمل الإيثاري، تسمح الشركة للمطورين والباحثين في جميع أنحاء العالم بالتوسع في ابتكاراتها.

“وقال مؤسس Xiaomi ومديرها التنفيذي لي جون: “من خلال فتح جهودنا لمجتمع الذكاء الاصطناعي العالمي، نهدف إلى تسريع العملية نحو فهم صوتي ذكي حقيقي. “هذه خطوة أخرى في مهمتنا لجعل التكنولوجيا المبتكرة في متناول الجميع.”

للمهتمين بتجربة هذه التكنولوجيا:

يأتي هذا الاختراق في الوقت الذي تقدم فيه شاومي ميزات الذكاء الاصطناعي عبر مجموعة منتجاتها، من الهواتف الذكية إلى منتجات المنزل الذكي لإنترنت الأشياء، مما يجعل الشركة منافسًا جادًا في مجال أبحاث الذكاء الاصطناعي العالمية.

المصدر: آي تي هوم

Play Store icon
HyperOS Downloader Easily check if your phone is eligible for HyperOS 2.0 update!
Download icon

اترك تعليقاً

الاستطلاع
Which name did you like better, MIUI or HyperOS?