تقوم Xiaomi و MiniMax بإطلاق هجماتهما في نفس الوقت، وبدأت حرب تسعير Agent رسميًا

robot
إنشاء الملخص قيد التقدم

عنوان النص: شاومي وMiniMax يطلقان العنان، معركة تحديد الأسعار لوكلاء الذكاء الاصطناعي تبدأ رسميًا

المؤلف:律动BlockBeats

المصدر:

إعادة النشر: 火星财经

في 18 و19 مارس، أطلقت شركتان صينيتان نماذج كبيرة موجهة للوكيل بشكل متتالي. أطلقت شركة MiniMax الناشئة في مجال الذكاء الاصطناعي المحلية نموذج M2.7، وفريق النماذج الكبيرة التابع لشركة شاومي MiMo أطلق V2-Pro. دخل كلا النموذجين في التصنيف العالمي الأول على مقياس أداء الوكيل، لكن أسعار واجهات برمجة التطبيقات (API) الخاصة بهما كانت 1/21 و1/8 من سعر Claude Opus 4.6 على التوالي.

على الرغم من أن الشركتين أطلقتا منتجاتهما في نفس الأسبوع، إلا أن استراتيجياتهما مختلفة تمامًا. تمثلان مسارين تقنيين مختلفين تمامًا، وتراهنان على مستقبلين مختلفين لعصر الوكيل.

نفس الامتحان، رسوم دراسية بقيمة 1/17

لنبدأ بالمقارنة المباشرة.

وفقًا لبيانات OpenRouter وصفحات التسعير الرسمية للشركات، وبحسب سعر واجهة برمجة التطبيقات (لكل مليون رمز)، فإن سعر MiniMax M2.7 هو 1.2 دولار، وV2-Pro من MiMo هو 3 دولارات. للمقارنة، فإن سعر إخراج Claude Opus 4.6 هو 25 دولارًا، وGPT-5.2 هو 14 دولارًا، وClaude Sonnet 4.6 هو 15 دولارًا.

الفرق في السعر كبير، لكن الفارق في القدرات ليس كذلك. على مقياس SWE-bench Verified (وهو المقياس الأكثر شيوعًا لقياس قدرات البرمجة والكود حاليًا)، حصل Mimo-V2-Pro على 78%، وSonnet 4.6 على 79.6%، بفارق أقل من نقطتين مئويتين. أما M2.7 فحقق 56.22% على مقياس SWE-Pro، وهو نفس أداء GPT-5.3-Codex. وعلى مقياس VIBE-Pro (القدرة على تسليم المشاريع من البداية للنهاية)، حصل M2.7 على 55.6%، وهو قريب من مستوى Opus 4.6.

التركيز في هذه الصورة ليس على من هو أعلى أو أدنى — لأن أنظمة التقييم الخاصة بكل شركة ليست متطابقة تمامًا، لذا المقارنة المباشرة يجب أن تتم بحذر. الأهم هو الفارق بين “السعر-الأداء”: النماذج المحلية للوكيل دخلت بالفعل في نفس نطاق القدرات، لكنها تتواجد في فئات سعرية مختلفة تمامًا.

تريليون معلمة مقابل التطور الذاتي

السعر هو مجرد مظهر خارجي. الشركتان قدمتا استراتيجيتين مختلفتين تمامًا.

تتبع MiMo-V2-Pro مسار “العمل الجاد لتحقيق المعجزات”. وفقًا لإعلان رسمي من شاومي، فإن V2-Pro يمتلك أكثر من تريليون معلمة إجمالية، مع تفعيل 42 مليار معلمة، ويدعم سياقًا طويلًا يتجاوز مليون رمز. الابتكار الرئيسي هو آلية الانتباه المختلط Hybrid Attention، التي تدمج بين انتباه النافذة المتحركة (SWA) والانتباه العالمي (GA) بنسبة 7:1 — وكانت النسبة في الإصدار السابق V2-Flash هي 5:1. هذا الهيكل يجعل النموذج أكثر استقرارًا عند التعامل مع مستندات طويلة، وبيئات متعددة الأدوات في سيناريو الوكيل. في تقييم PinchBench (تقييم قدرات استدعاء أدوات الوكيل)، حصل V2-Pro على 84%.

أما M2.7 فاختار مسارًا مختلفًا تمامًا. وفقًا لمدونة تقنية رسمية نشرتها MiniMax في 18 مارس، لم يتم الكشف عن عدد معلمات M2.7، لكنها عرضت آلية “التطور الذاتي” التي تعتمد على تشغيل النموذج لأكثر من 100 دورة تحسين ذاتية، تشمل تحليل مسارات الفشل، وتخطيط التعديلات، وتعديل بنية الكود الخاصة به، وإجراء التقييمات، والتكرار مرة أخرى، مما أدى في النهاية إلى تحسين الأداء بنسبة 30% على مجموعة التقييم الداخلية. في اختبار MLE Bench Lite (تقييم صعوبة مسابقات التعلم الآلي)، فاز M2.7 بميداليات ذهبية 9، وفضية 5، وبرونزية 1، بمعدل ميداليات بلغ 66.6%.

من خمسة أبعاد، تتجه استراتيجيتان مختلفتان تمامًا: يتفوق Mimo-V2-Pro بشكل واضح في طول السياق وميزات هندسة الكود، بينما يبرز M2.7 في قدرات الأتمتة المكتبية والتطور الذاتي. وفقًا لمدونة تقنية من MiniMax، حصل M2.7 على تقييم ELO 1495 في اختبار معالجة المستندات المكتبية GDPval-AA، وهو أعلى نموذج مفتوح المصدر، وحافظ على معدل التوافق مع المهارات بنسبة 97% في اختبار MM-Claw الذي يغطي أكثر من 40 مهارة معقدة.

خمسة أشهر، أربعة إصدارات

الشركتان ليستا فقط مختلفتين من حيث الاستراتيجية التقنية، بل أيضًا في وتيرة التحديثات.

وفقًا للسجلات المنشورة، أطلقت MiniMax نموذج M2 في أكتوبر 2025، ثم أطلقت M2.7 في مارس 2026، خلال خمسة أشهر، مع أربعة إصدارات، بمعدل إصدار رئيسي كل 49 يومًا تقريبًا. وكان الفاصل بين M2.5 وM2.7 حوالي 30 يومًا فقط.

أما شاومي، فكانت وتيرتها مختلفة: أطلقت في أبريل 2025 نموذج MiMo-7B (نموذج استدلال مفتوح المصدر ب7 مليارات معلمة)، وفي ديسمبر من نفس العام أطلقت V2-Flash (بإجمالي 309 مليار معلمة)، وفي مارس 2026 أطلقت V2-Pro (بإجمالي تريليون معلمة). كل جيل يضم حجم معلمات أكبر، لكن الفواصل الزمنية بين الإصدارات أطول.

اختارت MiniMax أسلوب التحديث السريع والخطوات الصغيرة، حيث أن آلية التطوير الذاتي في M2.7 مصممة خصيصًا لـ “التطور المستمر”. بينما اختارت شاومي استراتيجية القوة الضاربة، حيث كل إصدار يمثل قفزة كبيرة في حجم المعلمات والبنية.

مجهول خلال 8 أيام، يتصدر OpenRouter

بالإضافة إلى الاستراتيجية التقنية، كسر أسلوب إصدار شاومي القواعد التقليدية في الصناعة.

وفقًا لوكالة Reuters، في 11 مارس، ظهر نموذج مجهول يُدعى Hunter Alpha على منصة OpenRouter، وهي أكبر منصة تجميع لواجهات برمجة التطبيقات. لم يكن هناك دعم من علامة تجارية، ولا مؤتمر إطلاق، ولا مدونة تقنية. كانت تسعيراته منخفضة جدًا، وأداؤه مفاجئ جدًا.

بدأ المجتمع يتكهن بأصله. وفقًا لـ Republic World وعدة وسائل إعلام تكنولوجية، فإن الأكثر ترجيحًا هو أنه من DeepSeek V4، لأن رئيس فريق MiMo، رو فولي، كان سابقًا يعمل في DeepSeek. زادت الطلبات بسرعة، وبلغ إجمالي الطلبات خلال الفترة المجهولة أكثر من تريليون رمز، وتصدر قائمة OpenRouter الأسبوعية.

في صباح 19 مارس، كشفت شاومي عن أن النموذج المجهول هو في الواقع MiMo-V2-Pro. وفقًا لنفس تقرير Reuters، بعد الكشف، ارتفعت أسهم شاومي في سوق هونغ كونغ بنسبة تصل إلى 5.8%.

هذه هي المرة الأولى التي تثبت فيها النماذج الكبيرة المحلية نفسها على منصة عالمية من خلال اختبار أعمى بحت، بدون الاعتماد على العلامة التجارية أو الدعاية، خلال 8 أيام فقط، ليصوت المطورون بأقدامهم.

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • Gate Fun الساخن

    عرض المزيد
  • القيمة السوقية:$2.35Kعدد الحائزين:2
    0.00%
  • القيمة السوقية:$2.33Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.32Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.34Kعدد الحائزين:0
    0.00%
  • القيمة السوقية:$0.1عدد الحائزين:1
    0.00%
  • تثبيت