OpenAI في اليوم (18) أطلق رسميًا نموذجين خفيفين جديدين GPT-5.4 Mini و GPT-5.4 Nano، حيث يتفوق الأول بسرعة مضاعفة بمقدار مرتين عن الجيل السابق، وسعره فقط 0.75 دولار لكل مليون رمز إدخال، بينما يأتي الثاني بسرعة منخفضة جدًا وسعر تنافسي قدره 0.20 دولار، مستهدفًا سوق المعالجة عالية التدفق.
(ملخص سابق: OpenAI تطلق GPT-5.2! بهدف استبدال المهنيين وتقليل الهلوسة، تنظيم رسوم API)
(معلومات إضافية: استعراض كامل لإطلاق GPT-5 من OpenAI: الوصول المجاني، الميزات البارزة، gpt-5، gpt-5-mini و gpt-5-nano، أسعار API)
فهرس المقال
تبديل
أطلقت OpenAI اليوم (18) في منتصف الليل النموذجين الصغيرين GPT-5.4 Mini و GPT-5.4 Nano بشكل متزامن. هذان النموذجان ليسا من الطراز الرائد، وإنما مصممان بوضوح ليكونا طبقة تنفيذ ضمن نظام الذكاء الاصطناعي المختلط: حيث يتم تنسيق الجدولة بواسطة نموذج رائد أقوى، وتُنفذ العديد من النماذج الصغيرة بشكل متوازي لإنجاز الأعمال الحسابية اليومية.
تصف OpenAI هذا الهيكل بأنه “تحقيق تحسينات ملحوظة في السرعة والتكلفة مقابل جزء من الدقة”، ويعكس هذا الاختيار التوازن الحالي في صناعة الذكاء الاصطناعي بين نموذج واحد كبير و"تعاون متعدد الوكلاء".
يعد GPT-5.4 Mini المنتج الرئيسي لهذا الإصدار، حيث يركز على توازن بين السرعة والقدرة على أداء مهام متعددة. مقارنة بالجيل السابق، زادت سرعته في الاستنتاج بمقدار مرتين، وحقق ترقية شاملة في قدرات توليد الكود، الفهم متعدد الوسائط، واستدعاء الأدوات.
في اختبارات الأداء، حقق GPT-5.4 Mini نسبة 54.4% في SWE-Bench Pro (تصحيح تلقائي لمشاكل GitHub) و72.1% في OSWorld-Verified (أتمتة العمليات على سطح المكتب)، وهما من أعلى المستويات بين النماذج المماثلة.
من ناحية الوظائف، يدعم الإدخال المختلط من نصوص وصور، استدعاء الأدوات، البحث عبر الإنترنت والملفات، والتفاعل مع واجهات المستخدم على الحاسوب، مما يغطي تقريبًا جميع احتياجات التطبيقات الحديثة للذكاء الاصطناعي. تشمل الاستخدامات الرئيسية التي أدرجتها OpenAI: المساعد البرمجي، تكامل بيئة التطوير، مراجعة الكود، تفسير الصور، الوكيل الفرعي لاستخدام الحاسوب، والأنظمة التفاعلية التي تتطلب استجابة فورية.
أما السعر، فتكلفة الإدخال لكل مليون رمز تبلغ 0.75 دولار، والإخراج 4.50 دولارات، مما يعكس استراتيجية OpenAI الأخيرة لخفض التكاليف بشكل كبير.
أما عن التوفر، فـ GPT-5.4 Mini متاح الآن على ChatGPT (الطبقة المجانية وطبقة الاشتراك Go)، وCodex، وواجهة برمجة التطبيقات API من OpenAI، ويمكن أيضًا نشره عبر Azure AI Foundry.
يحدد GPT-5.4 Nano بشكل أكثر وضوحًا: تصفه OpenAI بأنه “أصغر وأكثر نماذج الكلفة فعالية حاليًا”، مصمم خصيصًا للسيناريوهات التي تتطلب استجابة منخفضة جدًا وتأخير ضئيل، مع معالجة موازية واسعة النطاق.
في اختبارات الأداء، سجل Nano نسبة 52.4% في SWE-Bench Pro و39.0% في OSWorld، على الرغم من أنه أدنى قليلاً من Mini، إلا أن سعره المنخفض يجعل قيمة الأداء عالية جدًا.
من ناحية الوظائف، يدعم Nano الأوامر التتابعية، استدعاء الوظائف، الكود الأساسي، فهم الصور، التصنيف، واستخراج البيانات، ويمكنه التعامل مع معظم المهام الهيكلية، لكنه لا يدعم العمليات المعقدة على سطح المكتب أو الاستنتاج العميق.
أما السعر، فتكلفة الإدخال لكل مليون رمز تبلغ 0.20 دولار، والإخراج 1.25 دولار، وهو تقريبًا ربع سعر Mini، مما يجعله مناسبًا للشركات التي تتطلب الكثير من الاستدعاءات الآلية. تشمل الاستخدامات المعلنة: التصنيف واستخراج البيانات، دعم الوكيل الفرعي للكود، الأتمتة عالية التدفق، توجيه الطلبات، معالجة النماذج، وسير عمل خدمة العملاء.
من الجدير بالذكر أن GPT-5.4 Nano متاح حاليًا فقط عبر API، ولن يظهر في واجهة مستخدم ChatGPT، ويُحدد بشكل واضح للمطورين ومنتجات الشركات.
تصف OpenAI هذا النهج بأنه “مُصمم لعصر الوكلاء الفرعي”، وهو يعكس منطقًا منتجًا محددًا.
في أنظمة الذكاء الاصطناعي متعددة الوكلاء، يتولى النموذج الرائد (مثل GPT-5 أو نماذج الاستدلال من سلسلة o) التخطيط العالي المستوى واتخاذ القرارات المعقدة، بينما تُعالج المهام الصغيرة والمتكررة: استرجاع البيانات، تحويل المعلومات، ملء النماذج، توليد أجزاء الكود، بواسطة نماذج أصغر وأسرع وأرخص بشكل متوازي. ويعد GPT-5.4 Mini و Nano مثالين على هذا الدور التنفيذي.
كما يفسر هذا النهج سبب تأكيد كلا النموذجين على قدرات استدعاء الأدوات والتفاعل مع أنظمة الحاسوب: فمع تزايد مستوى الأتمتة في تطبيقات الذكاء الاصطناعي، فإن النماذج الصغيرة التي يمكنها تنفيذ الأوامر والتفاعل مع الأنظمة الخارجية تظل ذات قيمة تجارية لا تقل عن النماذج الرائدة ذات المعاملات الأكبر.