يحقق مساعدٌ رياضيٌ مشترك بالذكاء الاصطناعي من Google DeepMind نسبة 47.9% في المستوى 4 من FrontierMath، متفوقًا على GPT-5.5 Pro، ويحل ثلاث مسائل كانت دون حل سابقًا

أطلقت Google DeepMind مساعدًا مشاركًا في الرياضيات قائمًا على الذكاء الاصطناعي، وهو مساعد بحثي متعدد الوكلاء في مجال الرياضيات، حقق دقة 47.9% على معيار FrontierMath (المرتبة 4)، متجاوزًا الرقم القياسي السابق لـ GPT-5.5 Pro البالغ 39.6% في 9 مايو. حلّ النظام 23 من أصل 48 مسألة، بما في ذلك 3 مسائل فشلَت جميع النماذج السابقة في حلّها. بُني النظام على Gemini 3.1 Pro، وتعتمد البنية تصميمًا هرميًا يستخدم وكيلًا منسقًا للمشروع يوزّع المهام على وكلاء فرعيين يتولون استرجاع المراجع والبرمجة والاستدلال، مع عدة وكلاء مراجعين يَتحققون من صحة البراهين قبل تقديمها.

أجرت Epoch AI اختبارات عمياء، ما منع فريق DeepMind من رؤية المسائل، مع السماح لكل سؤال بإجراء حسابات لمدة 48 ساعة. وفي التطبيق الواقعي، استخدم عالم الرياضيات Marc Lackenby النظام لحل تخمين مفتوح من Kourovka Notebook، بما يُظهر قيمته البحثية العملية. يتاح النظام حاليًا لعدد محدود من علماء الرياضيات في مرحلة الاختبار التجريبي.

إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة مستمدة من مصادر خارجية وهي للمرجعية فقط. لا تمثل هذه المعلومات آراء أو وجهات نظر Gate ولا تشكل أي نصيحة مالية أو استثمارية أو قانونية. ينطوي تداول الأصول الافتراضية على مخاطر عالية. يرجى عدم الاعتماد حصرياً على المعلومات الواردة في هذه الصفحة عند اتخاذ القرارات. لمزيد من التفاصيل، يرجى الرجوع على إخلاء المسؤولية.
تعليق
0/400
لا توجد تعليقات