أطلقت Google DeepMind مساعدًا مشاركًا في الرياضيات قائمًا على الذكاء الاصطناعي، وهو مساعد بحثي متعدد الوكلاء في مجال الرياضيات، حقق دقة 47.9% على معيار FrontierMath (المرتبة 4)، متجاوزًا الرقم القياسي السابق لـ GPT-5.5 Pro البالغ 39.6% في 9 مايو. حلّ النظام 23 من أصل 48 مسألة، بما في ذلك 3 مسائل فشلَت جميع النماذج السابقة في حلّها. بُني النظام على Gemini 3.1 Pro، وتعتمد البنية تصميمًا هرميًا يستخدم وكيلًا منسقًا للمشروع يوزّع المهام على وكلاء فرعيين يتولون استرجاع المراجع والبرمجة والاستدلال، مع عدة وكلاء مراجعين يَتحققون من صحة البراهين قبل تقديمها.
أجرت Epoch AI اختبارات عمياء، ما منع فريق DeepMind من رؤية المسائل، مع السماح لكل سؤال بإجراء حسابات لمدة 48 ساعة. وفي التطبيق الواقعي، استخدم عالم الرياضيات Marc Lackenby النظام لحل تخمين مفتوح من Kourovka Notebook، بما يُظهر قيمته البحثية العملية. يتاح النظام حاليًا لعدد محدود من علماء الرياضيات في مرحلة الاختبار التجريبي.