ترقية كبيرة لـ Google Gemini 3 Deep Think: قدرة الاستنتاج تتفوق على Opus 4.6 و GPT-5.2، بهدف أن يكون "أكثر ذكاء اصطناعي يبحث عن العلم"

BTC‎-0.11%

أصدرت جوجل تحديثا كبيرا لبرنامج Gemini 3 Deep Think، متجاوزة بشكل كبير كلود أوبوس 4.6 (68.8٪) وGPT-5.2 (52.9٪) في اختبار ARC-AGI-2 بنسبة 84.6٪، مع تحقيق تصنيف “السيد الكبير الأسطوري” في Codeforces.
(الملخص: تم تقديم نموذج التعلم في ChatGPT: هل هو غروب الدروس الخصوصية، أم فجر العصر الذهبي للتعليم؟ )
(ملحق خلفي: أطلقت جوجل رسميا “جيميني 3”!) ما هي أبرز إنجازات الوصول إلى قمة أذكى نموذج ذكاء اصطناعي في العالم؟ )

جدول محتويات هذا المقال

  • ليس فقط الامتحانات، بل أيضا اكتشاف الأخطاء البشرية
  • التغيرات القشرية في حصة السوق
  • تأثير تموجي على صناعة العملات الرقمية
  • العلم بدأ للتو

أصدرت جوجل اليوم (الثالث عشر) ترقية كبيرة لجيميني 3 ديب ثينك. في اختبار ARC-AGI-2 (وهو اختبار استدلالي مخصص لمنع الذكاء الاصطناعي من حفظ بنوك الأسئلة، ولا يختبر مدى معرفتك، وما إذا كان بإمكانك تلخيص القواعد بنفسك من عدة أمثلة)، حصل اختبار Gemini 3 Deep Think على نسبة 84.6٪.

للمعلومية، حصل Claude Opus 4.6 (وضع التفكير الأكسي) على 68.8٪، وGPT-5.2 (وضع التفكير xhigh) على 52.9٪، ومتوسط الدرجة البشرية حوالي 60٪.

وما هو أكثر إثارة للدهشة هو أنه في اختبار ARC-AGI-1 الأصلي، حصلت Deep Think على 96٪، مما دفع هذا المعيار، الذي كان يعتبر سابقا “أحد أصعب الاختبارات في الذكاء الاصطناعي”، إلى أقصى حد.

Deep Think متاح حاليا لمشتركي Google AI Ultra، وواجهة برمجة التطبيقات مفتوحة للمؤسسات في مرحلة الوصول المبكر.

ليس فقط الامتحانات، بل أيضا أخطاء بشرية

بالإضافة إلى النتائج المستمرة، ذكرت جوجل تفصيلا في الإعلان: نجح Deep Think في تحديد ثغرة منطقية لم يكتشفها أي من المراجعين سابقا عند مراجعة ورقة رياضية تمت مراجعتها من قبل البشر. تم تأكيد هذه الورقة من قبل علماء الرياضيات في جامعة روتجرز.

تكمن أهمية هذه الحالة ليس في أداء النموذج في الاختبارات الموحدة، بل في قدرته على إثبات النتائج في سيناريوهات علمية حقيقية ومفتوحة النهاية. المراجعة من الأقران هي آلية التحكم الأساسية في الجودة في الأوساط الأكاديمية، وإذا تمكن الذكاء الاصطناعي من تقديم مساعدة قيمة باستمرار في هذه العملية، فإن تأثيره التسريع على البحث العلمي سيكون أبعد بكثير مما يمكن قياسه بأي معيار.

كما حقق ديب ثينك مستوى الميدالية الذهبية في قسم الاختبار التحريري من أولمبياد الفيزياء والكيمياء الدولي لعام 2025، بدرجة إيلو 3,455 في كودفورس، وهو ما يعادل مستوى “المعلم الكبير الأسطوري”، وهو عدد قليل فقط من المبرمجين البشر في العالم يمكنهم الوصول إلى هذا المستوى.

في “الامتحان الأخير للبشرية”، وهو معيار صممه خبراء في مجالات مختلفة وجعل الذكاء الاصطناعي متعمدا صعبا على الإجابة، حصل Deep Think على 48.4٪ (دون استخدام الأدوات)، محققا رقما قياسيا جديدا أيضا.

التغيرات القشرية في حصة السوق

السباق التقني في الثلاثي الكبار للذكاء الاصطناعي يغير مشهد السوق. انخفضت حصة ChatGPT السوقية من 87٪ في ذروتها إلى حوالي 68٪، بينما ارتفعت Gemini من أقل من 5٪ إلى أكثر من 18٪، وقامت شركة Anthropic بتآكل سوق المؤسسات بشكل مستمر.

الميزة الفريدة لجوجل في هذا السباق هي قدرتها على التوزيع. جيميني مدمج في أندرويد، ومتصفح كروم، وجوجل وورك بيس، ومحركات البحث، مما يعني أنه حتى لو كان متساويا مع منافسيه من حيث قدرات النماذج، يمكن لجوجل كسب المستخدمين من خلال مزايا القنوات.

لكن ميزة التوزيع هي سيف ذو حدين. إذا لم تكن تجربة Gemini جيدة بما فيه الكفاية، فقد تفقد ثقة المستخدمين أسرع من أي منافس لأن المستخدمين “يتفاعلون بشكل سلبي” بدلا من “اختيار نشط”. مستخدمو OpenAI يدفعون بنشاط ولديهم تحمل وثبات أعلى بطبيعتهم.

تأثير متتابع على صناعة العملات الرقمية

كل ترقية في سباق الذكاء الاصطناعي تدفع الطلب على البنية التحتية للحوسبة. تكلفة عناقيد وحدات معالجة الرسوميات المطلوبة لتدريب نموذج متقدم ارتفعت بشكل كبير من مئات الملايين من الدولارات في عام 2024 إلى مليارات الدولارات في عام 2026. وهذا يؤثر أيضا بشكل مباشر على أمرين.

**أولا، مسار التحول لمعدني البيتكوين.**عندما يتم ضغط أرباح التعدين (تقدر شركة JPMorgan Chase & Co. أن تكاليف إنتاج البيتكوين انخفضت إلى 7.7 مليون دولار هذا الأسبوع، بينما يبلغ سعر العملة حوالي 6.6 مليون)، فإن عمال المناجم الذين يمتلكون بنية تحتية حوسبة واسعة النطاق يسرعون تحولهم نحو خدمات الحوسبة بالذكاء الاصطناعي.

شركات التعدين عالية التكلفة لا “تخرج” بل “تغير مسارها المهني”، من تعدين البيتكوين إلى دخل العقود الذي يوفر قوة حوسبة بالذكاء الاصطناعي.

**ثانيا، سرد رموز الذكاء الاصطناعي.**كلما أصدرت جوجل أو OpenAI أو Anthropic ترقية كبيرة، عادة ما تتعرض الرموز المرتبطة بالذكاء الاصطناعي ضمن السلسلة مثل بروتوكولات الحوسبة اللامركزية لضجة قصيرة الأمد.

لكن المشكلة الأساسية لهذه الرموز لم تتغير: الحوسبة اللامركزية لا تزال بعيدة جدا عن الطلب على تدريب الذكاء الاصطناعي على مستوى المؤسسات من حيث التأخير وسرعة النقل. يمكن أن تسير السردية بسرعة، لكن البنية التحتية لا تستطيع مواكبة سرعة السرد.

فاصل التعادل العلمي بدأ للتو

الترقية إلى التفكير العميق تدفع جوجل إلى الصدارة في سباق الذكاء الاصطناعي، على الأقل في مجالي التفكير والعلم. لكن إذا نظرت عن كثب إلى صياغة إعلان جوجل، ستلاحظ تحولا طفيفا في التمركز: فبدلا من التركيز على “أذكى ذكاء اصطناعي عام الاستخدام”، يكرر المنشور “مصمم للعلم”.

مع ازدحام معايير الذكاء الاصطناعي العامة وصعوبة التمييز، فإن عبارة “ذكائي الاصطناعي يمكنه مساعدتك في إجراء أبحاث علمية” هي عرض قيمة أكثر إقناعا من “ذكائي الاصطناعي لديه أعلى درجة في التمرير.” إذا كان التفكير العميق قادرا حقا على المساعدة بشكل موثوق في مراجعة الأقران، وتسريع اكتشاف الأدوية، أو إيجاد حلول يغفلها البشر في محاكاة الفيزياء، فسيكون ذلك أكثر منطقية من أي قائمة مرجعية.

المشكلة أن المسافة بين “يمكن الحصول على درجات عالية في المعايير” إلى “يمكنها مساعدة البشر بشكل موثوق في السيناريوهات العلمية الحقيقية” قد تكون أبعد مما تقترحه جوجل، فبعد كل شيء، المعايير لها إجابات قياسية، أما العلم فلا يملكها.

شاهد النسخة الأصلية
إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة من مصادر خارجية ولا تمثل آراء أو مواقف Gate. المحتوى المعروض في هذه الصفحة هو لأغراض مرجعية فقط ولا يشكّل أي نصيحة مالية أو استثمارية أو قانونية. لا تضمن Gate دقة أو اكتمال المعلومات، ولا تتحمّل أي مسؤولية عن أي خسائر ناتجة عن استخدام هذه المعلومات. تنطوي الاستثمارات في الأصول الافتراضية على مخاطر عالية وتخضع لتقلبات سعرية كبيرة. قد تخسر كامل رأس المال المستثمر. يرجى فهم المخاطر ذات الصلة فهمًا كاملًا واتخاذ قرارات مدروسة بناءً على وضعك المالي وقدرتك على تحمّل المخاطر. للتفاصيل، يرجى الرجوع إلى إخلاء المسؤولية.

مقالات ذات صلة

Ethereum ETFs See Fourth Consecutive Day of Inflows

Ethereum ETFs are experiencing increasing institutional confidence, with four consecutive days of net inflows led by BlackRock. This trend highlights growing investor interest in regulated crypto investments, despite varied performances among ETF providers.

CryptoFrontNewsمنذ 5 س

马斯克:特斯拉Terafab芯片工厂将于7天后启动,年产能目标1000-2000亿颗

马斯克宣布特斯拉的Terafab工厂将于3月21日启动,该工厂将综合生产逻辑AI芯片、内存等,目标年产1000亿至2000亿颗芯片,旨在满足特斯拉日益增长的AI算力需求,减少对外部供应商的依赖。

GateNewsمنذ 8 س

新台幣穩定幣應用場景待釐清!兆豐金實測:大額跨境匯款「銀行仍佔優」

兆豐銀行進行穩定幣與傳統銀行跨境匯款的比較實測。結果顯示,穩定幣在小額匯款上速度快且成本較低,但當金額超過約7,000美元時,銀行的成本優勢明顯。穩定幣跨境匯款受到多國監管限制影響,實際應用場景仍需探討。董瑞斌強調傳統銀行在資金清算與合規管理上具有不可取代的基礎設施。

区块客منذ 9 س

貝萊德「以太幣質押 ETF」重磅登場!上市首日成交額破 1,550 萬美元

貝萊德推出的「iShares 質押型以太幣信託 ETF(ETHB)」首日交易額突破1,550萬美元,成為機構資金進駐以太坊的里程碑。此ETF持有以太幣並進行質押,提供投資者價格波動及質押獎勵。ETHB預計將70%至95%的以太幣投入質押,82%的收益按月分配給持有者。

区块客منذ 11 س

Strategy 本周或购入超 3 万枚 BTC,下一目标 80 万枚

Gate News 消息,3 月 14 日,据 MSTR 分析师透露,Michael Saylor 旗下的 Strategy(MicroStrategy)仅在本周或购入超过 3 万枚 BTC,公司下一个目标为持有 80 万枚 BTC。

GateNewsمنذ 11 س

USDC 市值逼近 800 亿美元历史高位,稳定币总市值一周增长 0.93%

当前全网稳定币总市值为3159亿美元,USDC市值接近800亿美元。迪拜房价下跌27%,地产指数跌31%。阿联酋资本外流助推USDC需求增长,部分房产卖家开始接受加密货币付款,并提供折扣。

GateNewsمنذ 11 س
تعليق
0/400
لا توجد تعليقات