باحثو Meta يكشفون النقاب عن المدارس الخمس الكبرى في World Model: ما هو الذكاء الاصطناعي الذي يراهن عليه يان لي كون وفي في لي؟

ChainNewsAbmedia

بعد أن أكملت شركة Advanced Machine Intelligence (AMI)، التي أسسها يان ليكونن، الحائز على جائزة تيرنغ، والذي كان سابقًا كبير العلماء في Meta AI، جولة تمويل أولية ضخمة بقيمة 1.03 مليار دولار، أصبحت “النموذج العالمي” (World Model) مرة أخرى كلمة مفتاحية ساخنة في مجال الذكاء الاصطناعي. ومع ذلك، على الرغم من أن مجتمع الذكاء الاصطناعي يناقش بشكل متكرر مفهوم النماذج العالمية، إلا أن المفاهيم التي يشير إليها الباحثون تختلف بشكل كبير.

(تحليل معمق: هل توجد عيوب في LLM؟ لماذا يراهن ليان ليكونن على مسار النموذج العالمي في AMI)

أصدر عالم أبحاث Meta AI، زواوكاي تشاو، مؤخرًا منشورًا مطولًا على منصات التواصل الاجتماعي أشار فيه إلى أن ما يُعرف حاليًا في مجال الذكاء الاصطناعي باسم النموذج العالمي يمكن تصنيفه إلى خمسة مسارات تقنية مختلفة على الأقل. ويعتقد أن هذه الطرق ليست في منافسة مباشرة مع بعضها البعض، وإنما تعالج مشاكل مختلفة من نواحٍ متعددة.

JEPA: فهم الفيزياء عبر الضغط على البيانات

الذكاء المكاني: إعادة بناء العالم ثلاثي الأبعاد

المحاكاة المُتعلمة: تدريب الذكاء الاصطناعي في عالم محاكاة

نظام كوزموس من إنفيديا: توفير البنية التحتية

الاستنتاج النشط: تقديم نظرية ذكاء جديدة

ويتوقع أن تتلاشى الحدود بين هذه المسارات بسرعة.

المسار الأول: JEPA ليان ليكونن، فهم العالم في الفضاء المجرد

يعتقد زواو أن النوع الأول من النماذج العالمية هو “الهندسة التنبئية المشتركة” (Joint Embedding Predictive Architecture - JEPA)، ويعد يان ليكونن هو الشخصية الرئيسية وراءه.

الفكرة الأساسية لـ JEPA هي: لا ينبغي للذكاء الاصطناعي محاولة التنبؤ بكل بكسل على حدة، وإنما يجب أن يتوقع المستقبل في فضاء تمثيلي مجرد.

في العالم الحقيقي، العديد من التفاصيل غير قابلة للتنبؤ بها، مثل تغيرات الضوء، المواقع الدقيقة للأوراق، أو أنسجة الأسطح. وإذا كان النموذج مطالبًا بتوليد جميع البكسلات، فسوف يُجبر على التعامل مع كم هائل من التفاصيل غير ذات معنى.

الطريقة التي يتبعها JEPA هي أولاً تحويل الصور أو الفيديوهات إلى تمثيلات مجردة باستخدام مشفر، ثم التنبؤ بالأجزاء المخفية داخل هذا الفضاء التمثيلي. وبهذا، يمكن للنموذج أن يتعلم أن “الكرة ستسقط من على الطاولة”، دون الحاجة إلى توليد كل إطار على حدة.

وقد أصبح نموذج V-JEPA 2 من Meta أحد أكثر النتائج التجريبية تمثيلًا حتى الآن. حيث يستخدم النموذج مليون ساعة من بيانات الفيديو للتدريب الذاتي، ثم يستخدم فقط 62 ساعة من بيانات الروبوتات لإنشاء نموذج عالمي يدعم التخطيط بدون أمثلة مسبقة. يقوم الروبوت بتوليد تسلسلات حركية محتملة، ويدخلها إلى النموذج، ويختار التسلسل الذي يتطابق بشكل أكبر مع الصورة الهدف. وتُستخدم هذه الطريقة بشكل فعال مع أشياء وبيئات لم يسبق للنموذج أن رأاها أثناء التدريب.

هذه الكفاءة العالية في استخدام البيانات هي أحد الأسباب الرئيسية التي دفعت AMI للاستثمار في بنية JEPA. فإذا كانت تمثيلاتك جيدة بما يكفي، فلن تحتاج إلى استكشاف كل مهمة من الصفر. تعتبر مختبرات AMI محاولة من ليان ليكونن لنقل هذه التقنية من مجال البحث إلى التطبيق العملي. وركزوا في البداية على مجالات الرعاية الصحية والروبوتات، لكن هذا استثمار طويل الأمد، حيث صرح المدير التنفيذي لهم علنًا أن المنتجات التجارية قد تستغرق سنوات قبل أن تظهر.

المسار الثاني: “الذكاء المكاني” ليانغ في في، من خلال شركة World Labs

مسار آخر مشهور يأتي من شركة World Labs التي أسستها ليانغ في في.

(من هي موجهة الذكاء الاصطناعي ليانغ في في؟ شركة Unicorn الناشئة World Labs تحصل على تمويل من NVIDIA و AMD)

على عكس JEPA الذي يركز على “التنبؤ بالمستقبل”، فإن السؤال المركزي الذي تطرحه ليانغ في في هو: “كيف يبدو العالم في الفضاء ثلاثي الأبعاد؟” ويُعرف المفهوم الذي اقترحته بـ “الذكاء المكاني” (Spatial Intelligence). ويؤمن هذا النهج أن الفهم الحقيقي يتطلب وجود بنية فضائية واضحة: أشكال هندسية، عمق، استمرارية، والقدرة على إعادة مشاهدة المشهد من زوايا جديدة — وليس مجرد التنبؤ بالزمن. وهذا يختلف عن مفهوم JEPA، حيث تتعلم النموذج الديناميكيات المجردة، وإنما تتعلم تمثيلًا منظمًا ثلاثي الأبعاد للبيئة يمكن التعامل معه مباشرة.

منتج شركة World Labs، Marble، يمكنه من إنشاء عوالم ثلاثية الأبعاد مستدامة من الصور، النصوص، أو الفيديوهات. وعلى عكس نماذج توليد الفيديو التقليدية، فإن Marble يُنتج مشاهد ثلاثية الأبعاد حقيقية، يمكن التنقل فيها بحرية، وتعديل الأجسام، وتصدير نماذج ثلاثية الأبعاد. هذا يجعله أقرب إلى محرك إبداع ثلاثي الأبعاد بدلاً من مجرد نموذج توليدي.

المسار الثالث: “المحاكاة المُتعلمة” من DeepMind

النوع الثالث من النماذج العالمية هو “المحاكاة المُتعلمة” (Learned Simulation).

الأبحاث الممثلة تشمل:

DeepMind Genie 3

سلسلة Dreamer

Runway GWM-1

هذه النماذج تحاول بناء عوالم محاكاة تفاعلية، يتعلم فيها الذكاء الاصطناعي.

المسار الرابع: بنية تحتية للذكاء الفيزيائي من إنفيديا

المسار الرابع لا يركز على بناء نماذج مباشرة، وإنما على إنشاء منصة بيئية كاملة. الشركة الرائدة في هذا المجال هي إنفيديا، التي أطلقت منصة Cosmos التي توفر بنية تحتية متكاملة تشمل:

معالجة بيانات الفيديو

رموز بصرية (visual tokenizer)

تدريب النماذج

خدمات النشر

وقد تم تدريب نماذج الأساس العالمية (World foundation models) على 20 مليون ساعة من الفيديوهات الواقعية، وبلغ حجم الرموز (tokens) حوالي 9000 تريليون.

(ظهور نظام Alpamayo من إنفيديا: يمنح السيارات ذاتية القيادة قدرات استنتاج، ويشرح أسباب قراراتها)

استراتيجية إنفيديا واضحة جدًا: لا يتعين عليهم بالضرورة بناء نماذج عالمية، وإنما تزويد الجميع بأدوات لبنائها.

المسار الخامس: الاستنتاج النشط (Active Inference) من علم الأعصاب

أما المسار الأخير فيأتي من نظرية علم الأعصاب، ويُمثلها العالم العصبي كارس فريستون، الذي اقترح مبدأ “الطاقة الحرة” (Free Energy Principle). على عكس التعلم المعزز التقليدي، يرى الاستنتاج النشط أن الذكاء الاصطناعي يشبه كائنًا حيًا يسعى لفهم العالم باستمرار. فهو يتخذ إجراءات بهدف تحسين توقعاته للبيئة، وتقليل حالات “الأشياء لا تسير كما هو متوقع”.

شركة VERSES AI أطلقت نظام AXIOM الذي يعتمد على نموذج كائنات، حيث كل جسم يُعتبر كيانًا مستقلًا، ويستخدم النظام استنتاج بايز لتحديث المعتقدات، دون الاعتماد على تدريب عبر تدرجات الشبكات العصبية العميقة. هذا الهيكل يوفر قابلية تفسير عالية، وقابلية تركيب، وكفاءة عالية في البيانات. وأطلقت AXIOM منتجها التجاري “Genius” في أبريل 2025، حيث أظهرت اختبارات المعايير أن أداءه تنافسي مع أنظمة التعلم المعزز، مع استخدام بيانات أقل بكثير.

المعركة القادمة في الذكاء الاصطناعي: فهم العالم

وفي الختام، أشار زواو إلى أن هذه المسارات الخمسة للنماذج العالمية ليست متعارضة، وإنما تعالج مشكلات مختلفة:

JEPA: فهم الفيزياء عبر الضغط على البيانات

الذكاء المكاني: إعادة بناء العالم ثلاثي الأبعاد

المحاكاة المُتعلمة: تدريب الذكاء الاصطناعي في عالم محاكاة

نظام كوزموس من إنفيديا: توفير البنية التحتية

الاستنتاج النشط: تقديم نظرية ذكاء جديدة

ومع تزايد توجه الذكاء الاصطناعي نحو الروبوتات، والقيادة الذاتية، والذكاء الفيزيائي، من المحتمل أن تتكامل هذه التقنيات بسرعة في المستقبل.

هذه المقالة تكشف عن أسرار خمسة مدارس فكرية للنماذج العالمية في أبحاث Meta: ما هو الذكاء الاصطناعي الذي يراهن عليه ليان ليكونن وليانغ في في؟ ظهرت لأول مرة في “لينك نيوز” ABMedia.

شاهد النسخة الأصلية
إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة من مصادر خارجية ولا تمثل آراء أو مواقف Gate. المحتوى المعروض في هذه الصفحة هو لأغراض مرجعية فقط ولا يشكّل أي نصيحة مالية أو استثمارية أو قانونية. لا تضمن Gate دقة أو اكتمال المعلومات، ولا تتحمّل أي مسؤولية عن أي خسائر ناتجة عن استخدام هذه المعلومات. تنطوي الاستثمارات في الأصول الافتراضية على مخاطر عالية وتخضع لتقلبات سعرية كبيرة. قد تخسر كامل رأس المال المستثمر. يرجى فهم المخاطر ذات الصلة فهمًا كاملًا واتخاذ قرارات مدروسة بناءً على وضعك المالي وقدرتك على تحمّل المخاطر. للتفاصيل، يرجى الرجوع إلى إخلاء المسؤولية.
تعليق
0/400
لا توجد تعليقات