أطلقت شركة Rakuten نموذج Rakuten AI 3.0، وتُظهر ملفات التكوين أن الهيكل الأساسي هو DeepSeek V3

أخبار Gate، في 17 مارس، أطلقت مجموعة ليتان اليوم Rakuten AI 3.0 باسم “أكبر نموذج ذكاء اصطناعي عالي الأداء في اليابان”، وهو مفتوح المصدر بموجب ترخيص Apache 2.0. يعتمد النموذج على بنية MoE (خبير مختلط) ويحتوي على 671 مليار معلمة، ويشغل 37 مليار خلال كل استنتاج، ويحتوي على نافذة سياق تبلغ 128 ألف، ومُحسن للغة اليابانية، وتفوق على GPT-4o في العديد من الاختبارات القياسية للغة اليابانية. يُعد النموذج نتيجة لمشروع GENIAC الذي يشارك فيه وزارة الاقتصاد والصناعة اليابانية ووكالة تطوير تكنولوجيا الطاقة الجديدة (NEDO)، وقد قدمت الحكومة اليابانية جزءًا من تمويل الحوسبة لتدريبه. وصفت ليتان في إعلانها النموذج الأساسي بأنه “نتيجة للاستفادة الكاملة من أفضل نتائج المجتمع المفتوح”، دون ذكر اسم النموذج المحدد. وفورًا، قام المجتمع بمراجعة ملفات النموذج المنشورة على منصة HuggingFace، ووجد أن ملف config.json يوضح بوضوح أن model_type هو deepseek_v3 وarchitecture هو DeepseekV3ForCausalLM، وأن المعلمات الإجمالية 671 مليار، و37 مليار نشط، ونافذة السياق 128 ألف، وهو مطابق تمامًا لنموذج DeepSeek V3، مما يشير إلى أن النموذج تم تعديله بشكل دقيق على أساس DeepSeek V3 باستخدام بيانات باللغة اليابانية.

شاهد النسخة الأصلية
إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة من مصادر خارجية ولا تمثل آراء أو مواقف Gate. المحتوى المعروض في هذه الصفحة هو لأغراض مرجعية فقط ولا يشكّل أي نصيحة مالية أو استثمارية أو قانونية. لا تضمن Gate دقة أو اكتمال المعلومات، ولا تتحمّل أي مسؤولية عن أي خسائر ناتجة عن استخدام هذه المعلومات. تنطوي الاستثمارات في الأصول الافتراضية على مخاطر عالية وتخضع لتقلبات سعرية كبيرة. قد تخسر كامل رأس المال المستثمر. يرجى فهم المخاطر ذات الصلة فهمًا كاملًا واتخاذ قرارات مدروسة بناءً على وضعك المالي وقدرتك على تحمّل المخاطر. للتفاصيل، يرجى الرجوع إلى إخلاء المسؤولية.
تعليق
0/400
لا توجد تعليقات