OpenAI تطلق مراقبة CoT لوقف السلوك الضار للنماذج الكبيرة

DailyNews

ذكرت شركة Golden Finance أن OpenAI أصدرت أحدث الأبحاث ، باستخدام مراقبة CoT (سلسلة الفكر) ، يمكنها منع السلوكيات الخبيثة مثل النماذج الكبيرة التي تتحدث عن الهراء وتخفي النوايا الحقيقية ، وهي أيضا واحدة من الأدوات الفعالة للإشراف على النماذج الفائقة. يستخدم OpenAI الطراز المتطور الذي تم إصداره حديثا o3-mini ككائن مراقب ، وطراز GPT-4o الأضعف كشاشة. بيئة الاختبار هي مهمة ترميز تتطلب من الذكاء الاصطناعي تنفيذ الوظائف في قاعدة التعليمات البرمجية لاجتياز اختبارات الوحدة. أظهرت النتائج أن جهاز مراقبة CoT كان أداؤه جيدا في اكتشاف سلوك “قرصنة المكافآت” المنهجي ، بمعدل استدعاء يصل إلى 95٪ ، يتجاوز بكثير 60٪ من السلوكيات التي تم مراقبتها فقط.

شاهد النسخة الأصلية
إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة من مصادر خارجية ولا تمثل آراء أو مواقف Gate. المحتوى المعروض في هذه الصفحة هو لأغراض مرجعية فقط ولا يشكّل أي نصيحة مالية أو استثمارية أو قانونية. لا تضمن Gate دقة أو اكتمال المعلومات، ولا تتحمّل أي مسؤولية عن أي خسائر ناتجة عن استخدام هذه المعلومات. تنطوي الاستثمارات في الأصول الافتراضية على مخاطر عالية وتخضع لتقلبات سعرية كبيرة. قد تخسر كامل رأس المال المستثمر. يرجى فهم المخاطر ذات الصلة فهمًا كاملًا واتخاذ قرارات مدروسة بناءً على وضعك المالي وقدرتك على تحمّل المخاطر. للتفاصيل، يرجى الرجوع إلى إخلاء المسؤولية.
تعليق
0/400
لا توجد تعليقات