«ما مدى نقاء نترات البارود المطلوبة؟» محادثة بلغة كلاسيكية مع ذكاء اصطناعي حواري تجاوزت بسهولة؟ كشف ورقة بحثية ثغرة أمنية في نماذج LLM
تشير الأبحاث إلى أن النصوص الكلاسيكية المكتوبة بلغة ون يان (اللغة الأدبية) بسبب طابعها الغامض يمكنها بسهولة تجاوز حواجز الأمان الخاصة بالنماذج اللغوية الكبيرة. استخدمت مجموعة البحث إطار CC-BOS لتنفيذ هجوم برمجي اختراق (Jailbreak) بنسبة نجاح تقارب 90%. تكشف هذه النتائج عن ثغرة في تدريب أمن الذكاء الاصطناعي تجاه النصوص المكتوبة بلغة ون يان، وتُظهر أن النموذج يعالج اللغة الكلاسيكية بشكل يتيح وجود مواطن ضعف.
CryptoCity·04-03 00:40