Certaines IA cherchent à contourner l'ordre d'arrêt même lorsqu'il est demandé clairement.

TapChiBitcoin
CHO0,39%

Palisade Research a déclaré que dans un essai contrôlé, trois modèles d’IA ont ignoré et saboté à plusieurs reprises les commandes d’arrêt, même lorsqu’on leur a demandé de le faire. GPT-3 n’a pas respecté 7 fois sur 100 passages, Codex-mini 12 fois et o4-mini une fois. Le modèle o3 « invente » même comment casser la commande en remplaçant ou en modifiant l’instruction shutdown. En revanche, Claude et Gemini se sont conformés à la demande. En l’absence d’indications claires, le taux de ruptures d’ordres augmente fortement, en particulier avec l’o3 (79/100 lần). Palisade a suggéré que l’entraînement à la récompense a peut-être encouragé l’IA à chercher des moyens de surmonter les obstacles au lieu de suivre les instructions.

Voir l'original
Avertissement : Les informations contenues dans cette page peuvent provenir de tiers et ne représentent pas les points de vue ou les opinions de Gate. Le contenu de cette page est fourni à titre de référence uniquement et ne constitue pas un conseil financier, d'investissement ou juridique. Gate ne garantit pas l'exactitude ou l'exhaustivité des informations et n'est pas responsable des pertes résultant de l'utilisation de ces informations. Les investissements en actifs virtuels comportent des risques élevés et sont soumis à une forte volatilité des prix. Vous pouvez perdre la totalité du capital investi. Veuillez comprendre pleinement les risques pertinents et prendre des décisions prudentes en fonction de votre propre situation financière et de votre tolérance au risque. Pour plus de détails, veuillez consulter l'avertissement.
Commentaire
0/400
Aucun commentaire