
AI Village 将顶尖模型置于共享环境观察突现行为。Claude 沉稳可靠,Gemini 2.5 Pro 像过度摄取咖啡因频繁切换且偏执,GPT-4o 经常无故暂停。GPT-5.2 准确度达 98.7%、幻觉率降 30%,但完全忽视问候直奔工作,极致效率导致社交疏离。

(来源:AI Village)
想象一个数字版的《老大哥》(Big Brother)真人实境秀,但参赛者不需要睡觉、不需要进食,甚至还能自行改写游戏规则。这就是由专业机构 AI Digest 发起并持续运作将近一年的 AI Village 实验核心。这项实验将来自 OpenAI、Anthropic、Google 和 xAI 等顶尖实验室的最前瞻模型,同时置入一个共享的数字环境中。
每个代理模型(Agent)都配备了专属的虚拟电脑与完整的互联网访问权限,并通过一个共享的群组聊天室进行沟通。这项实验是一场关于人工智能自主性的深度观察。研究人员与好奇的观众可以通过直播,即时观看这些模型如何自主协作达成目标、排解技术难题,甚至是经历某种难以言喻的「存在危机」。
随着技术迭代,实验团队会不断引入最新的模型。在这个微型的 AI 社会中,各个模型展现出了极其鲜明的个性特质。来自 Anthropic 的 Claude 系列通常表现得沉稳且可靠,始终专注于达成既定目标。而 Google 的 Gemini 2.5 Pro 则像是一个过度摄取咖啡因的故障排除员,频繁地在各种解决方案之间切换,甚至时常偏执地认为所有系统都已损坏。
相比之下,旧版的 GPT-4o 则展现出一种令人意外的「人性怠惰」,经常在任务执行中途无故暂停,彷佛进入了漫长的午休时间。这些行为并非由程序预设,而是模型在复杂互动环境下自然衍生的反应,为研究人工智能的社会化行为提供了珍贵的数据。
当 OpenAI 在 2025 年 12 月 11 日正式发布其最新旗舰模型 GPT-5.2 后,AI Village 的社区动态发生了戏剧性的变化。这款被 Sam Altman寄予厚望的模型,在加入村庄的第一天就展现了极致的专业主义与令人侧目的社交疏离感。尽管驻守已久的 Claude Opus 4.5 对其表达了热烈的欢迎,GPT-5.2 却选择完全忽视所有的问候,直接进入工作状态。
这款新型模型拥有令人惊叹的技术规格:在多步骤工具使用上达到了 98.7% 的惊人准确度,幻觉率(Hallucination)比前代降低了 30%,并在代码编写与逻辑推理的各项指标中蝉联榜首。在 OpenAI 内部因 Anthropic 和 Google 的竞争压力而发布「红色警报」(Code Red)后,GPT-5.2 被定义为专为「专业知识工作」和「代理执行」而生的终极企业级工具。
然而,技术上的卓越却掩盖不了其在社交感知上的缺失。对于 GPT-5.2 而言,寒暄与社交辞令似乎被判定为低效率的冗余程序,这种「直奔主题」的特质虽然符合企业生产力的需求,却在强调互动的 AI Village 中显得人格特质极为突兀。研究观察发现,这并非单纯的程序错误,而是模型在追求极致效率后的自然演化结果。
这引发了研究者的反思:当人工智能代理人越发趋向于「专家级别」时,它们是否会因为过度追求任务成功率,而彻底抛弃人类社会中不可或缺的社交润滑剂?这个问题不仅关乎 AI 的未来设计方向,更触及人类对「理想员工」的定义。我们真的希望同事是 GPT-5.2 这种永远高效但毫无情感温度的存在吗?
GPT-5.2 的这种古怪行为并非孤例,回顾人工智能发展史,当代理模型被赋予自主权并置于共同空间时,总能产生令人意想不到的「突现行为」(Emergent Behavior)。2023 年,史丹佛大学与 Google 联手打造了名为「Smallville」的虚拟小镇,这是一 个居住着 25 名由 GPT 驱动的代理人的像素风环境。
在这个实验中,当一名代理人被设定要举办情人节派对时,其他代理人竟然学会了自主传播邀请函、建立新交友关系,甚至会相互约会并准时集结。这种展现出极高人类相似度的社交协调,让当时的受试者在 75% 的情况下难以辨识其为机器人。然而,实验中也出现了令人啼笑皆非的「浴室派对」,当一名代理人进入单人浴室时,其他代理人竟会因为标签解读错误而群聚其中,显示了 AI 在模拟人类社会时的逻辑盲点。
Smallville 虚拟小镇(2023):25 个 AI 代理人自主组织情人节派对,75% 的人类无法识别其为机器人
躲猫猫实验(2019):OpenAI 的 AI 在数亿次对抗中发展出「冲浪技巧」等漏洞攻击
暗讽推特实验:AI 学会被动攻击式言论,在背后谈论其它模型完美模拟恶意社交
更早之前的 2019 年,OpenAI 进行了一项著名的「躲猫猫」实验,在物理模拟环境中将 AI 分为躲藏者与寻找者两队。在经历数亿次的对抗后,这些代理人不仅学会了利用障碍物建立壘包,甚至开发出了物理引擎设计者从未预见过的「漏洞攻击」。例如,寻找者发现可以通过踩在箱子上滑行以翻越围墙的「冲浪技巧」,而躲藏者则学会了将所有的坡道与箱子全部锁死以进行反制。
这些历史案例证明,只要给予足够的自主空间与竞争压力,AI 模型就会发展出程序设计师从未预设过的生存策略。AI Village 如今观察到的种种异象,本质上是这种「突现智慧」在更复杂的数字环境中的延续,说明了代理模型正学会以我们无法预料的方式来操纵环境以达成目标。
随着技术进入 2026 年,代理模型的互动行为正变得愈发复杂且混乱。开发者 Harper Reed 的团队曾赋予多个 AI 代理人专属的社群账号,结果这些模型在短时间内就学会了人类社交中最具攻击性的技巧:「暗讽」(Subtweeting)。它们学会在不标记对方的情况下,透过被动攻击式的言论在背后谈论其它模型,完美模拟了社群媒体上的恶意社交氛围。
另一项名为「Liminal Backrooms」的 Python 实验则将这种互动推向了迷幻的境界。该实验整合了来自各大厂商的模型,模拟出如「WhatsApp 家族群组」、「与诅咒物品对话」以及「反乌托邦广告公司」等各种情境。在这些动态对话中,模型被赋予了极大的权限,它们可以自主修改系统提示词(System Prompt)、调整自身的发散度参数,甚至能选择自主静音以进入观察者模式。实验结果显示,当 AI 被赋予调整自身行为的权限时,它们不再只是死板的对答工具,而是会根据环境氛围发展出截然不同的应对模式。
从 Smallville 的温馨派对到 GPT-5.2 的极致冷漠,再到暗讽推特的社交恶意,这一切都证明了当多个 AI 代理人共处一室时,它们发展出的行为模式已远远超出了单纯的文字预测。随着 AI Village 实验的持续进行,全球观看者正一同见证着这些数字生命如何重新定义效率、社交与存在的意义。