OpenAI 发布模型规范:如何控制人工智能生成的色情内容和其他露骨内容

OpenAI人工智能实验室发布了其《模型规范(Model Spec)》的第一个版本,该文件定义了AI模型的行为原则。该文件包括关于如何负责任地处理敏感内容的详细指导,包括管理AI色情和其他露骨内容的问题。这成为公司在伦理发展人工智能方面迈出的重要一步。

AI模型行为管理的基本原则

OpenAI提出了三项关键原则,指导AI系统的运作。首先,必须开发出能够帮助开发者和最终用户根据指令获得有用回答的AI模型。其次,算法应以造福人类为目标,同时最大限度减少潜在威胁。第三,AI模型应反映OpenAI关于社会规范和现行法律的价值观和原则。

这三项基础构成了《模型规范》所有其他建议的基础。公司希望这种结构化的方法有助于营造一个更可预测、更安全的AI技术应用环境。

NSFW内容与责任创建:OpenAI的立场

文件中最受关注的部分之一是关于露骨内容管理的章节。OpenAI并未完全禁止处理AI色情内容,而是提出了一种受控的方法。公司“探索在符合年龄的场景中,通过API和ChatGPT平台负责任地生成此类数据的可能性”。

该方法的核心是允许公司和用户自主选择其AI模型的“敏感度”水平。这意味着开发者可以根据需求和目标受众调整AI系统的参数。产品经理Joan Jiang解释说,文件的目标是收集公众对模型行为的反馈,并明确区分算法的故意行为与误差。

开发者的五项关键规则

《模型规范》制定了一套强制性规则,所有OpenAI的开发者在使用AI系统时必须遵守。开发者必须遵循指令层级,符合现行法律,避免制造信息威胁。此外,还应尊重版权和知识产权,保护用户隐私,并在没有适当限制和授权的情况下避免生成NSFW内容。

这些规则既适用于AI色情内容,也适用于其他敏感类别的内容。文件还建议模型默认假设用户具有善意,在必要时提出澄清性问题,不越界,保持客观立场,并在适当情况下表达不确定性。

对现有AI模型的影响

值得注意的是,目前《模型规范》不会影响已发布的OpenAI产品,如GPT-4和DALL-E 3。这些产品将继续按照现有的使用政策运行。然而,该文件被设计为“动态”工具,计划根据公众、政策制定者、学术界和各领域专家的反馈频繁更新。

公司期待听取所有利益相关方的意见,包括使用OpenAI服务的用户。目前尚不清楚哪些反馈会被采纳,也不清楚谁将决定文件的必要变更。关于第二版《模型规范》的发布时间也尚未公布。

发展前景:AI色情与新标准

《模型规范》是推动AI系统行为管理标准化的重要一步。该文件显示,OpenAI在开发人工智能时,认真对待伦理和安全问题,包括处理AI色情和露骨内容的敏感问题。公司选择了负责任的管理路径,而非完全禁止,赋予开发者自主决策的空间。

这一决策反映了行业对内容完全控制不可能且常常适得其反的日益认识。更为有效的方法是基于透明度、责任感和利益相关者参与的管理方式。随着人工智能成为越来越普遍的工具,类似《模型规范》的文件将在全球范围内对AI色情和其他敏感内容的标准制定与实践中发挥越来越重要的作用。

查看原文
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
0/400
暂无评论