OpenAI 驳斥监管机构声称其在最新模型发布中违反加州新AI安全法的说法

据AI监督组织指控,OpenAI在发布其最新的编码模型时可能违反了加利福尼亚州新的AI安全法。

违反该法可能使公司面临数百万美元的罚款,此案也可能成为新法律条款的先例性首次审判。

推荐视频


一位OpenAI发言人驳斥了监督组织的立场,告诉《财富》杂志,公司“对我们遵守前沿安全法律,包括SB 53,充满信心。”

此次争议集中在GPT-5.3-Codex上,OpenAI的最新编码模型,于上周发布。该模型是OpenAI为重新夺回其在AI驱动编码领域领先地位而努力的一部分,根据OpenAI公布的基准数据,显示其在编码任务上的表现明显优于早期版本的模型,无论是OpenAI自己还是像Anthropic这样的竞争对手。然而,该模型也引发了前所未有的网络安全担忧。

CEO山姆·奥特曼表示,该模型是首个在公司内部风险分类系统“准备框架”中被归入“高”风险类别的模型。该系统是OpenAI用于模型发布的内部风险评估体系。这意味着OpenAI基本上将该模型归类为在编码方面具有足够能力,可能会带来重大网络危害,尤其是在自动化或大规模使用时。

AI监督组织“米达斯项目”声称,OpenAI在推出新高风险模型时未能遵守其自身的安全承诺——这些承诺在加利福尼亚法律下现已具有法律约束力。

自一月生效的加利福尼亚SB 53法案要求主要的AI公司公布并遵守其安全框架,详细说明他们将如何防止灾难性风险——定义为导致超过50人死亡或10亿美元财产损失的事件——从其模型中发生。该法案还禁止这些公司发表误导性关于合规性的声明。

OpenAI的安全框架要求对具有高网络安全风险的模型采取特殊保护措施,以防止AI失控,做出欺骗行为、破坏安全研究或隐藏其真实能力。然而,“米达斯项目”表示,尽管触发“高风险”网络安全阈值,OpenAI似乎在部署前未实施特定的偏差校正措施。

OpenAI表示,“米达斯项目”对其“准备框架”措辞的解读是错误的,尽管也指出该框架中的措辞“模糊”,并试图通过公司与GPT-5.3-Codex一同发布的安全报告中的声明,澄清该措辞的意图。在该安全报告中,OpenAI表示,只有在“与”长程自主性——即在较长时间内自主运行的能力——同时出现高网络风险时,才需要额外的保护措施。由于公司认为GPT-5.3-Codex缺乏这种自主性,因此认为不需要采取额外措施。

“GPT-5.3-Codex已完成我们的全部测试和治理流程,详见公开发布的系统卡,并且未在代理评估和内部专家判断(包括我们的安全咨询组)确认的基础上表现出长程自主能力,”发言人表示。公司也表示,缺乏一种明确评估模型长程自主性的方法,因此依赖于他们认为可以作为该指标代理的测试,同时正在开发更好的评估方法。

然而,一些安全研究人员对OpenAI的解释提出异议。Encode的州事务副总裁兼总法律顾问Nathan Calvin在X(前Twitter)上发帖说:“他们不是承认在发布前没有遵循计划或没有更新,而是说标准模糊。阅读相关文件后……我觉得并不模糊。”

“米达斯项目”还声称,OpenAI无法确凿证明该模型缺乏实现额外措施所需的自主能力,因为公司之前的较旧模型已在全球自主任务完成基准测试中名列前茅。该组织认为,即使规则不明确,OpenAI也应在发布模型前予以澄清。

“米达斯项目”创始人Tyler Johnston称,这一潜在违规“尤其令人尴尬,因为SB 53的门槛非常低:基本上只需采用一份自愿的安全计划,并诚实沟通,必要时进行调整,而不是违反或虚假陈述。”

如果调查启动且指控被证实,SB 53允许对违规行为处以巨额罚款,严重或持续时间长的违规可能高达数百万美元。加利福尼亚总检察长办公室的一位代表告诉《财富》杂志,部门“致力于执行我们州的法律,包括那些旨在增加新兴AI领域透明度和安全性的法律。”但他们也表示,无法对潜在或正在进行的调查发表评论,甚至无法确认或否认。

2024年2月10日更新: 本报道已更新,将OpenAI声称其符合加州AI法律的声明在文章中位置提升。标题也已更改,明确表示OpenAI正在对监督组织的指控提出异议。此外,报道还澄清,OpenAI在GPT-5.3-Codex安全报告中的声明旨在澄清其准备框架中被认为模糊的措辞。

查看原文
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
0/400
暂无评论
交易,随时随地
qrCode
扫码下载 Gate App
社群列表
简体中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)