OpenAI在版权诉讼中将披露训练数据，但仅限律师查看

近日，OpenAI 一起备受瞩版权诉讼中达成了一项协议，决定向原告律师披露用于训练生成性 AI 模型的数据。

图源备注:图片由AI生成，图片授权服务商Midjourney

这场官司的原告是包括保罗・特伦布雷、莎拉・尔弗曼、迈克尔・查邦、大卫・亨利・黄和塔 - 内西・茨等多位知名作家。他于去年对 OpenAI 及其附属提起诉讼，指控其 AI 在未经授权的情况下使用了他们的作品，并在此基础生成文本，违反了美国版权法和州不公平竞争法。

根据美国地方法罗伯特・尔曼的裁定，原告的将获得进入 OpenAI 设立的安全的权限，在此可以查看训练数据这一过程受到严格限制。安全室内禁止任何录音设备，OpenAI 法律团队也有权查看律师在房内所做的任何笔记。这些措施使得训练数据的披露更像是对敏感源代码的审查，而非简单的信息共享。

尽 OpenAI 在法律上坚称其使用版权作品的方式符合 “合理使用”，但此事引发了更多的关注因为如果 OpenAI 训练数据被广泛披露，可能会引发更多的法律诉讼。而目前，针对 OpenAI 的版权指控不仅来自这几位作家，还有其他的原告也在发起类似的诉讼。

值得一提的是，未来可能有更多的法规要求 AI 开发商更为透明地披露其训练数据。欧盟的《人工智能法》预计将在2025年生效，要求模型提供商公开训练数据的详细信息，以满足那些对其权益有合法需求的群体。此外，加利福尼亚州也通过了一项 AI 数据透明度法案，州长签字。

尽管 OpenAI 坚持其生成的内容是基于对语言、推理和世界的理解，但法律上关于 AI 模型的行为是否合适仍然存在争议。随着越来越多的诉讼和立法提案出现，AI 领域的未来仍然充满不确定性。

划重点:
📝 OpenAI 同意向律师披露训练数据，满足版权讼需要。
🔒 数据查看在严格控制的安全环境中进行，禁止携带录音设备。
⚖️ 未来可能面临更多法规，推动 AI 数据透明度的要求

​OpenAI在版权诉讼中将披露训练数据，但仅限律师查看