Meta公司已向美国法院提出申请,要求驳回一项指控其非法下载和分发数千部色情视频以训练其人工智能系统的诉讼。
周一提交给美国加州北区地方法院的驳回动议辩称,没有证据表明 Meta 的人工智能模型包含或使用受版权保护的材料进行训练,称这些指控“荒谬且没有依据”。
Ars Technica于周四率先报道了这一动议,Meta 随即发表声明予以直接否认,称这些说法是“虚假的”。
动议中写道:“原告费尽心思,用猜测和影射拼凑出这个故事,但他们的主张既不令人信服,也没有充分陈述的事实支持。”
最初的投诉是由 Strike 3 Holdings 于 7 月提出的,指控 Meta 自 2018 年以来使用公司和隐藏的 IP 地址下载了近 2400 部成人电影,这是其构建多模态人工智能系统的更广泛努力的一部分。
Strike 3 Holdings 是一家总部位于迈阿密的成人电影控股公司,旗下拥有 Vixen、Blacked 和 Tushy 等品牌,并发行相关内容。
Decrypt已联系 Meta 和 Strike 3 Holdings 及其各自的法律顾问,如果他们做出回应,我们将更新本文。
Meta 的动议认为,所谓下载的规模和模式与 Strike 3 的 AI 训练理论相矛盾。
七年多来,据称只有 157 部 Strike 3 的电影是通过 Meta 的企业 IP 地址下载的,平均每年约 22 部,涉及 47 个不同的地址。
Meta 的律师 Angela L. Dunning 将此描述为“零星的、不协调的活动”,由“不同的个人”出于“个人用途”而进行,因此并非像 Strike 3 所指控的那样,是这家科技巨头为人工智能训练收集数据的一部分。
该动议还反驳了 Strike 3 的说法,即 Meta 使用了超过 2500 个“隐藏的”第三方 IP 地址,并声称 Strike 3 没有核实这些地址的所有者,而是进行了松散的“关联”。
据称其中一个 IP 地址段注册在一家与 Meta 无关的夏威夷非营利组织名下,而其他 IP 地址段则没有已知的拥有者。
Meta 还辩称,没有证据表明它知道或能够阻止所谓的下载,并补充说,它从中没有获得任何好处,而且监控其全球网络上的每个文件既不简单,也不是法律要求的。
风险投资公司 Ryze Labs 的联合创始人 Dermot McGrath 告诉Decrypt ,虽然 Meta 的辩护乍一看似乎“不同寻常”,但考虑到其核心主张是“该材料没有用于任何模型训练”,因此该辩护可能仍然有分量。
McGrath 表示:“如果 Meta 承认模型中使用了这些数据,他们就必须辩称这是合理使用,证明包含盗版内容是正当的,并且还要让自己的内部培训和审计系统面临被发现的风险。”他还补充说,Meta 没有为数据的所谓使用方式辩护,而是否认“曾经使用过这些数据”。
但麦格拉斯表示,如果法院承认这种辩护有效,可能会打开“一个巨大的漏洞”。这可能会“有效地削弱人工智能训练数据案件的版权保护”,导致未来的案件需要“更有力的企业主导证据,而企业只会更擅长隐藏这些证据”。
不过,处理露骨内容也有其正当理由,例如开发安全或审核工具。
麦格拉斯说:“大多数大型人工智能公司都有‘红队’,他们的任务是通过使用有害提示来探测模型的弱点,并试图让人工智能生成露骨、危险或违禁的内容。要构建有效的安全过滤器,你需要用你想要屏蔽的内容示例来训练这些过滤器。”




