窃取数亿北美用户数据训练 AI,谷歌被公诉
扫描二维码
随时随地手机看文章
据业内消息,因涉嫌在北美用户不知情的情况下窃取其上网隐私数据来训练其 AI 产品(包括但不限于 Bard),谷歌上周被提起集体公诉,指控其“秘密地窃取了数亿美国人在互联网上创作和分享的一切”。
据悉,这项集体诉讼由克拉克森律师事务所(Clarkson Law Firm)在加利福尼亚北区联邦法院提起,指控谷歌及其 AI 子公司 DeepMind 和母公司 Alphabet 非法窃取了用户数据。这家律所前不久曾对 ChatGPT 开发商 OpenAI 提起类似诉讼,指控该公司窃取了大量个人数据用它来训练 ChatGPT,包括医疗记录和关于儿童的信息。
本次诉讼声称“谷歌拿走了我们所有的个人和专业信息、我们的创意和版权作品、我们的照片,甚至我们的电子邮件 —— 几乎是我们数字足迹的全部”用来构建其 AI 产品。“多年来,谷歌秘密地收集了这些数据,没有向任何人通知或征得同意。”
此外,谷歌从基于订阅的网站和以盗版书籍和创意作品而闻名的网站窃取了数据,谷歌 7 月 1 日对其隐私政策的更新,新隐私政策称谷歌可能会收集公开在线可用的信息用来训练其 AI 模型,并构建谷歌翻译(Google Translate)、Bard 和云端 AI(Cloud AI)等产品。
诉讼称:“谷歌必须明白它并不拥有互联网,它也不拥有我们的创意作品、我们的个性表达、我们的家庭和孩子的照片,或者任何其他因为我们在网上分享而属于我们的东西。‘公开可用’从来不意味着可以为任何目的免费使用。”
谷歌这起诉讼中的一名原告是一名住在得克萨斯州的《纽约时报》畅销书作者和调查记者,她声称谷歌使用了她的书的盗版 PDF 来训练 Bard。诉讼称,她的作品现在在 Bard 上广泛免费提供,该机器人给出了书的章节摘要,甚至逐字分享了书中的片段。
然而谷歌在一份声明中称,诉讼中的指控毫无根据。谷歌总法律顾问 Halimah DeLaine Prado在一份声明中声称该公司多年来一直明确表示,使用来自公共来源的数据,如发布到开放网络和公共数据集上的数据,来训练谷歌翻译等服务背后的人工智能模型符合我们的 AI 原则,美国法律支持使用公开信息来创造新的有益用途,我们期待驳回这些毫无根据的指控。