OpenAI回应《纽约时报》起诉,称泄露文章特定内容是"罕见bug"

1月9日消息,针对《纽约时报》最近提起的版权侵权诉讼,美国人工智能初创公司OpenAI周一发表声明,对该报的指控进行了回击。

去年12月,《纽约时报》对微软和OpenAI提起诉讼,指控它们在训练聊天机器人ChatGPT时,非法使用了该报的新闻内容,侵犯了其知识产权。在提交给纽约南区联邦地方法院的诉讼文件中,《纽约时报》要求微软和OpenAI为“非法复制和使用《纽约时报》独特且具价值的作品”承担“数十亿美元的法定和实际损害赔偿”责任。

对于这一指控,OpenAI在声明中明确表示不认同,并强调:“我们一直在与新闻机构合作,共同开创新的机遇。培训属于合理使用数据的范畴,同时我们也提供了退出选项,以示尊重。”该公司进一步指出,“反流”(Regurgitation,即泄露特定内容或文章完整“记忆”部分)是“一个罕见的漏洞,我们正在积极努力消除它”。

此外,OpenAI还暗示《纽约时报》可能“故意操纵了提示内容”,并“从众多尝试中挑选了他们的内容作为诉讼证据”。

OpenAI的聊天机器人等产品所依赖的生成式人工智能技术是由大语言模型驱动的。这些模型能够吸收新闻报道、社交媒体帖子等大量网络文本数据,通过分析这些书面材料来生成新的文本内容,如事件摘要等,以回应用户查询。

OpenAI在博客文章中透露,他们与《纽约时报》的沟通“在12月19日的最后一次交流中似乎取得了建设性进展”,双方谈判的焦点是在ChatGPT中展示带有归属的《纽约时报》内容。这一举措似乎与传媒公司Axel Springer最近与OpenAI达成的协议类似。然而,《纽约时报》在12月27日提起的诉讼让OpenAI感到“意外和失望”。

尽管使用在线数据一直是企业和学术研究人员的常规操作,但在硅谷的人工智能热潮中,这类系统最近却遭到了艺术家和其他内容创作者的猛烈抨击。他们认为自己的作品被用于技术开发却没有得到应有的报酬。这些问题已经引发了众多其他诉讼案件。

去年9月,包括乔纳森·弗兰岑(Jonathan Franzen)、约翰·格里沙姆(John Grisham)、乔治·马丁(George R.R. Martin)和乔迪·皮考特(Jodi Picoult)在内的一批美国著名作家联手起诉OpenAI,指控其使用他们的作品训练ChatGPT侵犯了版权。去年7月,两位作家对OpenAI提起了类似的诉讼,声称他们的书籍在未经同意的情况下被用于训练该公司的聊天机器人。

在图像生成领域,去年2月,Getty Images对Stability AI提起诉讼,指控后者复制了1200万张Getty的图片用于训练数据。而在去年1月,Stability AI、Midjourney和DeviantArt也因其AI图像生成器侵犯版权而遭到了集体诉讼。(小小)