
当地时间12月22日,一场备受瞩目的集体诉讼在美国加州北区地方法院正式提起,将OpenAI、谷歌、Meta、Anthropic、xAI及Perplexity AI六家AI公司列为共同被告。这起诉讼由两届普利策奖得主约翰·卡雷鲁牵头,指控这些科技企业通过盗版书籍训练人工智能模型,构成“蓄意侵权”。卡雷鲁曾因揭露Theranos骗局而闻名,此次他代表作家群体,试图为智力成果争取补偿。
诉状核心指出,被告公司从LibGen、Z-Library等“非法影子图书馆”批量下载数百万册盗版书籍,用于大语言模型的训练与优化,形成了一条“盗版获取-模型训练-商业变现”的侵权链条。原告强调,作家的作品支撑起价值数十亿美元的AI生态,却未获分文报酬,若陪审团认定故意侵权,每部作品最高可索赔15万美元。
事实上,这并非AI公司首次卷入版权纠纷。据统计,OpenAI已是行业“被诉大户”,面临至少14起诉讼。例如,去年底《纽约时报》就起诉微软和OpenAI,指控其使用数百万篇文章训练聊天机器人,并要求销毁相关模型。此外,谷歌、Meta等也多次收到迪士尼、好莱坞的侵权警告,显示出行业对盗版数据的普遍依赖。
值得注意的是,此类案件已有先例。今年6月,Anthropic因使用盗版书籍训练Claude模型,被法院裁定不适用“合理使用”,最终支付15亿美元和解并销毁数据。而新秀公司如xAI与Perplexity AI,虽成立较短,但此次被指侵权模式与巨头无异,凸显了AI产业的数据来源困境。
此次审理地加州北区法院已受理全美半数的AI版权案件,其判决或将重新界定训练数据的合法性标准。随着诉讼推进,AI巨头如何平衡创新与版权,将成为影响行业未来的关键标尺。
原创文章,作者:柠萌,如若转载,请注明出处:https://www.kejixun.co/article/741916.html