据悉,Reddit周三在纽约联邦法院起诉人工智能公司Perplexity AI及另外三家企业,指控它们通过爬取平台上数百万条用户评论,用于AI训练和商业用途,构成“大规模、非法的数据获取行为”。
被告包括总部位于旧金山的Perplexity AI、立陶宛数据公司Oxylabs UAB、被Reddit称为“前俄罗斯僵尸网络”的网站AWMProxy,以及德州初创公司SerpApi。Reddit在文件中指出,Perplexity是SerpApi的客户之一。
这是Reddit今年第二次提起类似诉讼。此前6月,Reddit曾起诉Anthropic,指其未经授权使用平台内容。本次诉讼的不同之处在于,Reddit不仅起诉AI公司本身,还将那些为AI训练提供数据来源的幕后服务商一并告上法庭。
Reddit首席法务官Ben Lee表示,一些爬虫绕过防护机制“窃取数据,再转卖给渴求训练素材的客户”。他说,Reddit之所以成为目标,是因为它“汇集了全球最庞大、最活跃的人类对话内容”。
起诉书指称,被告方存在不正当竞争和不当获利行为,并涉嫌违反美国版权法。Reddit认为,这些公司伪装身份、绕过Google的限制,从搜索结果中直接抓取Reddit内容。Lee称,Perplexity选择“购买被盗数据,而不是与Reddit签署合法的数据使用协议”。
Perplexity回应称尚未收到诉状,但表示“将坚决捍卫用户自由、公平获取公共信息的权利”。SerpApi称“强烈反对Reddit的指控”,Oxylabs则表示“震惊和失望”,并称Reddit“试图垄断公共数据以抬高售价”。
Reddit近年来已与Google、OpenAI等公司签署内容授权协议,让对方在付费条件下使用其评论内容训练AI系统。这些交易也为Reddit在去年上市前提供了新的收入来源。