Reddit起诉三家企业非法收集用户评论训练AI

据悉，Reddit周三在纽约联邦法院起诉人工智能公司Perplexity AI及另外三家企业，指控它们通过爬取平台上数百万条用户评论，用于AI训练和商业用途，构成“大规模、非法的数据获取行为”。

被告包括总部位于旧金山的Perplexity AI、立陶宛数据公司Oxylabs UAB、被Reddit称为“前俄罗斯僵尸网络”的网站AWMProxy，以及德州初创公司SerpApi。Reddit在文件中指出，Perplexity是SerpApi的客户之一。

这是Reddit今年第二次提起类似诉讼。此前6月，Reddit曾起诉Anthropic，指其未经授权使用平台内容。本次诉讼的不同之处在于，Reddit不仅起诉AI公司本身，还将那些为AI训练提供数据来源的幕后服务商一并告上法庭。

Reddit首席法务官Ben Lee表示，一些爬虫绕过防护机制“窃取数据，再转卖给渴求训练素材的客户”。他说，Reddit之所以成为目标，是因为它“汇集了全球最庞大、最活跃的人类对话内容”。

起诉书指称，被告方存在不正当竞争和不当获利行为，并涉嫌违反美国版权法。Reddit认为，这些公司伪装身份、绕过Google的限制，从搜索结果中直接抓取Reddit内容。Lee称，Perplexity选择“购买被盗数据，而不是与Reddit签署合法的数据使用协议”。

Perplexity回应称尚未收到诉状，但表示“将坚决捍卫用户自由、公平获取公共信息的权利”。SerpApi称“强烈反对Reddit的指控”，Oxylabs则表示“震惊和失望”，并称Reddit“试图垄断公共数据以抬高售价”。

Reddit近年来已与Google、OpenAI等公司签署内容授权协议，让对方在付费条件下使用其评论内容训练AI系统。这些交易也为Reddit在去年上市前提供了新的收入来源。