IT之家 12 月 21 日消息,据科技媒体 The Verge 昨天报道,谷歌已对爬虫工具开发商 SerpApi 提起诉讼,指控其通过非法手段规避反爬虫机制,窃取大量受版权保护的内容。

谷歌在诉讼中表示,SerpApi 违反了版权法律,通过“欺骗性手段”自动访问并抓取谷歌搜索结果,规模“令人震惊”,并且这家公司还将抓取数据出售给客户。
具体来说,SerpApi 通过非常手段绕过了谷歌的 SearchGuard 反爬虫技术。
谷歌还在诉讼中透露,公司开发并部署 SearchGuard 就是为了阻止侵权行为并保护合作伙伴,而 SerpApi 动用了多种手段来规避反爬虫,具体应对方式为:每天向谷歌发送数以亿计的自动查询进行伪装,返回的请求看起来与正常真人用户别无二致。

谷歌认为自家搜索引擎中包含大量受版权保护的内容,而 SerpApi 的行为无视了公司在获取版权方面进行的投入,使他人无需承担同样的成本就能坐享其成。
谷歌请求法院下令 SerpApi 停止使用突破并销毁反爬虫技术。
值得注意的是,社交媒体 Reddit 曾在今年 10 月起诉 SerpApi 以及另外两家爬虫公司,并在诉状中指出,被告方为 AI 初创公司 Perplexity 抓取 Reddit 帖子,谷歌在诉讼中简要提及了此次事件,但并未直接点名具体公司。
IT之家注:爬虫是一种自动化程序,用于在互联网上批量访问网页、抓取并解析网页内容,典型的爬虫可向网站发起访问请求,并扒下 HTML、JSON、图片等数据,解析文字、链接、价格、图片等有用信息,最后保存到数据库。
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

