现在大型的爬虫项目用的是什么框架， scrapy 过时了吗

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

• 请不要在回答技术问题时复制粘贴 AI 生成的内容

13 条回复 • 2025-11-26 16:20:45 +08:00

bwnjnOEI

5 天前 via iPhone

面对动态页面和抗反爬稍微复杂点的就不行了吧
简单的网站依然可以用啊

donaldturinglee

5 天前

scrapy 一直就不是单着用的吧？没过时，但是你可以学一下 playwright

sgld

5 天前

试试 DrissionPage ?

zonde306

4 天前

简单就 scrapy ，复杂就不用框架，直接操作浏览器

例如
camoufox
patchwright

azzzzzz

4 天前

未来还是直接模拟浏览器的吧

IIce

4 天前

毕业之后就没用过 scrapy 了，有自研的，也有 feapder, 还有一些就是一个 requests 脚本，可能项目不够大吧

1018ji

4 天前

浏览器还能抓啥，APP 走起

Toowhite7

4 天前

Selenium or playwright

tim2017

4 天前 via iPhone

之前用过简数的代爬，收费还可以，以前免费提供大量知名网站的模版，现在都限制了。

我公司网站靠爬虫每天上百 IP ，几年没更新了。
国内互联网 V2EX 这种开放性的 web 原创数据越来越少了，都是私域平台。

Honghe

4 天前

@tim2017 嗯，web 成荒漠了

llsquaer

4 天前

一个项目一个 py 还要啥 scrapy ..

securityCoding

4 天前 via Android

chrome cdp?

gopo

4 天前

1. 逆向协议（网页优先，APP 其次）
2. 自研浏览器、模拟器（主要过指纹还有方便自定义）
3. 简单网站（静态和动态的区别）随便搞