百度等其他搜寻引擎爬虫爬取的网页原始码是?
拿大家最常用的chrome浏览器来看,网页查看原始码方式有二种1.键盘Ctrl+U查看源代码:就是别人服务器发送到浏览器的原封不动的代码,也就是最原始的代码2.键盘F12检查元素:看到的就是最终的html代码。即:源代码 + 网页js渲染有些网页是Javascript渲染的技术建置,所以会有Ctrl+U查不到文字,而F12查的到内文因此想问大家,百度爬虫的话,是爬取Ctrl+U还是F12的原始码?
回复
1个回答

test
2024-07-15
Google 的 bot 是会执行 JS 的,报错机器人偶尔会捕获到一些。
回复

适合作为回答的
- 经过验证的有效解决办法
- 自己的经验指引,对解决问题有帮助
- 遵循 Markdown 语法排版,代码语义正确
不该作为回答的
- 询问内容细节或回复楼层
- 与题目无关的内容
- “赞”“顶”“同问”“看手册”“解决了没”等毫无意义的内容