百度等其他搜寻引擎爬虫爬取的网页原始码是?

作者站长头像
站长
· 阅读数 10

拿大家最常用的chrome浏览器来看,网页查看原始码方式有二种1.键盘Ctrl+U查看源代码:就是别人服务器发送到浏览器的原封不动的代码,也就是最原始的代码2.键盘F12检查元素:看到的就是最终的html代码。即:源代码 + 网页js渲染有些网页是Javascript渲染的技术建置,所以会有Ctrl+U查不到文字,而F12查的到内文因此想问大家,百度爬虫的话,是爬取Ctrl+U还是F12的原始码?

回复
1个回答
avatar
test
2024-07-15

Google 的 bot 是会执行 JS 的,报错机器人偶尔会捕获到一些。

answer image

回复
likes
适合作为回答的
  • 经过验证的有效解决办法
  • 自己的经验指引,对解决问题有帮助
  • 遵循 Markdown 语法排版,代码语义正确
不该作为回答的
  • 询问内容细节或回复楼层
  • 与题目无关的内容
  • “赞”“顶”“同问”“看手册”“解决了没”等毫无意义的内容