当前位置:首页 > 软件开放 > 正文内容

网站源码爬取(获取网站源码)

软件开放2年前 (2023-01-12)2010

今天给各位分享网站源码爬取的知识,其中也会对获取网站源码进行解释,如果能碰巧解决你现在面临的问题,别忘了关注本站,现在开始吧!

本文目录一览:

用requests库爬取网站源码问题

这个网页是JavaScript异步加载的,直接用requests爬不到你想要的网页源码。

为什么别人网站源码中只有少量内容,其他通过js实现

最有可能的原因就是网页数据是动态加载的,存储在一个json文件中,直接获取源码是提取不到任何信息的,需要抓包分析才行,下面我简单介绍一下操作过程,以某某贷上的数据为例(动态加载):

1.首先,打开原网页,如下,这里假设我们要爬取的数据包含年利率、借款标题、期限、金额和进度5个字段:

2.接着右键打开网页源码,按Ctrl+F搜索其中关键字,如“10.20%”,可以看到,任何信息都匹配不到,说明数据是动态加载的,而非直接嵌套在网页源码中:

3.按F12调出浏览器开发者工具,开始抓包分析,依次点击“Network”-“XHR”,F5刷新页面,可以看到,数据是动态加载的,存储在一个json文件中,而非html网页源码,只有解析这个json文件,才能提取出我们需要的数据:

4.接着就是根据抓包结果解析json文件,已经获取到url地址,所以直接get请求即可,然后用python自带的json包解析就行,测试代码如下,非常简单,依次根据属性提取字段信息即可:

5.最后点击运行程序,截图如下,已经成功提取到我们需要的数据:

至此,我们就完成了网页动态数据的爬取。总的来说,整个过程非常简单,最主要的还是抓包分析,获取到真实存储数据的文件,然后再解析就行,只要你有一定的python基础,熟悉一下上面的过程,很快就能掌握的,当然,如果数据或链接进行了加密处理,这个就非常复杂了,需要自己好好琢磨一下,网上也有相关资料和教程,感兴趣的话,可以搜一下,希望以上分享的内容能对你有所帮助吧,也欢迎大家评论、留言进行补充。

python怎么爬取网页源代码

#!/usr/bin/env python3

#-*- coding=utf-8 -*-

import urllib3

if __name__ == '__main__':

http=urllib3.PoolManager()

r=http.request('GET','IP')

print(r.data.decode("gbk"))

可以正常抓取。需要安装urllib3,py版本3.43

网站源码爬取的介绍就聊到这里吧,感谢你花时间阅读本站内容,更多关于获取网站源码、网站源码爬取的信息别忘了在本站进行查找喔。

扫描二维码推送至手机访问。

版权声明:本文由飞速云SEO网络优化推广发布,如需转载请注明出处。

本文链接:http://zspsrg.cn/post/3578.html

“网站源码爬取(获取网站源码)” 的相关文章

东莞app软件开发(东莞app软件开发找聚顶科技在)

东莞app软件开发(东莞app软件开发找聚顶科技在)

今天给各位分享东莞app软件开发的知识,其中也会对东莞app软件开发找聚顶科技在进行解释,如果能碰巧解决你现在面临的问题,别忘了关注本站,现在开始吧!本文目录一览: 1、东莞APP软件开发多少钱 2、东莞软件开发公司哪家好? 3、app开发公司哪家好一点? 4、东莞app开发公司哪家好...

兄弟装饰公司官网水电安装工艺(兄弟建筑装饰工程有限公司)

兄弟装饰公司官网水电安装工艺(兄弟建筑装饰工程有限公司)

今天给各位分享兄弟装饰公司官网水电安装工艺的知识,其中也会对兄弟建筑装饰工程有限公司进行解释,如果能碰巧解决你现在面临的问题,别忘了关注本站,现在开始吧!本文目录一览: 1、室内装修施工工艺流程有哪些? 2、大家 说说,重庆兄弟装饰公司和重庆兴唐装饰公司如何,知道的说说? 3、重庆装饰公司前...

黑客微信代码大全图片(黑客微信代码大全图片下载)

黑客微信代码大全图片(黑客微信代码大全图片下载)

本篇文章给大家谈谈黑客微信代码大全图片,以及黑客微信代码大全图片下载对应的知识点,希望对各位有所帮助,不要忘了收藏本站喔。 本文目录一览: 1、微信炫酷代码是什么? 2、手机在微信里输入一串黑客代码 3、如何一串代码假装让微信中毒 4、微信隐藏代码 微信隐藏代码盘点 微信炫酷代码是什么...

自适应均线源码(自适应均线优化改进)

自适应均线源码(自适应均线优化改进)

今天给各位分享自适应均线源码的知识,其中也会对自适应均线优化改进进行解释,如果能碰巧解决你现在面临的问题,别忘了关注本站,现在开始吧!本文目录一览: 1、求,博易版 考夫曼自适应移动平均线指标公式? 2、什么是考夫曼自适应移动平均线Kaufman Adaptive Moving Average...

小米手机工程模式代码大全(小米手机工程模式代码大全)

小米手机工程模式代码大全(小米手机工程模式代码大全)

今天给各位分享小米手机工程模式代码大全的知识,其中也会对小米手机工程模式代码大全进行解释,如果能碰巧解决你现在面临的问题,别忘了关注本站,现在开始吧!本文目录一览: 1、小米手机如何查看电池损耗代码? 2、怎么进入红米3MTK的工程模式的代码 3、小米手机一直工程模式 小米手机如何查看电池...

怎么看网卡驱动是否正常(怎样看网卡驱动是否正常)

怎么看网卡驱动是否正常(怎样看网卡驱动是否正常)

今天给各位分享怎么看网卡驱动是否正常的知识,其中也会对怎样看网卡驱动是否正常进行解释,如果能碰巧解决你现在面临的问题,别忘了关注本站,现在开始吧!本文目录一览: 1、如何检查网卡及驱动是否正常工作 2、怎么看有没有网卡驱动? 3、检查网卡驱动是否正常?从笔记本电脑的哪里看啊?俺看不来帮帮忙!...