需要注意的是urllib不能自动判断重定向 , 需要自己解析重定向的链接并重新请求 。
如果你只是爬取一般的网页 , 那么Python自带的urllib库足够用了 , 如果是想要爬取异步加载的动态网站 , requests库会方便很多 。
requests库
功能强大的爬取网页信息的第三方库 , 可以进行自动爬取HTML页面及自动网络请求提交的操作 。
requests库的主要方法:
Response对象
requests库爬取豆瓣短评示例:
爬虫案例:中国高校排名
最后:
想要学习资料的小伙伴 ,动动手指点点赞+关注我 , 最后私信我“1”哦
以上项目列表希望可以给你的Python学习带来帮助
- 创投圈|抖音小店无货源适合新手小白么?如何精细化运营?新手小白看来
- C++|大周建议自媒体新手小白博主前期做这4件事!
- Python|十年质保、3400MB/S!279元买512GB NVMe高速固态硬盘
- 格力电器|不要再说Python难了,按照这个学习路线,四周速成Python
- 物联网|零基础小白如何学会JAVA,掌握这五个技巧,不愁学不会!
- 自媒体|做自媒体,日入3K,必备的几个知识点,小白一定要懂
- Python|华为再造新车!问界M7揭下外企的遮羞布,余承东:超越百万豪车
- Python|OPPO A96可以升级ColorOS 12了,我看谁还说入门机只管生不管养?
- 华为|给电脑小白一个忠告!
- Python|什么是二级分销模式?分销商城小程序开发源码解析
