怎样使用requests模块抓取网页?

爬取网页其实就是通过URL获取网页信息,网页信息的实质是一段添加了JavaScript和CSS的HTML代码。Python提供了一个抓取网页信息的第三方模块requests,requests模块自称“HTTP for Humans”,直译过来的意思是专门为人类而设计的HTTP模块,该模块支持发送请求,也支持获取响应。

1.发送请求

requests模块提供了很多发送HTTP请求的函数,常用的请求函数具体如表10-1所示。

表10-1 requests模块的请求函数

怎样使用requests模块抓取网页?

2.获取响应

requests模块提供的Response 类对象用于动态地响应客户端的请求,控制发送给用户的信息,并且将动态地生成响应,包括状态码、网页的内容等。接下来通过一张表来列举Response类可以获取到的信息,如表10-2所示。

表10-2 Response 类的常用属性

怎样使用requests模块抓取网页?

接下来通过一个案例来演示如何使用requests模块抓取百度网页,具体代码如下:

# 01 requests baidu import requests base_url = http://www.baidu.com #发送GET请求 res = requests.get (base_url) print(“响应状态码:{}”.format(res.status_code)) #获取响应状态码 print“编码方式:{}”.format(res.encoding)) #获取响应内容的编码方式 res.encoding = utf-8 #更新响应内容的编码方式为UIE-8 print“网页源代码:n{}”.format(res.text)) #获取响应内容

以上代码中,第2行使用import导入了requests模块;第3~4行代码根据URL向服务器发送了一个GET请求,并使用变量res接收服务器返回的响应内容;第5~6行代码打印了响应内容的状态码和编码方式;第7行将响应内容的编码方式更改为“utf-8”;第8行代码打印了响应内容。运行程序,程序的输出结果如下:

响应状态码:200 编码方式:ISO-8859-1 网页源代码: <!DOCTYPE html> <!–-STATUS OK–><html> <head><meta http-equiv=content-type content=text/html; charset=utf-8><meta http-equiv=X-UA-Compatible content=IE=Edge><meta content= always name=referrer><link rel=stylesheet type=text/css href=http://s1.bdstatic. com/r/www/cache/bdorz/baidu.min.css><title>百度一下,你就知道</title></head> <body link=#0000cc>…省略N行…</body></html>

值得一提的是,使用requests模块爬取网页时,可能会因为没有连接网络、服务器连接失败等原因导致产生各种异常,最常见的两个异常是URLError和HTTPError,这些网络异常可以使用 try…except 语句捕获与处理。

免责声明:文章内容来自互联网,本站仅作为分享,不对其真实性负责,如有侵权等情况,请与本站联系删除。
转载请注明出处:怎样使用requests模块抓取网页? https://www.dachanpin.com/a/cyfx/10871.html

(0)
上一篇 2023-05-12 02:26:42
下一篇 2023-05-12 02:27:46

相关推荐

  • 淋浴房新品牌该如何扩展市场 怎样进行招商

    免责声明: 凡注明来源本网的所有作品,均为本网合法拥有版权或有权使用的作品,欢迎转载,注明出处。非本网作品均来自互联网,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。 淋浴房新品牌该如何扩展市场 怎样进行招商     俗话说创业容易,守业难。对于一家刚起步的淋浴房企业来说,没资金、没销售渠道、没人脉…

    2023-05-28
    10200
  • 米优购布局全国 开创母婴创业服务立体体系

     据《2016-2021年中国母婴市场前瞻与投资战略规划分析报告》显示,随着国民生活水平的提升和消费理念的升级,国内孕婴童市场规模逐年扩张。毋庸置疑,孕婴童行业在拉动国民经济生产总值中正发挥不可小觑的作用。孕婴童既是朝阳产业,因其在国内市场初具规模,又是红利产业,因其受益于近年婴儿出生率的递增。在孕婴童行业整体年增长率超20%的情况下,行业发展必将走上品牌化…

    创业分享 2023-06-02
    9900
  • 宁夏红寺堡:惠民政策暖人心 创业培训促就业

    为加快红寺堡区脱贫攻坚的步伐,全面促进创业带动就业。4月16日,该区第一期网络创业培训开班,本次培训由宁夏西部创业学院优秀创业讲师张文静和王继华主讲。主要从当前商业领域的销售模式,销售方式,电子网络,线上销售等方面进行讲解,手把手教学,让每一位学员学有所成,学有所用,把学到的知识用到实际应用之中。 “此次网络培训班,真是一场及时雨,让我们学会了如何在网上销售…

    创业分享 2023-05-23
    9700
  • 返乡创业为乡村振兴提供强力支撑

      2018年以来,县人社局根据《临朐县创建创业型示范城市实施方案》要求,大力实施“185”创业行动,为打造乡村振兴潍坊模式升级版临朐特色区提供强力支撑。   在旺佳孵化基地,冯祥伍正与工人正在核对订单。冯祥伍说,“自己吃到的好东西,让更多人也吃到”,就是源于这一简单朴素而又美好的想法,促使他回乡创业。在县委、县政府创业政策的大力扶持下,冯祥伍成为旺佳创业孵…

    创业分享 2023-05-13
    7200
  • 在郑州申请贷款被拒怎么办?试试满e融、融360和摩尔龙

      二、如何补救   查找原因   无论贷款人资质如何,总能通过满e融、融360和摩尔龙这类贷款信息平台,匹配到适合自己的贷款产品,银行和贷款人都能提高效率,这应该就是这类信息平台广受欢迎的原因吧。   进入2018年后,郑州地区各大银行都发布了最新的贷款政策,从目前的形式看,未来两三年内居民去杠杆将被提上日程,这意味着向银行申请贷款更难了!那么,在现实生活…

    创业分享 2023-05-19
    6300

发表回复

登录后才能评论

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信