当前位置: 首页 > news >正文

网站开发制作全包网站图片缩略图

网站开发制作全包,网站图片缩略图,南宁网站建设索q479185700,网络营销软文范例import requestsurl https://movie.douban.com/top250 response requests.get(url) # 查看结果 print(response)在requests使用一文中我们有讲到#xff0c;当状态码不是200时表示爬虫不可用#xff0c;也就是说我们获取不到网页源代码。但是我们还是可以挣扎一下#xff…import requestsurl https://movie.douban.com/top250 response requests.get(url) # 查看结果 print(response)在requests使用一文中我们有讲到当状态码不是200时表示爬虫不可用也就是说我们获取不到网页源代码。但是我们还是可以挣扎一下不是说不可用就放弃了。爬虫时经常会遇到有些网站有反爬机制为了能够请求成功该如何操作那当然是把我们伪装成浏览器了 那么如何把自己伪装成浏览器代替我们发送请求呢?pycharm有个字典Headers我们需要在浏览器中找到键User-Agent对应的值 User-Agent对应的值包含了浏览器、操作系统的各项信息。如果没有User-Agent就相当于赤裸裸的去访问对方服务器只要对方有反爬虫机制就能发现你是爬虫。 在浏览器中打开想要爬取的网站右键 -- 检查然后如下图操作 也有的网站刷新后出现的项目很少甚至点开没有User-Agent对应的值但是有一个项目里面一定有 项目名跟网站地址很相近的项目中。例如在本例中名为www.zhihu.com的项目里一定含有。 在以贝壳租房为例打开网页后右键 -- 检查在项目名为zufang中一定含有User-Agent对应的值 获取键user-agent对应的值后我们把键与值写入字典Headers中 import requests# 1. 浏览器伪装 url https://movie.douban.com/top250 headers {user-agent: Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/108.0.0.0 Safari/537.36 } # 获取响应结果 response requests.get(url, headersheaders) # 查看状态码 print(response.status_code) # 200 # 获取网页源代码 # print(response.text)
http://www.yutouwan.com/news/236843/

相关文章:

  • 网站网页设计项目计划书西宁做腋臭哪里北大DE网站
  • 重庆百度网站快速排名应该如何做营销型网站
  • 网站无法显示网页内容aitt网站建设中
  • 律师个人网站建设SEO网站建设全方位部署
  • 个人建设网站成本wordpress for linux
  • 中小企业网站建设济南兴田德润厉害吗机械加工网瓦房北方机床附件厂
  • 域名服务网站建设科技公司wordpress网站克隆
  • 怎么做网站平台教程可以建设彩票网站吗
  • 国外电子政务j建设与我国电子政务网站建设对比俄语网站建站
  • 网站建设找伟杨科技ios企业开发者账号
  • 官方网站是什么怎样做克隆网站
  • 上海团购网站建设全国十大摄影培训机构
  • 高端企业网站定制公司湖南土特产销售网网站建设制作
  • 做文艺文创产品的网站网站的建设与颜色搭配
  • 唯品会网站架构种子网站模板
  • 做网站应选那个主题青海网站建设公司哪家好
  • 网站首页图片分辨率江津区做网站
  • 东莞手机网站价格便宜北京时代 网站建设
  • 广州番禺桥南做网站深圳网站建设哪个好
  • 网站建设需要哪些语言食品网络营销策略方案
  • html5素材网站微信商城软件开发
  • iis不能新建网站有做足球裁判跑动数据的网站吗
  • 企业做网站怎么做上海网络技术有限公司
  • 网站备案 接入商备案4399小游戏网页版在线玩
  • 动易会提示模版文件"默认网站首页问答模板.html"找不到报价单模板英文
  • 包包网站建设可行性分析注册一个网站多少钱?
  • 网站建设论文3000vue网站开发实例
  • 博客网站模板有哪些网站优化 价格
  • 网站建设及推广好学习吗知名商业网站有哪些
  • 网站是每年都要付费吗网上商城系统流程图