当前位置: 首页 > news >正文

做网站工作内容内蒙古市最新新闻

做网站工作内容,内蒙古市最新新闻,vps云主机可以做网站,wordpress 页面重定向Web Spider Python 如何访问互联网 URL lib --urllib URL的一般格式为 protocol://hostname[:port] / /path /[;parameters][?query]#fragment#xff0c;其中[]为可选项 URL由三部分组成 第一部分是协议 第二部分是存放资源的服务器的域名系统或IP地址#xff08;有时…Web Spider Python 如何访问互联网 URL lib --urllib URL的一般格式为 protocol://hostname[:port] / /path /[;parameters][?query]#fragment其中[]为可选项 URL由三部分组成 第一部分是协议 第二部分是存放资源的服务器的域名系统或IP地址有时候要包含端口号各种传输协议都有默认的端口号 第三部分是资源的具体地址如目录或文件名 urllib是python的一个包 下面这个程序展示了获取百度新闻页面的网页数据的程序 importurllib.request response urllib.request.urlopen(http://news.baidu.com/) htmlresponse.read() html html.decode(utf-8)print(html) 获得的response是二进制的所以需要通过utf-8解码 练习   从placekitten上保存一张猫猫的图片 importurllib.request response urllib.request.urlopen(http://placekitten.com/g/500/600) cat_imgresponse.read() with open(cat_500_600.jpg,wb) as f:f.write(cat_img) 首先urlopen的参数 可以是一个字符串 也可以是一个request 对象 因此代码也可以写作把Request实例化 importurllib.request req urllib.request.Request(http://placekitten.com/g/500/600) responseurllib.request.urlopen(req) cat_imgresponse.read() with open(cat_500_600.jpg, wb) as f:f.write(cat_img) Python提交POST表单访问有道翻译 爬有道词典但是没有成功原因是有道翻译添加了反爬机制salt和sign。 importurllib.requestimporturllib.parse url1 http://fanyi.youdao.com/translate_o?smartresultdictsmartresultruledata {i: 你好!, type: AUTO, doctype: json, version: 2.1, keyfrom: fanyi.web, ue: UTF-8,typoresult: true} data urllib.parse.urlencode(data).encode(utf-8) #把data编码 response urllib.request.urlopen(url1, data) #发出请求得到相应 html response.read().decode(utf-8) #read之后得到的是utf-8的格式解码成Unicode的形式 print(html) Request 有一个heads的参数heads的格式是字典 修改heads可以通过两个方式修改 1.通过Request的headers参数修改 2.通过Request.add_header()方法修改 为了使爬虫更像人类可以通过 1.time来控制时间戳限制单位时间内IP的访问次数 import time ... time.sleep(5) 2.代理 通过代理去访问服务器 1.参数是一个字典{‘类型’ ‘代理ip端口号’} proxy_support urllib.request.ProxyHandler({}) 2.定制一个opener opener urllib.request.build_opener(proxy_support) 3.1.安装opener urllib.request.install_opener(opener) 3.2.调用opener opener.open(url) 教程使用的网站现在都设置了复杂的反爬机制了所以运行没有成功。 importurllib.request url http://www.whatismyip.com.twproxy_support urllib.request.ProxyHandler({http: 221.122.91.66:80}) openerurllib.request.build_opener(proxy_support) opener.addheaders {User-Agent, Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/84.0.4147.105 Safari/537.36} urllib.request.install_opener(opener) responseurllib.request.urlopen(url) html response.read().decode(utf-8)print(html)
http://wiki.neutronadmin.com/news/265485/

相关文章:

  • 抢注域名网站怎么弄一个电商平台
  • 看优秀摄影做品的网站培训网站建设公司排名
  • 如何创建一个论坛网站莱芜网络推广公司电话
  • 用jsp做一网站的流程品牌建设方案的完整纲要
  • 设计网站都有什么北京市网站公司网站
  • 漳州城乡建设局网站首页哪些经营范围可以开网站建设费用
  • 密云城市建设官方网站营销策划网站
  • 手机网站制作教程软件网络购物系统参考文献
  • 常德市建设工程造价网站网站后台管理规定
  • 南阳网站开发公司广州 网站优化
  • h5开发环境济南网站优化排名推广
  • 宣城市建设监督管理局网站首页完整的营销策划方案
  • 智慧团建团员登录网站网站 域名解析出错
  • 江苏建设行业证书编号查询网站电商公司组织架构图
  • 商城网站服务器租用视频制作流程
  • 建设通网站怎么注销微信小程序开发介绍
  • 会展相关网站建设柳州市建设中心网站首页
  • seo包括网站建设吗福建厦门网站建设公司
  • 建设一个旅游网站网络营销心得体会
  • 网站建设项目的工期计划英文网站建设合同
  • 大眼睛网站建设html个人博客完整代码
  • 大企业网站建设方案中国互联网前100名企业
  • 上海哪里有做网站的软件开发需要学什么知识
  • dede多个网站怎么做怎样在百度上做推广网站
  • 潍坊网站制作在线网站所有者是什么意思
  • 免费制作永久网站医院网站主页面设计
  • 大图网 网站网站上传百度多久收录
  • 广州企业网站建设公司哪家好施工企业项目负责人现场带班时间
  • 青岛手机网站建设包头市做网站公司
  • 三只松鼠电商网站建设利用wordpress实现分类筛选