当前位置: 首页 > news >正文

移动端网站设计制作深圳网站建设公司报价单

移动端网站设计制作,深圳网站建设公司报价单,酒店网站设计,怎样打小广告最有效一月份的时候有写过一篇文章#xff0c;是关于如何解析网站#xff0c;然后将图片下载下来#xff0c;爬虫爬取美女图片存入到动态的文件夹中 今天主要总结的是爬虫的一个基本思路#xff0c;主要有#xff1a; 1.获取一个网页get_one_page() 我们知道一个网页可能由多个…一月份的时候有写过一篇文章是关于如何解析网站然后将图片下载下来爬虫爬取美女图片存入到动态的文件夹中 今天主要总结的是爬虫的一个基本思路主要有 1.获取一个网页get_one_page() 我们知道一个网页可能由多个参数构成我们可以传参进去。 2.分析一个网页获取有用的信息parse_one_page()或者获取图片下载save_one_image() 我们可以通过正则表达式或者第三方插件BeautifulSoup或者其他插件解析html文件然后获取自己有用的信息 3.将获取的信息存储起来 当我们获取到了我们需要的信息后我们可以存储到Excle,TXT,CSV,或者数据库中 4.main()函数处理流程 我们可以通过一个主流程函数传入参数进行逻辑处理然后传参数到get_one_page()parse_one_page()最后存储起来。   下面我们通过一个列子解释一下 #作者cacho_37967865 #博客https://blog.csdn.net/sinat_37967865 #文件getBeauty.py #日期2018-05-13 #备注get_one_page()函数传参控制url并转化为可解析内容save_one_image()函数获取图片路径并下载文件main()函数进行传参循环下载图片 # F:\python_env\PaChong_env # -*- coding: utf-8 -*-import os import requests import urllib.request from urllib.parse import urlencode from bs4 import BeautifulSoup from tqdm import tqdmdef get_one_page(beauty,page):paras {id : beauty, #某个美女的idmm : page #每个美女有多张图片每张对应一页}headers {User-Agent: Mozilla/5.0 (Windows NT 6.1; WOW64; rv:23.0) Gecko/20100101 Firefox/23.0}url http://www.xingmeng365.com/articles.asp? urlencode(paras)# 获取网页内容返回html数据response requests.get(url, headersheaders)response.encoding gb2312print(当前爬取的网址为 url)return response.textdef save_one_image(html,path,id,mm):soup BeautifulSoup(html,lxml)for link in soup.find_all(img):if /upload/image in link.get(src):image_url link.get(src)if id 6:image_url http://www.xingmeng365.com/ image_url[6:]else:image_url http://www.xingmeng365.com/ image_url[1:] # id7以后[6:]改为[1:]fileName soup.find(h1).get_text()os.chdir(path)image_path str(id) - str(fileName)if not os.path.exists(image_path):print(开始创建文件夹 str(fileName))os.makedirs(image_path)os.chdir(image_path)print(开始下载第 str(mm) 张图片 image_url)# 可以自定义命名图片名称好检索file open(str(id) - str(mm) .jpg, wb)req urllib.request.Request(urlimage_url)try:image urllib.request.urlopen(req, timeout20)pic image.read()except Exception as e:print(第 str(mm) 张图片访问超时下载失败 image_url)continuefile.write(pic)print(第 str(mm) 张图片下载成功)file.close()def main(start_id,end_id,page,path):for id in tqdm(range(start_id,end_id)):for mm in range(1,page):html get_one_page(id,mm)save_one_image(html,path,id,mm)if __name__ __main__:main(124, 760, 60, F:\Lingwei\AllPhoto)
http://wiki.neutronadmin.com/news/197490/

相关文章:

  • 拓者设计吧网站做网站需要租服务器吗
  • 盱眙网站建设公司网站开发中为什么有两个控制层
  • 网站使用标题做路径做网站需要缴什么费用
  • jsp网站开发遇到问题区网站开发语言
  • 网站建设 微信营销郑州网站建设哪家
  • 申请一个域名可以做多少网站个人如何注册网站
  • 太原网站建设优化网站被黑 百度跳转
  • 亚马逊如何做站外促销网站网站开发在线课程
  • 123883网站长沙有什么好玩的室内场所
  • seo企业站收录网站结构优化建议
  • 东莞长安网站辽宁移动和生活app下载
  • 做网站是什么会计科目google官网入口下载
  • 建设网站客户资源从渠道来快速网站轻松排名
  • 餐饮类网站建设达到的作用app展示网站模板html
  • 学做网站论坛插件廊坊做网站费用
  • 建设网站企业运营网站开发模版
  • 做海关授权的网站自己做网站怎样挣钱
  • 访问国外的网站很慢直播视频下载
  • 营销型网站建设优势微信公众平台开发源码
  • 郑州网站推广优化报价硅云网站建设视频
  • 和动物做的网站吗公司网站怎么管理
  • 网站编辑是个长期做的工作吗网站做
  • 向网站服务器上传网页文件下载浙江建设
  • 学院网站建设的现状分析网站制作论文总结
  • 登封做网站推广广东省建设项目安全标准自评网站
  • ps做ppt模板怎么下载网站网站备案查询官网
  • 安庆怀宁网站建设兼职微墨小程序制作平台
  • 重庆网站推广营销代理安徽网络技术服务推广
  • 萧山中兴建设有限公司网站wordpress自动建议搜索引擎不抓取
  • 汕头网站建设策划请小组讨论一个完整的网页设计流程