当前位置: 首页 > news >正文

柳州网站建设推荐佛山网吧什么时候恢复营业

柳州网站建设推荐,佛山网吧什么时候恢复营业,公司logo墙设计图片,怎么查询百度收录情况溜达豆瓣的时候#xff0c;发现一些图片#xff0c;懒得一个一个扒#xff0c;之前写过c#和python版本的图片下载#xff0c;因此拿之前的Python代码来改了改#xff0c;折腾出一个豆瓣版本#xff0c;方便各位使用 # -*- coding:utf8 -*- import urllib2, urllib, socke…  溜达豆瓣的时候发现一些图片懒得一个一个扒之前写过c#和python版本的图片下载因此拿之前的Python代码来改了改折腾出一个豆瓣版本方便各位使用 # -*- coding:utf8 -*- import urllib2, urllib, socket import re import requests from lxml import etree import os, timeDEFAULT_DOWNLOAD_TIMEOUT 30class AppURLopener(urllib.FancyURLopener):version Mozilla/4.0 (compatible; MSIE 6.0; Windows NT)def check_save_path(save_path):if not os.path.exists(save_path):os.makedirs(save_path)def get_image_name(image_link):file_name os.path.basename(image_link)return file_namedef save_image1(image_link, save_path):file_name get_image_name(image_link)file_path save_path \\ file_nameprint(准备下载{0} 到{1}.format(image_link, file_path))try:urllib._urlopener AppURLopener()socket.setdefaulttimeout(DEFAULT_DOWNLOAD_TIMEOUT)urllib.urlretrieve(urlimage_link, filenamesave_path)return Trueexcept Exception, ex:print(ex.args)print(下载文件出错:{0}.format(ex.message))return Falsedef save_image(image_link, save_path):file_name get_image_name(image_link)file_path save_path \\ file_nameprint(准备下载{0} 到{1}.format(image_link, file_path))try:file_handler open(file_path, wb)image_handler urllib2.urlopen(urlimage_link, timeoutDEFAULT_DOWNLOAD_TIMEOUT).read()file_handler.write(image_handler)return Trueexcept Exception, ex:print(下载文件出错:{0}.format(ex.message))return Falsedef get_thumb_picture_link(thumb_page_link):try:html_content urllib2.urlopen(urlthumb_page_link, timeoutDEFAULT_DOWNLOAD_TIMEOUT).read()html_tree etree.HTML(html_content)# print(str(html_tree))link_tmp_list html_tree.xpath(//div[classphoto_wrap]/a[classphotolst_photo]/img/src)page_link_list []for link_tmp in link_tmp_list:page_link_list.append(link_tmp)return page_link_listexcept Exception, ex:print(ex.message)return []def download_pictures(album_link, min_page_id, max_page_id, picture_count_per_page, save_path):check_save_path(save_path)min_page_id 0while min_page_id max_page_id:thumb_page_link album_link ?start{0}.format(min_page_id * picture_count_per_page)thumb_picture_links get_thumb_picture_link(thumb_page_link)for thumb_picture_link in thumb_picture_links:full_picture_link thumb_picture_link.replace(photo/lthumb, photo/large)save_flag save_image(image_linkfull_picture_link, save_pathsave_path)if not save_flag:full_picture_link thumb_picture_link.replace(photo/thumb, photo/photo)save_image(image_linkfull_picture_link, save_pathsave_path)time.sleep(1)min_page_id 1print(下载完成)# 设置图片保存的本地文件夹 save_path J:\\douban\\gugu # 设置相册地址注意以反斜杠结尾 album_link https://www.douban.com/photos/album/1625969357/ # 设置相册总页数 max_page_id 11 # 设置每页图片数量默认为18张 picture_count_per_page 18download_pictures(album_linkalbum_link,min_page_id1,max_page_idmax_page_id,picture_count_per_pagepicture_count_per_page,save_pathsave_path)   相对urllib2来说urllib 真的比较坑如果不设置User-Agent下载速度会超慢无比另外还需要调用socket模块来设置超时时间比较折腾最终可能还会踩到其他坑里去比如我下着下着就被豆瓣给‘屏蔽’啦so建议使用urllib2。 相关参考链接 http://www.jb51.net/article/57239.htm http://www.crifan.com/use_python_urllib-urlretrieve_download_picture_speed_too_slow_add_user_agent_for_urlretrieve/comment-page-1/ 国庆最后一天祝各位国庆快乐
http://wiki.neutronadmin.com/news/274442/

相关文章:

  • 互联网信息服务 网站备案wordpress开发cms
  • 华为公司网站建设案例分析深圳企业网站建设设计
  • 手机做logo用什么网站绵阳网站建设
  • 口碑好的秦皇岛网站建设哪家好网站首页横版图怎么做
  • 网站建设套模板视频信誉好的镇江网站优化
  • 组建网站寮步做网站公司
  • 做网站一定要用服务器吗门户网站系统建设方案
  • 门户网站的特点做电影网站如何不侵权
  • 网站怎么做免费seo搜索sns营销
  • 网站建设技能描述烟台网站建设 共赢
  • 哈尔滨网站建设赚钱么asp装修公司网站源码
  • 天津河东做网站公司个人公众号怎么做文章推广
  • 免费永久网站空间岳阳建设公司网站
  • 网站限定域名自助建站和wordpress
  • 开发网站的基本过程漫画WordPress
  • 个人网站建设思路网络建站招聘
  • 关于淘宝店网站建设的可行性报告大连手机自适应网站建设
  • 石碣网站仿做安徽六安地图
  • 网站开发网站加载慢企业网站建设实验报告
  • 做旅游网站多少钱做pc端网站精英
  • 小说网站风格网站主持人制作方法
  • 刷网站百度关键词软件广州英文外贸seo网站优化
  • 凡科网做网站花多少钱php做网站麻烦吗
  • 2016企业网站建设合同开贴纸网站要怎么做
  • 营销型网站开发公司wordpress更新报错
  • 做网站费用会计科目网站的风格有哪些
  • 公司做网站的费用怎么入账广西网站建设开发
  • 深圳建网站哪个公司微商代运营公司
  • 网站建设项目延期验收申请报告制作一个网站的一般步骤
  • 昆山专业网站建设公司韩国外贸网站