当前位置: 首页 > news >正文

在线设计 网站源码知名品牌设计公司

在线设计 网站源码,知名品牌设计公司,百度搜索引擎,网页游戏排行榜2022前十名竞技类游戏一.最终效果 二.项目代码 2.1 新建项目 本文使用scrapy分布式、多线程爬虫框架编写的高性能爬虫#xff0c;因此新建、运行scrapy项目3步骤#xff1a; 1.新建项目: scrapy startproject weibo_hot 2.新建 spider: scrapy genspider hot_search weibo.com 3…一.最终效果 二.项目代码 2.1 新建项目 本文使用scrapy分布式、多线程爬虫框架编写的高性能爬虫因此新建、运行scrapy项目3步骤 1.新建项目: scrapy startproject weibo_hot 2.新建 spider: scrapy genspider hot_search weibo.com 3.运行 spider: scrapy crawl hot_search 注意hot_search 是spider中的name 4.编写item class WeiboHotItem(scrapy.Item):index scrapy.Field()topic_flag scrapy.Field()icon_desc_color scrapy.Field()small_icon_desc scrapy.Field()small_icon_desc_color scrapy.Field()is_hot scrapy.Field()is_gov scrapy.Field()note scrapy.Field()mid scrapy.Field()url scrapy.Field()flag scrapy.Field()name scrapy.Field()word scrapy.Field()pos scrapy.Field()icon_desc scrapy.Field() 5.编写爬虫解析代码 import os from itemadapter import ItemAdapter from .settings import DATA_URI from .Utils import Tooltool Tool()class WeiboHotPipeline:def open_spider(self, spider):self.hot_line index,mid,word,label_name,raw_hot,category,onboard_time\ndata_dir os.path.join(DATA_URI)file_path data_dir /hot.csv#判断文件夹存放的位置是否存在不存在则新建文件夹if os.path.isfile(file_path):self.data_file open(file_path, a, encodingutf-8)else:if not os.path.exists(data_dir):os.makedirs(data_dir)self.data_file open(file_path, a, encodingutf-8)self.data_file.write(self.hot_line)def close_spider(self, spider): # 在关闭一个spider的时候自动运行self.data_file.close()def process_item(self, item, spider):try:hot_line {},{},{},{},{},{},{}\n.format(item.get(index, ),item.get(mid, ),item.get(word, ),item.get(label_name, ),item.get(raw_hot, ),tool.translate_chars(item.get(category, )),tool.get_format_time(item.get(onboard_time, )),)self.data_file.write(hot_line)except BaseException as e:print(hot错误在这里, e, 错误在这里)return item 三.注意事项 settings.py配置项修改 # Obey robots.txt rules ROBOTSTXT_OBEY False # 关闭否则根据weibo的爬虫策略爬虫无法获取数据 如果 四.运行过程 五.项目说明文档 六.获取完整源码 爱学习的小伙伴本次案例的完整源码已上传微信公众号“一个努力奔跑的snail”后台回复 热搜榜 即可获取。
http://wiki.neutronadmin.com/news/143444/

相关文章:

  • 做设计去那些网站找素材wordpress登录页面logo删除
  • 网站建设方案设计书参考优化网站服务
  • 网站做弹幕广告新网店怎么免费推广
  • 网站建设专家有哪些数据库调用做wordpress
  • 哪个网站能看到医生做的全部手术wordpress 获取图片
  • 宁波正规网站建设方式湖州市住房和城乡建设局官方网站
  • 沧州网站制作费用免费网页代码大全
  • 网站首页设计与制作中国做网站的网站
  • 网站搜索引擎推广怎么做宁波专业网站建设模板服务
  • 公司网站的建设心得国外网站做调查
  • 网站建设中的html页面信誉好的菏泽网站建设
  • 有帮忙做儿童房设计的网站吗中国造价工程建设监理协会网站
  • 做网站郑州汉狮佛山全网营销型网站建设
  • 网站服务器租用和托管自学网站建设看什么书
  • 网站后台账户密码广州网站设计公司推荐哪家
  • 怎么制作网站导航页wordpress djiango
  • 在山东省建设监理协会网站中山外贸网站建设报价
  • 福田欧曼est前四后八seo百度推广
  • 成品源码网站东莞app开发定制
  • 特色美食网站建设苏州专业做网站公司有哪些
  • 百度网站地图制作片多多可以免费看电视剧吗
  • 公司做网站可以永久买断吗赣州做网站建设
  • win7怎么做网站服务器吗网站建设维护与推广
  • 网站模板大全 优帮云查企业下载什么软件
  • 平顶山市网站建设广告设计服务
  • 公司做网站价格泰州做网站哪家好
  • 河北网站建设seo优化济宁教育平台网站建设
  • flarum wordpressseo推广手段
  • 白鹭引擎做网站网站运营与网络推广方案
  • 建网站没有公司地址怎么办杭州哪家做外贸网站好