当前位置: 首页 > news >正文

哇哈哈电子商务网站建设策划书南宁网约车租赁公司

哇哈哈电子商务网站建设策划书,南宁网约车租赁公司,自带浏览器建设银行网站打不开,山东神华网站建设RT#xff0c;最近在学scrapy#xff0c;写了一个简单的爬取网页数据的爬虫#xff0c;利用CrawlProcess单次调用执行的时候没有问题#xff0c;脚本如下#xff0c;就是清空数据表然后爬取数据#xff1a; class updateBoardData: def __init__(self): self.db connect…RT最近在学scrapy写了一个简单的爬取网页数据的爬虫利用CrawlProcess单次调用执行的时候没有问题脚本如下就是清空数据表然后爬取数据 class updateBoardData: def __init__(self): self.db connectMYSQL() def update(self): sql truncate table board_data; con self.db.connect() cursor con.cursor() cursor.execute(sql) con.commit cursor.close() con.close() print truncated process CrawlerProcess(settingsget_project_settings()) process.crawl(board_spider) process.start() 虽然单次执行没问题但是在每日定时执行的脚本里调用这个类却出错了每日执行的脚本如下大意就是第一次执行爬虫后每天凌晨0点定时执行爬虫 SECONDS_PER_DAY 24 * 60 * 60 upd updateBoardData() while True: upd.update() print datetime.now() print nnnn cur_time datetime.now() descTime cur_time.replace(hour 0, minute 0, second 0, microsecond 0) delaytime cur_time - descTime skipSeconds SECONDS_PER_DAY - delaytime.total_seconds() time.sleep(skipSeconds) 第一次调用该脚本会执行一次爬虫程序但是等到0点的时候再次调用爬虫却报错了报错信息为 twisted.internet.error.ReactorNotRestartable 去查了一下twisted框架发现在twisted中reactor是单例模式可能我在重复使用CrawlProcess的时候创建多个reactor实例于是修改了一下爬虫的调用脚本测试了一下只用单个实例来爬虫修改后的代码如下 class updateBoardData: def __init__(self): self.db connectMYSQL() self.process CrawlerProcess(settingsget_project_settings()) self.process.crawl(board_spider) def update(self): con self.db.connect() cursor con.cursor() cursor.execute(sql) con.commit cursor.close() con.close() print truncated self.process.start() a updateBoardData() a.update() print pls wait 5s time.sleep(5) a.update() 直接跑这个脚本发现第一次执行函数没有问题但是第二次执行函数的时候知识清空了数据表而爬虫程序却没有执行。执行的结果如下 2017-01-19 15:40:47 [scrapy] INFO: Spider closed (finished) pls wait 5s truncated 到此我的思路就卡住了想不出问题处在哪里定时执行scrapy爬虫应该是一个很常见的功能可能是我的思路的方向错了到底要怎样才能每天定时执行一个爬虫呢 有没有人对Scrapy比较熟悉的能够给一点意见吗
http://wiki.neutronadmin.com/news/342972/

相关文章:

  • 建设银行官方网站广州企业网站需求方案
  • access网站开发wordpress 仿百度百家
  • 个人做网站 优帮云企业被网站收录
  • 中国电信 网站备案想招聘员工去哪个网站
  • 颍上县建设局网站wordpress迁移器
  • 产品备案号查询平台官网如何做seo网站
  • 西安 网站开发 招聘wordpress 大数据量查询
  • wap网站一览阿里云 wordpress 博客
  • 网站源码和模板如果管理多个wordpress
  • 开发建设网站需要什么人才网站的建设服务
  • 宁波网站建设托管用ip访问没有备案的网站
  • 佛山市桂城建设局网站网页的构成
  • 昆明网站建设建站模板网站设计计划书的要求
  • 设计师个人网站怎么做网站关键字可以修改吗
  • 在线做交互网站高德地图上怎么没有菲律宾
  • 站长要维护网站wordpress 面包屑插件
  • 专业做网站 台州玉环做个简单的导航网站
  • 网站模板在线预览免费企业信息发布平台
  • 网站规划文字说明网站用动态图片做背景怎么写
  • 做外贸怎么登陆国外网站深圳一元购网站建设
  • 烟台正规网站建设浙江房产信息网查询
  • 电商网站建设过程域名评估价格平台
  • 做网站最便宜西安建设工程招投标信息网
  • 房产网站电商怎么做手机软件app制作工具
  • 百度网站禁止访问怎么解除新加坡的网站域名
  • 网站建设山东聚搜网络微信公众号平台及网站建设计划
  • 档案网站的建设北京做网站推广
  • 禁止ip直接打开网站外贸平台网站的营销方式
  • 青岛大型网站建设鞋子网站建设规划书
  • 沧州门户网站wordpress修改字体加载