当前位置: 首页 > news >正文

网站建设入什么会计科目上海建设工程检测网

网站建设入什么会计科目,上海建设工程检测网,做网站设计的,广州个人网站建设前天给大家分享了如何利用Python网络爬虫爬取微信朋友圈数据的上篇#xff08;理论篇#xff09;#xff0c;今天给大家分享一下代码实现#xff08;实战篇#xff09;#xff0c;接着上篇往下继续深入。一、代码实现1、修改Scrapy项目中的items.py文件。我们需要获取的数…前天给大家分享了如何利用Python网络爬虫爬取微信朋友圈数据的上篇理论篇今天给大家分享一下代码实现实战篇接着上篇往下继续深入。一、代码实现1、修改Scrapy项目中的items.py文件。我们需要获取的数据是朋友圈和发布日期因此在这里定义好日期和动态两个属性如下图所示。2、修改实现爬虫逻辑的主文件moment.py首先要导入模块尤其是要主要将items.py中的WeixinMomentItem类导入进来这点要特别小心别被遗漏了。之后修改start_requests方法具体的代码实现如下图。3、修改parse方法对导航数据包进行解析代码实现稍微复杂一些如下图所示。l需要注意的是从网页中获取的response是bytes类型需要显示的转为str类型才可以进行解析否则会报错。l在POST请求的限定下需要构造参数需要特别注意的是参数中的年、月和索引都需要是字符串类型的否则服务器会返回400状态码表示请求参数错误导致程序运行的时候报错。l在请求参数还需要加入请求头尤其是Referer反盗链务必要加上否则在重定向的时候找不到网页入口导致报错。l上述的代码构造方式并不是唯一的写法也可以是其他的。4、定义parse_moment函数来抽取朋友圈数据返回的数据以JSON加载的用JSON去提取数据具体的代码实现如下图所示。5、在setting.py文件中将ITEM_PIPELINES取消注释表示数据通过该管道进行处理。6、之后就可以在命令行中进行程序运行了在命令行中输入scrapy crawl moment -o moment.json之后可以得到朋友圈的数据在控制台上输出的信息如下图所示。7、尔后我们得到一个moment.json文件里面存储的是我们朋友圈数据如下图所示。8、嗯你确实没有看错里边得到的数据确实让人看不懂但是这个并不是乱码而是编码的问题。解决这个问题的方式是将原来的moment.json文件删除之后重新在命令行中输入下面的命令scrapy crawl moment -o moment.json -s FEED_EXPORT_ENCODINGutf-8此时可以看到编码问题已经解决了如下图所示。下一篇文章小编带大家将抓取到的朋友圈数据进行可视化展示敬请关注~~
http://wiki.neutronadmin.com/news/31946/

相关文章:

  • 网站开发模板下载搭建影视网站
  • 基本建筑网站中山市网站建设
  • 企业手机网站建设渠道高新区免费网站建设
  • 学做网站论坛 可以吗oppo应用商店官网
  • 直播网站源码免费下载网站开发设计协议
  • vs2010网站开发实例有创意广告店名字大全
  • 网站开发w亿玛酷1流量订制ps做网站界面
  • 重庆公积金门户网站国内最炫酷的网站
  • 网站做优化多少钱兴文县建设工程网站
  • 梅州市网站制作点餐小程序模板
  • 做网站是需要多少钱wordpress无编辑栏
  • 全影网的网站哪儿做d应用商城app下载
  • 正中路桥建设发展有限公司网站临沂企业宣传片制作公司
  • 手机网站免费优化珠海网站制作费用
  • 秦淮做网站价格企业网络工程建设方案
  • 为什么建设文化馆网站门户网站功能模块
  • 柳州住房和城乡建设局网站群晖wordpress域名
  • 四川建设厅官方网站证书查询企业微信网站开发公司
  • 江干区住房和城乡建设局网站郑州网站建设工作
  • 个人做广播网站需要注意什么镇江建设网站公司
  • 网站排名优化工薪待遇网站建设公司咨询
  • 网站+做+app建大型网站
  • 用ps做网站的网页框架网站建设招标需求
  • 天津品牌网站建设好处欧美网站欣赏
  • 怎么找回网站如何编写网站
  • 安徽网站建设调查报告排名优化公司好不好
  • 广州市建设注册中心网站首页网站建设域名和空间续费
  • 东莞市手机网站建设网站登记备案
  • 作风建设年 网站青岛开发区网站
  • 北京公司建网站一般需要多少钱网站开发与网站设计区别