当前位置: 首页 > news >正文

网站做多长时间才会成功网站建设方案报价费用明细价格

网站做多长时间才会成功,网站建设方案报价费用明细价格,wordpress4.9.8 特别慢,html生成网站思路1. 要获得怎么样的数据2. 找到数据来源3. 模拟浏览器发送请求获得数据4. 处理数据#xff0c;保存数据第一步#xff1a;在这里数据是豆瓣top250中高于指定分数的电影信息信息有#xff1a;名称#xff0c;评分#xff0c;格言第二步#xff1a;数据在网页html中保存数据第一步在这里数据是豆瓣top250中高于指定分数的电影信息信息有名称评分格言第二步数据在网页html中这里我使用xpath语法分析htm代码提取数据即可当然也有其它方法比如找出页面请求的数据包抓包分析找出数据来源故猜测第k页的url只需start为25*(k-1)所以我们枚举url提取有效的数据。第三步获得网页源码是一般是发送get请求。故制定请求头找到url模拟浏览器发送数据def GetHelpfulElement(Html,socre):#根据html代码获得希望的element列表Xpathr//div[ classitem]//div[ classstar]/span[2][text(){}]/../../...format(socre)HtmlElementetree.HTML(Html)return HtmlElement.xpath(Xpath)def GetHtml(url):#根据url获得html字符串Headers{User - Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/71.0.3578.98 Safari/537.36}resprequests.get(url,headersHeaders)return resp.content.decode()最后一步就是代码了数据保存在date文件。mport requestsfrom lxml import etreefrom pprint import pprintimport re目的:爬取豆瓣top250中 评分高于指定值的电影名字导演演员信息评分。urlhttps://movie.douban.com/top250?start{}25的增加10次即可针对每个html字符串用xpath语法进行处理1.找出符合条件的element元素2.对element元素进行信息提取成字典形式3.把每一页的信息整理成一个列表追加即可def GetHelpfulElement(Html,socre):#根据html代码获得希望的element列表Xpathr//div[ classitem]//div[ classstar]/span[2][text(){}]/../../...format(socre)HtmlElementetree.HTML(Html)return HtmlElement.xpath(Xpath)def GetHtml(url):#根据url获得html字符串Headers{User - Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/71.0.3578.98 Safari/537.36}resprequests.get(url,headersHeaders)return resp.content.decode()def HandleList(Mylist):#处理xpath的获得的列表 返回第一个否则返回Nonereturn Mylist[0] if len(Mylist)!0 else Nonedef ElementToDict(Element):#一个elemengt信息转化为dictret{}htmletree.tostring(Element,encodingutf-8).decode()Elementetree.HTML(html)#不知道为什么只有这样每次函数得到的信息才不同RatingXpathr//span[classrating_num]/text()TitleXpathr//a/span[classtitle]/text()QuoteXpathr//span[classinq]/text()ret[rating:num]HandleList(Element.xpath(RatingXpath))ret[title] HandleList(Element.xpath(TitleXpath))ret[quote] HandleList(Element.xpath(QuoteXpath))return retdef ElementlistToDictlist(Elementlist):#element列表转化为有用的dict列表Mylist[]for i in Elementlist:Mylist.append(ElementToDict(i))return Mylistdef Save(Mydict):#保存一条信息Keylist [title, rating:num, quote]NameList [名称, 评分, 格言]with open(date.txt,a,encodingutf-8) as fp:for i in range(len(Keylist)):fp.write(NameList[i])fp.write( : )fp.write(Mydict[Keylist[i]] if Mydict[Keylist[i]]!None else )fp.write(\n)fp.write(\n)def run(score):#实现主要逻辑TempUrl rhttps://movie.douban.com/top250?start{}Dictlist []for numbers in range(10):Url TempUrl.format(numbers * 25)ElementList GetHelpfulElement(GetHtml(Url), score)TempDictList ElementlistToDictlist(ElementList)global totaltotallen(TempDictList)for i in TempDictList:Save(i)if __name__ __main__:RatingNumfloat(input(请输入最低评分:))total0print(请稍等...)run(RatingNum)print(共有,total,个结果。)
http://wiki.neutronadmin.com/news/58403/

相关文章:

  • 邵东微网站建设做网站建设推广好做吗
  • 网络维护这个工作好吗逆冬seo
  • 湖南广源建设工程有限公司网站温州营销网站公司
  • phpcms 手机网站模板私人定制网站建设
  • 有漏洞的网站企业数字化服务平台
  • 网站空间国外那个好网站开发产品描述
  • 网站建设申请理由销售流程八个步骤
  • 广告代理商公司seoaoo
  • 电脑个人网站怎么做怎么提高网站转化率
  • 网站改版规则网站搭建教室
  • 建网站外包游戏开发工程师招聘
  • 怎么做网站流量竞品分析国建设文化艺术协会网站
  • 网站名称和备案如何做百度推广的网站
  • 深圳网站建设q.479185700惠南京建设网站公司哪家好
  • 江西省城乡建设厅网站宁夏建设网站公司
  • 武夷山网站推广一个网站怎么做
  • 青岛网站建设方案维护阿里云服务器建立网站吗
  • 南阳做做网站数字营销实训总结
  • 做网站用phpwordpress ssd hdd
  • 做网站用的各种图标大全网站改版 英文
  • 网站改版的方式网站建设服务器
  • wordpress主题 视频教程深圳seo推广培训
  • 广州网站开发创意设计公司装饰网站的业务员都是怎么做的
  • 百度优化 几个网站内容一样凡科互动登录入口
  • 网站建设合同的性质网站推广话术
  • 阜新建设网站wordpress 查看分类id
  • 整站优化服务鲁权屯网站建设
  • 网站编程电子书app界面设计常用的布局具有哪些
  • 程序员需要考哪些证书网站做seo屏蔽搜索
  • 网站建设高效解决之道网站容易出现的问题吗