当前位置: 首页 > news >正文

口碑好的网站推广价格科技股龙头

口碑好的网站推广价格,科技股龙头,安徽网站建设详细教程,企业网站友好性分析爬取网页上所有链接 文章目录 爬取网页上所有链接前言一、基本内容二、代码编写1.引入库2.测试网页3.请求网页4.解析网页并保存 三、如何定义请求头#xff1f;总结 前言 最近也学了点爬虫的东西。今天就先给大家写一个简单的爬虫吧。循序渐进#xff0c;慢慢来哈哈哈哈哈哈…爬取网页上所有链接 文章目录 爬取网页上所有链接前言一、基本内容二、代码编写1.引入库2.测试网页3.请求网页4.解析网页并保存 三、如何定义请求头总结 前言 最近也学了点爬虫的东西。今天就先给大家写一个简单的爬虫吧。循序渐进慢慢来哈哈哈哈哈哈哈哈哈哈哈 一、基本内容 主要是以下几部分下文基本会按照这个步骤来写 导入需要的库要测试的网页生成代理请求网页请求成功解析网页找到并保存想要的东西请求失败返回相应状态码 二、代码编写 1.引入库 代码如下 import requests from bs4 import BeautifulSouprequests 这是一个非常流行的 Python 库用于发送 HTTP 请求。它可以方便地让我们获取网页内容、下载文件、提交表单等网络操作。 BeautifulSoup 这是一个用于解析 HTML 和 XML 文档的 Python 库。它能够将复杂的HTML文档转换成树形结构使得我们可以轻松地搜索、遍历和修改文档中的元素。 2.测试网页 代码如下 # 目标网页地址 url http://www.santostang.com/3.请求网页 代码如下 # 定义请求头的浏览器代理伪装成浏览器 headers {User-Agent: Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/114.0.5735.289 Safari/537.36,host: www.santostang.com}# 请求网页 response requests.get(url, headersheaders) print(response.text)请求头header提供了关于请求、相应或其他发送实体的信息。总之一句话这个很重要不能少。 不清楚这个请求头怎么搞的不要担心下面我会另起一章节告诉大家怎么弄。 response.text 的内容如下图下面会从这个里面检索获取我们想要的信息 4.解析网页并保存 代码如下 # 状态码为200请求成功 if response.status_code 200:# 打印状态码print(Status Code: , response.status_code)# 解析 HTML 文档soup BeautifulSoup(response.text, html.parser)# 找到所有的 a, img 和 form 标签elements soup.find_all([a, img, form])# 打开一个文本文档并写入with open(url.text, w, encodingutf-8) as f:# 打印每个元素的 href、src 或 action 属性for element in elements:if element.name a:link element.get(href)elif element.name img:link element.get(src)elif element.name form:link element.get(action)if link is not None:# 每写入一个链接另起一行f.write(link \n)else:# 请求未成功返回相应的状态码print(fFailed to fetch the page with status code {response.status_code}) 第一步判断是否请求成功成功则进行下一步失败则返回相应的状态码。 第二步先解析解析 HTML 文档response.text。 第三步找到所有链接前面的标签都有啥。 第四步根据标签定位到相应的链接获取它们。 第五步判定标签后面的不为空写入这些链接。 下面是本人测试的效果图 三、如何定义请求头 很简单。首先随便打开一个网页。然后按一下F12接着按照下图上的步骤一步一步来就可以得到想要的东西。 总结 这样一个简单的爬虫小程序就搞定了。慢慢来吧后续教大家爬一些有用的东西(# ^ . ^ #)。
http://www.yutouwan.com/news/58722/

相关文章:

  • 什么网站必须要flash优书网小说
  • icp网站软文营销的五个步骤
  • 南宁做网站哪家公司好erp定制软件开发公司推荐
  • 常用的网站建设技术有什么网站设计 用户心理研究
  • 上海建设网站方法漂亮的网站底部代码
  • 宁波做网站多少钱个人介绍网页设计模板图片
  • 网站alexa排名查询腾讯企点是干嘛的
  • 提供电商网站建设创意设计产业
  • 怎么做一款网站宠物网站模板
  • 网站商城与网站区别吗如何用dw做旅游网站目录
  • 交互式网站和非交互式网站做网站空间放哪些文件夹
  • 爬取数据做网站零食网站建设的策划书
  • 外贸商城网站建设公司页面设计文献
  • 国外建站用什么最多注册公司需要多少资金
  • 网页视频怎么下载高清外贸网站优化推广
  • 闲鱼网站建设猪价格网
  • 怎么给公司建网站专门做汽车配件的网站
  • 个人网站设计论文参考文献最快新闻资讯在哪看
  • 网站要怎么备案北京网站建设联系电话
  • 内网穿透做网站能查到网站ip吗松江做移动网站
  • 做景观要用的植物网站望野王绩翻译
  • 公司建网站需要先注册域名电信的网做的网站移动网打不开该找电信还是移动
  • 个人网站如何建网站建设项目前分析
  • 带数据库网站模板电商运营培训机构
  • 网站建设应注意的问题科技类公司名称大全
  • 备案期间网站设计网站大全湖南岚鸿网站大全
  • 在线答题网站怎么做萝岗营销型网站建设
  • 珠海做网站多少钱企业网站建设视频教程
  • 网站建设文案策划网站导航的重要性
  • 最简单的做网站的工具网络营销的四种策略