当前位置: 首页 > news >正文

佛山建站公司哪家好建网站需要多少钱选苏州聚尚网络

佛山建站公司哪家好,建网站需要多少钱选苏州聚尚网络,新闻头条最新消息30字,wordpress 分块首页爬虫是一种自动化程序#xff0c;能够模拟人类的浏览行为#xff0c;访问网络资源并提取所需数据。它可以通过发送HTTP请求获取网页内容#xff0c;并对网页进行解析和数据提取。 在大多数时候#xff0c;提到爬虫我们就会想到 Python#xff0c;其实 Java 也是可以实现爬…爬虫是一种自动化程序能够模拟人类的浏览行为访问网络资源并提取所需数据。它可以通过发送HTTP请求获取网页内容并对网页进行解析和数据提取。 在大多数时候提到爬虫我们就会想到 Python其实 Java 也是可以实现爬虫的。 Java提供了很多网络编程相关的类库但为了方便我们编写爬虫程序可以引入一些第三方库如HttpClient、Jsoup等。这些库提供了更简洁、易用的接口帮助我们快速实现爬虫功能。  Tips 下方代码中的网址请自行更替图片下载到指定文件夹文件夹需要是存在的图片名称前缀可以自定义程序会自动编号本项目使用 Maven 管理依赖若是不使用 Maven 则需要自行下载 jsoup 的 jar 包 pom 文件 ?xml version1.0 encodingUTF-8? project xmlnshttp://maven.apache.org/POM/4.0.0xmlns:xsihttp://www.w3.org/2001/XMLSchema-instancexsi:schemaLocationhttp://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsdmodelVersion4.0.0/modelVersiongroupIdorg.example/groupIdartifactIdJavaCrawler/artifactIdversion1.0-SNAPSHOT/versionpropertiesmaven.compiler.source8/maven.compiler.sourcemaven.compiler.target8/maven.compiler.target/propertiesdependencies!--Java网络爬虫工具--dependencygroupIdorg.jsoup/groupIdartifactIdjsoup/artifactIdversion1.14.3/version/dependency/dependencies/project完整代码  import org.jsoup.Connection; import org.jsoup.Jsoup; import org.jsoup.nodes.Document; import org.jsoup.select.Elements;import java.io.FileOutputStream; import java.io.IOException; import java.io.InputStream; import java.net.URL; import java.util.ArrayList; import java.util.List;/*** 爬取指定网址上的图片** Tips* 若出现 403 错误则可能是由于“写入”访问被禁止而造成的* 当试图将文件上载到目录或在目录中修改文件但该目录不允许写访问时就会出现此种错误** author 秋玄* version 1.0* since 1.0*/ public class App {public static void main(String[] args) {// 网站地址String site https://xxx.xx.com/;// 图片保存路径String filePath F://test;// 自定义图片名称String fileName img;downloadImg(site,filePath,fileName);}/*** 获取指定网站上所有图片* param website 指定网站的完整域名 包括请求协议例如www.xxx.com* param filePath 图片存放路径 例如F://test* param fileName 图片名称 例如xxx*/private static void downloadImg(String website,String filePath,String fileName) {ListString urlList new ArrayList();try {// 获取网站图片的 src// 连接到指定网站Connection connection Jsoup.connect(website);// 获取网站页面上所有的 DOM 元素Document document connection.get();// 获取所有的 img 元素Elements imgs document.getElementsByTag(img);// 遍历 imgsfor (int i 0; i imgs.size(); i) {// 获取 img 元素的 src 属性String src imgs.get(i).attr(src);// url地址以 “//” 开始需要拼接请求协议if (src.startsWith(//)){src https: src;}// 路径为 空 或 “about:blank” 则不添加到 List 中if (src.length() ! 0 !about:blank.equals(src)) {urlList.add(src);}// 下载图片getImg(urlList,filePath,fileName);}} catch (IOException e) {throw new RuntimeException(e);}}/*** 下载指定 URL 的图片* param imgURL 图片地址的 list 集合* param filePath 图片存放路径* param fileName 图片文件名称*/private static void getImg(ListString imgURL,String filePath,String fileName){InputStream in null;FileOutputStream fos null;// 遍历图片地址 list 集合for (int i 0; i imgURL.size(); i) {try {URL url new URL(imgURL.get(i));in url.openStream();// 拼接文件存放路径及文件名String path appendPath(filePath,fileName,i);// 将图片写入本地fos new FileOutputStream(path);byte[] bytes new byte[1024];int count in.read(bytes);while(count ! -1){fos.write(bytes,0,count);fos.flush();count in.read(bytes);}} catch (IOException e) {throw new RuntimeException(e);}finally {// 释放资源if (in ! null) {try {in.close();} catch (IOException e) {throw new RuntimeException(e);}}if (fos ! null) {try {fos.close();} catch (IOException e) {throw new RuntimeException(e);}}}}}/*** 拼接文件存放路径及文件名* param filePath 文件路径* param fileName 文件名* param i 文件编号* return 文件完整路径* 格式文件路径 文件名称 _ 文件编号 文件后缀.jpg*/private static String appendPath(String filePath,String fileName,Integer i) {return filePath // fileName _ (i 1) .jpg;} }一  叶  知  秋奥  妙  玄  心
http://www.yutouwan.com/news/411322/

相关文章:

  • 对网站二次开发的认识阳江网红打卡地方
  • 济南网站建设系统介绍服务学校网站建设厂家
  • 用花生做网站公司做的局域网网站怎么登陆
  • 东台网站网站建设广州番禺区有什么好玩的地方
  • 表白视频制作网站电商公司运营策略
  • 手机搭建网站工具做网站work什
  • 当下网站建设php宠物用品公司网站源码
  • 安丘网站建设多少钱长沙市制作企业网站公司
  • 东莞长安网站设计怎么知道网站是什么开源做的
  • 购买网站开发服务费入账代运营被骗怎么追回
  • 太原网站优化服务廊坊开发区规划建设局网站
  • 基金管理公司司网站建设要求做毕业设计免费网站建设
  • 浅谈营销型网站建设的市场费用瑞安公司做网站
  • 建站资源免费镇江网站建设制作方案
  • wordpress视频网站上传视频wordpress企业中文主题
  • 青柠海报设计网站企信通
  • 浏览器怎么打开网站电子商务是干什么的具体
  • 旅游网站需求分析怎么做的岱岳区建设信息网站
  • c#网站开发案例大全北京哪个公司做网站好
  • 贵阳网站关键字优化汕头站
  • 竹中建设官方网站兼职学网页设计怎么样
  • 湖南seo网站开发建筑八大员证书怎么查询
  • 教做美食的视频网站wordpress修改logo
  • 商城购物网站建设上海注册建网站
  • wap网站生成系统网站为什么会被k
  • 企业 手机网站昆山广告公司排名
  • 网站百度权重没有数据品牌推广费
  • 厦门网站怎么做怎么免费申请网站域名
  • 自己做菠菜网站wordpress 上传swf
  • 网站页面设计软件意大利语网站建设