当前位置: 首页 > news >正文

工会网站建设比较好的工会打开一个不良网站提示创建成功

工会网站建设比较好的工会,打开一个不良网站提示创建成功,网站托管价格,linux做ppt下载网站前言 前段时间有同学在微信群里提问#xff0c;要使用.NET开发一个简单的爬虫功能但是没有做过无从下手。今天给大家推荐一个轻量、灵活、高性能、跨平台的分布式网络爬虫框架#xff08;可以帮助 .NET 工程师快速的完成爬虫的开发#xff09;#xff1a;DotnetSpider。 注…前言 前段时间有同学在微信群里提问要使用.NET开发一个简单的爬虫功能但是没有做过无从下手。今天给大家推荐一个轻量、灵活、高性能、跨平台的分布式网络爬虫框架可以帮助 .NET 工程师快速的完成爬虫的开发DotnetSpider。 注意为了自身安全请在国家法律允许范围内开发网络爬虫功能。 框架设计图 整个爬虫设计是纯异步的利用消息队列进行各个组件的解耦若是只需要单机爬虫则不需要做任何额外的配置默认使用了一个内存型的消息队列若是想要实现一个纯分布式爬虫则需要引入一个消息队列即可后面会详细介绍如何实现一个分布式爬虫。 框架源码 开发爬虫需求 爬取博客园10天推荐排行第一页的文章标题、文章简介和文章地址并将其保存到对应的txt文本中。 请求地址https://www.cnblogs.com/aggsite/topdiggs 快速开始 创建SpiderSample控制台 安装DotnetSpider Nuget包 搜索DotnetSpider 添加Serilog日志组件 搜索Serilog.AspNetCore RecommendedRankingModel public class RecommendedRankingModel{/// summary/// 文章标题/// /summarypublic string ArticleTitle { get; set; }/// summary/// 文章简介/// /summarypublic string ArticleSummary { get; set; }/// summary/// 文章地址/// /summarypublic string ArticleUrl { get; set; }} RecommendedRankingSpider public class RecommendedRankingSpider : Spider{public RecommendedRankingSpider(IOptionsSpiderOptions options,DependenceServices services,ILoggerSpider logger) : base(options, services, logger){}public static async Task RunAsync(){var builder  Builder.CreateDefaultBuilderRecommendedRankingSpider();builder.UseSerilog();builder.UseDownloaderHttpClientDownloader();builder.UseQueueDistinctBfsSchedulerHashSetDuplicateRemover();await builder.Build().RunAsync();}protected override async Task InitializeAsync(CancellationToken stoppingToken  default){// 添加自定义解析AddDataFlow(new Parser());// 使用控制台存储器AddDataFlow(new ConsoleStorage());// 添加采集请求await AddRequestsAsync(new Request(https://www.cnblogs.com/aggsite/topdiggs){// 请求超时10秒Timeout  10000});}class Parser : DataParser{public override Task InitializeAsync(){return Task.CompletedTask;}protected override Task ParseAsync(DataFlowContext context){var recommendedRankingList  new ListRecommendedRankingModel();// 网页数据解析var recommendedList  context.Selectable.SelectList(Selectors.XPath(.//article[classpost-item]));foreach (var news in recommendedList){var articleTitle  news.Select(Selectors.XPath(.//a[classpost-item-title]))?.Value;var articleSummary  news.Select(Selectors.XPath(.//p[classpost-item-summary]))?.Value?.Replace(\n, ).Replace( , );var articleUrl  news.Select(Selectors.XPath(.//a[classpost-item-title]/href))?.Value;recommendedRankingList.Add(new RecommendedRankingModel{ArticleTitle  articleTitle,ArticleSummary  articleSummary,ArticleUrl  articleUrl});}using (StreamWriter sw  new StreamWriter(recommendedRanking.txt)){foreach (RecommendedRankingModel model in recommendedRankingList){string line  $文章标题{model.ArticleTitle}\r\n文章简介{model.ArticleSummary}\r\n文章地址{model.ArticleUrl};sw.WriteLine(line \r\n );}}return Task.CompletedTask;}}} Program调用 internal class Program{static async Task Main(string[] args){Console.WriteLine(Hello, World!);await RecommendedRankingSpider.RunAsync();Console.WriteLine(数据抓取完成);}} 抓取数据和页面数据对比 抓取数据 页面数据 项目源码地址 更多项目实用功能和特性欢迎前往项目开源地址查看别忘了给项目一个Star支持。 GitHub源码地址GitHub - dotnetcore/DotnetSpider: DotnetSpider, a .NET standard web crawling library. It is lightweight, efficient and fast high-level web crawling scraping framework GitHub wikiHome · dotnetcore/DotnetSpider Wiki · GitHub 优秀项目和框架精选 该项目已收录到C#/.NET/.NET Core优秀项目和框架精选中关注优秀项目和框架精选能让你及时了解C#、.NET和.NET Core领域的最新动态和最佳实践提高开发工作效率和质量。坑已挖欢迎大家踊跃提交PR推荐或自荐让优秀的项目和框架不被埋没。 https://github.com/YSGStudyHards/DotNetGuide/blob/main/docs/DotNet/DotNetProjectPicks.md 文章转载自追逐时光者 原文链接https://www.cnblogs.com/Can-daydayup/p/17884311.html
http://wiki.neutronadmin.com/news/360625/

相关文章:

  • 网站建设课程的感受湖南省百川电力建设有限公司网站
  • 啊宝贝才几天没做网站科技酒店
  • 百度指数资讯指数网站用户体验优化方案
  • 建站网站有哪些市场营销的三大战略四大策略
  • 电子商务网站提供的主要功能有成都网站建设询q479185700霸屏
  • 济南网络公司哪家好潍坊百度关键词优化
  • 建设微信网站设计制作磁力猫torrent kitty
  • 四平做网站佳业班级文化墙创意设计图片
  • 注册网站不需要手机验证的wordpress分级访问权限
  • 世界各大网站搜索引擎提交入口开发app的平台
  • 织梦网站模板免费下载龙岩网站开发
  • 建设网站证南宁小程序开发网站建设公司
  • 网站如何被手机端收录培训公司排名
  • 合肥哪里有做网站上海外贸服装
  • 呼和浩特市网站公司电话帝国cms手机网站教程
  • 网站header设计地方网站优势
  • 烟台企业网站建设公司国家外汇管理局网站怎么做报告
  • 网站开发了下载文件需要南宁建筑规划设计集团有限公司
  • 全球电子商务网广州seo优化外包公司
  • 哈尔滨快速建站专业定制关键词组合工具
  • seo技术网站建设如何开发一个app软件
  • 网站建设选哪家跨境电商推广平台
  • 服务器怎么用数据库建设网站wordpress站群作用
  • 政务服务 网站 建设方案wordpress简约灯箱
  • 创建网站数据库十档行情免费网站
  • 网站后端建设网站建设销售话
  • 电子商务网站建设实训方案县级部门和乡镇不能建网站建设
  • 做网站运营的女生多吗温州百度快速排名优化
  • 太原制作网站的公司网站鼓楼公司网站建设费用
  • 做销售用什么网站好wordpress小米商城主题