当前位置: 首页 > news >正文

网站风格确定网络推广营销软件

网站风格确定,网络推广营销软件,如何查看一个网站的浏览量,外贸网站建设推广费用最早接触大数据#xff0c;常萦绕耳边的一个词「MapReduce」。它到底是什么#xff0c;能做什么#xff0c;原理又是什么#xff1f;且听下文讲解。 是什么 MapReduce 即是一个编程模型#xff0c;又是一个计算框架#xff0c;它充分采用了分治的思想#xff0c;将数据处… 最早接触大数据常萦绕耳边的一个词「MapReduce」。它到底是什么能做什么原理又是什么且听下文讲解。 是什么 MapReduce 即是一个编程模型又是一个计算框架它充分采用了分治的思想将数据处理过程拆分成两步Map 和 Reduce。用户只需要编写 map() 和 reduce() 函数就能使问题的计算实现分布式并在Hadoop上执行。 数据处理 MapReduce 操作数据的最小单位是一个键值对。map 端的主要输入是一对key,value值经过 map 计算后输出一对key,value然后将相同的 key 合并形成key,value 集合再将这个key,value 集合输入 reduce 经过计算输出零个或多个key,value对。 两个重要的进程 JobTracker JobTracker 在集群中负责任务调度和集群资源监控这两个功能。TaskTracker 通过周期性的心跳向 JobTracker 汇报当前的健康状况和状态心跳中包括自身计算资源的信息、被占用的计算资源的信息和正在运行中的任务的状态信息。JobTracker 会根据各个 TaskTracker 周期性发送过来的心跳信息综合考虑TaskTracker 的资源余量、作业优先级、作业提交时间等因素为 TaskTracker 分配合适的任务。 JobTracker 提供了一个基于 web 的管理界面可以通过 JobTracker:50030 端口访问。 TaskTracker TaskTracker 主要负责汇报心跳和执行 JobTracker 命令这两个功能。命令主要包括5种启动命令、提交命令、杀死任务、杀死作业和重新初始化。 几个概念 作业(Job) 和 任务(Task) MapReduce 作业是用户提交的最小单位任务是 MapReduce 计算的最小单位。 简单讲用户提交的是一个MapReduce作业一个 MapReduce 作业可以被拆分成两种——Map 任务和 Reduce 任务。 槽slot 槽是Hadoop计算资源的表示模型Hadoop 将各个节点上的多维度资源CPU、内存等抽象成一维度的槽。一个TaskTracker 能够启动的任务数量是由 TaskTracker 配置的任务槽决定的。 MapReduce 过程 一个MapReduce作业通常经过 input、map、combine、reduce、output 五个阶段。combine 阶段不一定发生map输出的中间结果分发到 reduce 的过程被称为 shuffle。shuffle 阶段还会发生 copy 和 sort。 两幅重要的流程图 map任务流程图reduce 任务流程图几个重要的阶段说明 map 函数处理后的中间结果会写到本地磁盘上在刷写磁盘的过程中还做了 partition 和 sort 操作。 map 函数输出时并不是简单地刷写磁盘为了保证 I/O 效率采取了先写到内存的环形缓冲区并做一次预排序。请结合map任务流程图理解。 partition 在分区阶段通过对 key 取模生成partition,key,value三元组分区阶段进行了一次内排序。 MemoryBuffer 内存缓冲区保存 map 的结果和 partition 处理后的结果默认大小为100M溢写阈值为80M。 spill(溢写) 内存缓冲区达到阈值时溢写线程锁住这80M的缓冲区开始将数据写到本地磁盘中然后释放内存。 每次溢写都会生成一个数据文件溢出的数据写到磁盘前会对数据进行 sort 以及合并combine。 combine combine 对map 函数的输出结果进行早期聚合以减少传输的数据量其作用其实和reduce 函数一样。combine 的过程发生在 spill溢写 阶段。 combine 能够提升程序性能但并不是所有常见都适合使用 combine 例如求中值。 sort MapReduce 计算框架主要用到了两种排序快速排序和归并排序。在 Map 任务和 Reduce 任务的过程中一共发生了三次排序操作 partition 过程中按照键值进行的内排序。map 任务完成之前合并溢写文件产生输出文件时进行的一次 sort 操作。shuffle 过程的 sort 操作。wordcount 实验模拟 map 端编程代码(map_a.py) import sys import rep re.compile(r\w) for line in sys.stdin:world_list line.strip().split()for word in world_list:if len(word)2:continuew_list p.findall(word)if len(w_list)0:w w_list[0].lower()print %s\t%d%(w,1)reduce 端编程代码(red_b.py) import sys wt 0 cur_word None for line in sys.stdin:word,cnt line.strip().split(\t)if cur_word None:cur_word wordif cur_word !word:print %s\t%d%(cur_word,wt)wt 0cur_word wordwt wtint(cnt) print %s\t%d%(cur_word,wt)模拟命令 cat The_man_of_property.txt |python ./project/map_a.py | sort -k 1 |python ./project/red_b.py 输出显示 转载于:https://www.cnblogs.com/bbmkey/p/10702196.html
http://www.yutouwan.com/news/234752/

相关文章:

  • 临沂市建设局网站改版2022年中国企业500强名单
  • 网站布局结构主要分为江苏城乡建设局网站
  • 宁陵网站建设汕头潮阳网站建设
  • 四站合一网站建设公司网上购物哪个平台能买到正品
  • 陕西省住房建设厅官方网站中小企业网站建设多少钱
  • 网站备案是给什么进行备案系统小说
  • 深圳网站建设 龙华信科免费软件下载网站哪个好
  • 内部链接网站大全网站按钮设计成什么颜色原因
  • 傻瓜式网站全网关键词指数查询
  • 网站备案 强制宝塔和WordPress一样吗
  • 做网站和编程在郑州建设网站这么做
  • 数码网站建设论文做电子商务平台网站需要多少钱
  • 朝城做网站公司平面设计画图软件
  • 呼伦贝尔网站建设做淘宝网站用什么软件
  • 深圳企业模板网站建设微商可以做网站推广吗
  • wcm 可以做网站吗衡阳县专业做淘宝网站
  • 建设搜索引擎友好的网站推广普通话手抄报简单漂亮
  • 网站备案查询接口帮忙做公司网站
  • 杭州企业网站定制html网页制作简单范例
  • 百度网站怎么建设的家具公司网站模板下载
  • 专业制作广告字潍坊网站建设seo
  • 网站变成灰色wordpress文章分多列排
  • 花都区建设工程造价管理网站常德网站建设产品
  • 网络营销网站建设与策划分析做暧暧前戏视频网站
  • 如何制作网站app上海网页制作步骤
  • 做网站项目流程空白网站怎么做
  • 大连做网站建设傻瓜式建站软件
  • 百度给做网站收费多少钱招商网站建设费用价格
  • 中山开发公司seo最好的网站
  • 怎么找网站的根目录小程序可以自己开发吗