当前位置: 首页 > news >正文

织梦网站文章内容模板哈尔滨网站建设自助建站

织梦网站文章内容模板,哈尔滨网站建设自助建站,二级域名做城市分网站,搭建网站钱一、目的 对于Flume的复制和多路复用拓扑结构#xff0c;进行一个小的开发测试 二、复制和多路复用拓扑结构 #xff08;一#xff09;结构含义 Flume 支持将事件流向一个或者多个目的地。 #xff08;二#xff09;结构特征 这种模式可以将相同数据复制到多个channe…一、目的 对于Flume的复制和多路复用拓扑结构进行一个小的开发测试 二、复制和多路复用拓扑结构 一结构含义 Flume 支持将事件流向一个或者多个目的地。 二结构特征 这种模式可以将相同数据复制到多个channel 中或者将不同数据分发到不同的 channel 中sink 可以选择传送到不同的目的地 三、需求案例 一案例需求 使用 Flume-1 监控文件变动Flume-1 将变动内容传递给 Flume-2Flume-2 负责存储到 HDFS。同时 Flume-1 将变动内容传递给 Flume-3Flume-3 负责输出到 LocalFileSystem。 二需求分析 四、前期准备 一安装好Hadoop、Hive、Flume等工具 二查看Hive的日志在Linux系统中的文件路径 [roothurys23 conf]# find / -name hive.log /home/log/hive312/hive.log 三在HDFS中创建文件夹flume2即Hive日志写入的HDFS文件 四在/opt/flume目录下创建 flume3 文件夹 [roothurys23 ~]# cd /opt/flume/[roothurys23 flume]# mkdir flume3 [roothurys23 flume]# ll 总用量 0 drwxr-xr-x 2 root root   6 12月 12 14:41 flume3 drwxr-xr-x 3 root root 102 12月  5 16:08 upload 五、创建flume的任务文件 一创建任务文件1     flume-file-flume.conf 配置1个接收日志文件的source和两个channel、两个sink分别输送给 flume-flume-hdfs 和 flume-flume-dir。 [roothurys23 conf]# vi flume-file-flume.conf # Name the components on this agent a1.sources r1 a1.sinks k1 k2 a1.channels c1 c2 # 将数据流复制给所有 channel a1.sources.r1.selector.type replicating # Describe/configure the source a1.sources.r1.type execa1.sources.r1.command tail -F /home/log/hive312/hive.log a1.sources.r1.shell /bin/bash -c # Describe the sink # sink 端的 avro 是一个数据发送者 a1.sinks.k1.type avroa1.sinks.k1.hostname hurys23 a1.sinks.k1.port 4141 a1.sinks.k2.type avroa1.sinks.k2.hostname hurys23 a1.sinks.k2.port 4142 # Describe the channel a1.channels.c1.type memory a1.channels.c1.capacity 1000 a1.channels.c1.transactionCapacity 100 a1.channels.c2.type memory a1.channels.c2.capacity 1000 a1.channels.c2.transactionCapacity 100 # Bind the source and sink to the channel a1.sources.r1.channels c1 c2 a1.sinks.k1.channel c1 a1.sinks.k2.channel c2 注意 1、配置文件中的各项参数需要调式这里只是为了演示实现目的、打通路径即可实际在项目中操作时需要调试参数。 2、a1.sources.r1.command tail -F /home/log/hive312/hive.log         为hive.log在Linux中的路径 3、a1.sinks.k1.hostname hurys23                                                     hurys23 为服务器名字 二创建任务文件2       flume-flume-hdfs.conf 配置上级 Flume 输出的 Source输出是到 HDFS 的 Sink。 [roothurys23 conf]# vi flume-flume-hdfs.conf # Name the components on this agent a2.sources r1 a2.sinks k1 a2.channels c1 # Describe/configure the source # source 端的 avro 是一个数据接收服务 a2.sources.r1.type avroa2.sources.r1.bind hurys23 a2.sources.r1.port 4141 # Describe the sink a2.sinks.k1.type hdfsa2.sinks.k1.hdfs.path hdfs://hurys23:8020/flume2/%Y%m%d/%H #上传文件的前缀 a2.sinks.k1.hdfs.filePrefix flume2- #是否按照时间滚动文件夹 a2.sinks.k1.hdfs.round true #多少时间单位创建一个新的文件夹 a2.sinks.k1.hdfs.roundValue 1 #重新定义时间单位 a2.sinks.k1.hdfs.roundUnit hour #是否使用本地时间戳 a2.sinks.k1.hdfs.useLocalTimeStamp true #积攒多少个 Event 才 flush 到 HDFS 一次 a2.sinks.k1.hdfs.batchSize 100 #设置文件类型可支持压缩 a2.sinks.k1.hdfs.fileType DataStream #多久生成一个新的文件 a2.sinks.k1.hdfs.rollInterval 30 #设置每个文件的滚动大小大概是 128M a2.sinks.k1.hdfs.rollSize 134217700 #文件的滚动与 Event 数量无关 a2.sinks.k1.hdfs.rollCount 0 # Describe the channel a2.channels.c1.type memory a2.channels.c1.capacity 1000 a2.channels.c1.transactionCapacity 100 # Bind the source and sink to the channel a2.sources.r1.channels c1 a2.sinks.k1.channel c1 注意 1、a2.sinks.k1.hdfs.path hdfs://hurys23:8020/flume2/%Y%m%d/%H    为写入的HDFS文件路径 2、a2.sources.r1.bind hurys23                                                                hurys23 为服务器名字 三创建任务文件3       flume-flume-dir.conf 配置上级 Flume 输出的 Source输出是到本地目录的 Sink。 [roothurys23 conf]# vi flume-flume-dir.conf # Name the components on this agent a3.sources r1 a3.sinks k1 a3.channels c2 # Describe/configure the source a3.sources.r1.type avroa3.sources.r1.bind hurys23 a3.sources.r1.port 4142 # Describe the sink a3.sinks.k1.type file_rolla3.sinks.k1.sink.directory /opt/flume/flume3 # Describe the channel a3.channels.c2.type memory a3.channels.c2.capacity 1000 a3.channels.c2.transactionCapacity 100 # Bind the source and sink to the channel a3.sources.r1.channels c2 a3.sinks.k1.channel c2 注意 1、a3.sources.r1.bind hurys23                                        hurys23 为服务器名字 2、a3.sinks.k1.sink.directory /opt/flume/flume3               在Linux中的本地路径 3、/opt/flume/flume3    这个输出的本地目录必须是已经存在的目录如果该目录不存在并不会自动创建新的目录 六、分别启动Flume任务文件 一首先启动   a3    flume-flume-dir.conf [roothurys23 flume190]# bin/flume-ng agent -n a3  -f /usr/local/hurys/dc_env/flume/flume190/conf/flume-flume-dir.conf 二其次启动   a2    flume-flume-hdfs.conf [roothurys23 flume190]# bin/flume-ng agent -n a2  -f /usr/local/hurys/dc_env/flume/flume190/conf/flume-flume-hdfs.conf 三最后启动   a1    flume-file-flume.conf [roothurys23 flume190]# bin/flume-ng agent -n a1  -f /usr/local/hurys/dc_env/flume/flume190/conf/flume-file-flume.conf 七、Flume任务运行执行状况 一a1  a1任务运行截图 采集hive的log日志文件发送给flume2、flume3 二a2   写入的HDFS文件状况 根据时间戳自动生成20231212文件夹、15文件夹及其flume2-文件 三a3  写入的Linux本地文件状况 在Linux的 /opt/flume/flume3目录下自动生成相关文件 [roothurys23 flume3]# ll 总用量 188 -rw-r--r-- 1 root root      0 12月 12 15:07 1702364829999-1 -rw-r--r-- 1 root root   1922 12月 12 15:07 1702364829999-2 -rw-r--r-- 1 root root 163250 12月 12 15:08 1702364829999-3 -rw-r--r-- 1 root root  23162 12月 12 15:08 1702364829999-4 -rw-r--r-- 1 root root      0 12月 12 15:09 1702364829999-5 Flume复制和多路复用拓扑结构的开发案例测试成功简单来看a1是sourcea2、a3是sink 这种结构其实也挺常见的就先到这里Flume玩法还真挺多的
http://wiki.neutronadmin.com/news/178103/

相关文章:

  • 珠海建网站企业名称核准
  • 温州建站费用农村不起眼的商机
  • 网站开发知识绵阳市网站建立
  • 黄骅市海边网站优化哪家公司好
  • 建站公司杭州网页表单制作步骤
  • 北京网站设计与制作龙岗网站制作资讯
  • 张家港网站建设网络营销能做什么?
  • 国字型网站建设布局wordpress静态首页设置
  • 网站开发技术html自己做旅游攻略的网站
  • 综合网站有哪些杭州商城网站建设
  • 网站支付的功能如何做阅读推广联盟
  • php跳转网站深圳市市场监督管理局
  • 建站公司 转型经验网站建设工作室是干嘛的
  • 做网站如何使用特殊字体营销型网站建设服务
  • iis网站启动不了js获取网站广告点击量怎么做
  • 内部建设网站需要什么条件深圳科技公司排行榜
  • server2008 iis 网站临沧市住房和城乡建设网站
  • 个人网站怎么做的模板广州做网站价位
  • 制作公司网站有哪些好处水果配送网站建设
  • 广西灵山县住房和城乡建设局网站互联网运营网站
  • 网站开发工程师招聘要求门户网站建设研究
  • 电邮注册网站免费logo设计图案创意
  • 太原网站建设名录WordPress做图床
  • 最好的开发网站有哪些外贸网站建设哪里做得好
  • 网站案例分析简述it外包的作用
  • 邹城市建设银行网站郴州网红打卡地有哪些
  • 网站开发用什么写得比较好企业网站制作规划
  • 织梦dede网站后台被挂黑链怎么办北京市在建工程项目查询
  • 找做网站免费网站建设解决方案
  • 网站seo入门基础教程书籍wordpress把所有东西导出