当前位置: 首页 > news >正文

银川网站建设nx110北京建设网服务大厅

银川网站建设nx110,北京建设网服务大厅,十堰哪家网站制作公司技术好,网址外链平台系列文章目录 线上问诊#xff1a;业务数据采集 文章目录 系列文章目录前言一、环境准备1.Hadoop2.Zookeeper3.Kafka4.Flume5.Mysql6.Maxwell 二、业务数据采集1.数据模拟2.采集通道 总结 前言 暑假躺了两个月#xff0c;也没咋写博客#xff0c;准备在开学前再做个项目找…系列文章目录 线上问诊业务数据采集 文章目录 系列文章目录前言一、环境准备1.Hadoop2.Zookeeper3.Kafka4.Flume5.Mysql6.Maxwell 二、业务数据采集1.数据模拟2.采集通道 总结 前言 暑假躺了两个月也没咋写博客准备在开学前再做个项目找找感觉由于之前做过广告数仓的案例这次的博客会相对简略一些数仓包括离线和实时两个部分离线用来加深记忆实时用来学习新技术。 一、环境准备 由于很多内容之前博客都完成过。这里就不过多赘述了。 1.Hadoop Hadoop学习专栏前四章内容为Hadoop集群安装。 2.Zookeeper Zookeeper安装 3.Kafka Kafka安装 4.Flume Flume安装 安装好之后为了后边实验方便修改两个参数 Flume安装后需要分发到所有节点 xsync /opt/module/flume/5.Mysql 广告数仓采集通道创建 6.Maxwell 这里我们选用1.29.2版本因为在1.30.0开始放弃了对java8的支持。 1.上传并解压 2.创建Maxwell所需数据库和用户 CREATE DATABASE maxwell; CREATE USER maxwell% IDENTIFIED BY maxwell; GRANT ALL ON maxwell.* TO maxwell%; GRANT SELECT, REPLICATION CLIENT, REPLICATION SLAVE ON *.* TO maxwell%;3.修改配置文件 cp config.properties.example config.properties vim config.propertiesproducerkafka kafka.bootstrap.servershadoop102:9092,hadoop103:9092,hadoop104:9092 kafka_topictopic_db# mysql login info hosthadoop102 usermaxwell passwordmaxwell jdbc_optionsuseSSLfalseserverTimezoneAsia/ShanghaiallowPublicKeyRetrievaltrue# 指定数据按照主键分组进入Kafka不同分区避免数据倾斜 producer_partition_byprimary_key4.启停脚本 vim ~/bin/mxw.sh #!/bin/bashMAXWELL_HOME/opt/module/maxwellstatus_maxwell(){resultps -ef | grep com.zendesk.maxwell.Maxwell | grep -v grep | wc -lreturn $result }start_maxwell(){status_maxwellif [[ $? -lt 1 ]]; thenecho 启动Maxwell$MAXWELL_HOME/bin/maxwell --config $MAXWELL_HOME/config.properties --daemonelseecho Maxwell正在运行fi }stop_maxwell(){status_maxwellif [[ $? -gt 0 ]]; thenecho 停止Maxwellps -ef | grep com.zendesk.maxwell.Maxwell | grep -v grep | awk {print $2} | xargs kill -9elseecho Maxwell未在运行fi }case $1 instart )start_maxwell;;stop )stop_maxwell;;restart )stop_maxwellstart_maxwell;; esac5.添加权限 chmod x ~/bin/mxw.sh 二、业务数据采集 1.数据模拟 上传模拟数据 mkdir /opt/module/mock-medical cd /opt/module/mock-medical修改配置文件 vim application.yaml 现在我们为其创建数据库。 mysql -uroot -p000000 -edrop database if exists medical;create database medical charset utf8mb4 collate utf8mb4_general_ci;执行jar包 java -jar mock-medical-1.1.jar 在数据库检查是否获取到数据。 封装成脚本 vim ~/bin/medical_mock.sh #!/bin/bashfor ((i0; i $1; i)) doecho 正在执行第 $[ $i 1 ] 次数据模拟ssh hadoop102 cd /opt/module/mock-medical/; java -jar mock-medical-1.1.jar done2.采集通道 现在我们已经将初始数据输入到Mysql接下来使用Maxwell将数据传输到Kafka。 先启动Zookeeper,Kafka和Maxwell Maxwell会实时监控MYSQL数据然后将其传送到Kafka集群所以我们现打开一个Kafka消费集群。 bin/kafka-console-consumer.sh --bootstrap-server hadoop102:9092 --topic topic_db现在我们再次生产数据输入到MYSQLMaxwell就会将产生的数据传送到Kafka集群我们实现打开的消费者就会收到数据。 出现数据说明通道没问题。到此数据采集通道完成。 总结 这里抓一次快照后边实时数仓还要基于这里再次开发。
http://wiki.neutronadmin.com/news/166358/

相关文章:

  • 建设一个招聘网站大概多少费用邢台优化网站排名
  • 阿里买域名 电脑做网站德州公司做网站
  • 免费照片的网站模板免费下载远洋国际一期官方网站建设
  • 创业做网站开发推广网站哪家做的好
  • 中国建设银行网站不好用烟台工程建设信息网站
  • 杭州高瑞网站建设网站建设需要配置环境么
  • 做网站用个人还是企业比较好深圳优化公司排名
  • 网站制作公司起名wordpress4.9.8安装
  • 网站建设工作落实情况wordpress重置
  • 厦门高端网站建设公司应用商店app下载安卓版
  • 单页网站 产品放哪自己做的网站如何引流
  • 想做网站策划怎么做门户网站建设与推广方案
  • 如何看别人网站用什么做的wordpress 5.0网易云音乐
  • linux wordpress 建站教程wordpress网站分享到朋友圈
  • 营销导向网站建设流程微信网站开发企业
  • 上海企业网站改版信誉比较好的商家可做网站
  • 网站建设 试题中铁建设团门户网登录入口
  • 建设企业网站公司在哪里搜索引擎链接
  • 门户网站建设技术方案广西建设信息网官网
  • 负责做网站的叫什么公司如何查看网站的更新频率
  • 吉林移动网站盐城网站建设
  • 泰州网站制作方案定制解析软件的网站
  • icp备案网站接入信息ip地址段怎么填wordpress 暖岛 主题
  • 关于网站建设的总结网站开发可选择的方案有
  • 成都网站制作的公司html表格代码
  • 网站主机空间用哪个好网络广告营销方案
  • 深圳做微商网站的公司佛山制作网页公司
  • 开福区网站建设中餐饮网络营销方案
  • 网站文章页做百度小程序自助建站教程
  • 做旅游的网站的要素wordpress电影主题免费下载