现在网站建设 如何保证安全,北京昌平区,wordpress id连续插件,制作网站需要学什么软件有哪些文章作者邮箱#xff1a;yugongshiyesina.cn 地址#xff1a;广东惠州 ▲ 本章节目的
⚪ 了解网站流量项目的Spark与HBase整合#xff1b;
⚪ 掌握网站流量项目的实时流业务处理#xff1b; 一、 Spark 与 HBase 整合基础
1. 实现步骤#xff1a;
1. 启动…文章作者邮箱yugongshiyesina.cn 地址广东惠州 ▲ 本章节目的
⚪ 了解网站流量项目的Spark与HBase整合
⚪ 掌握网站流量项目的实时流业务处理 一、 Spark 与 HBase 整合基础
1. 实现步骤
1. 启动 IDEA。
2. 创建 Maven 工程骨架选择 quickstart 。
3. IDEA 安装 Scala 插件。
file — settings — plugins
搜素 Scala 插件安装即可安装完成后重启。 4. 为 fluxStreamingServer 工程添加 Scala sdk 。
工程上右键 — add framework suppor 5. 创建一个 Scala 目录使其成为 source root 。
6. 引入工程 pom详见笔记。
7. 学习 Spark 与 HBase 整合基础。
8. 确定一下 Windows hosts 文件主机名与 ip 的映射是否正确。
9. 启动服务器。
10. 启动三台 zookeeper 集群。
11. 启动 Hadoop 。
12. 启动 HBase进入01服务器 HBase 的 bin 目录 执行如下指令
sh start-hbase.sh
13. 执行如下指令进入 hbase客户端建表。
sh hbase shell
二、实时流业务处理
1. 实现步骤
1. 启动三台服务器。
2. 启动 zookeeper 集群。
3. 启动 Hadoop 。
4. 启动 Kafka 集群 。
5. 启动 flume 。
6. 整合 SparkStreaming 与 Kafka完成代码编写。
7. 启动 SparkStreaming 。
8. 启动 tomcat访问埋点服务器测试 SparkStreaming 是否能够收到数据。
9. 启动 HBase。