当前位置: 首页 > news >正文

东莞樟木头网站建设模板网站免费下载

东莞樟木头网站建设,模板网站免费下载,空壳网站,wordpress网页图片加载在实时数据仓库建设或迁移的过程中#xff0c;用户必须考虑如何高效便捷将关系数据库数据同步到实时数仓中来#xff0c;Apache Doris 用户也面临这样的挑战。而对于从 Oracle 到 Doris 的数据同步#xff0c;通常会用到以下两种常见的同步方式#xff1a; OGG/XStream/Lo…在实时数据仓库建设或迁移的过程中用户必须考虑如何高效便捷将关系数据库数据同步到实时数仓中来Apache Doris 用户也面临这样的挑战。而对于从 Oracle 到 Doris 的数据同步通常会用到以下两种常见的同步方式 OGG/XStream/LogMiner 工具 通过该方式先将数据同步到 Kafka 中然后通过 Routine Load 消费 Kafka 中的数据进行实时同步。这种方式的同步链路相对较长特别是在上游数据表较多的情况下需要手动创建大量的 Routine Load 作业同步流程不仅繁琐也给用户增加了较大的使用及维护压力。 FlinkCDC 该方式虽然可以直接将上游数据同步到 Doris 中并在一定程度上缩短了同步链路实际在使用过程中还会遇到以下问题 数据同步时需要在 Flink 中对每张表手动配置参数及字段映射尤其是在多表或整库同步场景中不仅带来大量配置工作量还增加了 FlinkSQL 脚本的维护成本。数据同步时需要事先在 Doris 中手动逐个创建表而面对数量庞大的上游表时手动创建表不仅耗费时间而且工作效率很低间接影响数据同步的效率。由于每张 Source 表都会使用同一个链接因此在整库同步时会给源端造成很大的链接压力。 为了解决上述问题在新版本的 Doris-Flink-Connector  中我们实现了 FlinkCDC 的 Datastream API 集成无需提前在 Doris 中创建表以及映射关系仅仅通过简单的参数配置就能一键完成从 Oracle 等关系型数据库到 Apache Doris 的整库数据同步。 此外Doris-Flink-Connector 也可以一键实现万表 MySQL 整库同步至 Apache Doris 中来具体使用可参考一键实现万表 MySQL 整库同步至 Apache Doris 同步流程 实战演示 在进行整库同步前我们先了解一下具体同步流程 在启动 Flink 任务之前Doris-Flink-Connector  会自动读取需要同步的 Oracle 表的元数据信息并自动在 Doris 中创建相应的表。通过 FlinkCDC 提供的 OracleSource 功能能够从 Oracle 数据库中读取数据并将其传递到下游进行处理。通过 Flink 的侧输出流功能根据自定义规则将数据分流到不同的 Doris Sink 中并同步到 Doris 中来。 通过以上简单操作即可实现上游 Oracle 数据库的整库数据实时数据接入到 Apache Doris 中。接下来我们通过一个实际案例来详细说明具体的操作步骤 01  Oracle 环境准备 # 拉取镜像 docker pull registry.cn-hangzhou.aliyuncs.com/helowin/oracle_11g# 启动镜像 docker run -it -d \ --privileged \ -p 1521:1521 \ --name oracle11g \ -e ORACLE_ALLOW_REMOTEtrue \ -v /mnt/disk1/oracle:/data/oracle \ registry.cn-hangzhou.aliyuncs.com/helowin/oracle_11g# 进入容器 docker exec -it oracle11g bashOracle 归档日志Binlog配置启动归档日志时需对日志大小和存放地址进行设置设置完成需进行重启。该步骤完成后才可进行后续增量数据的同步。 # 进入SQL命令行 [oracleef6d9de18e59 ~]$ sqlplus /nolog SQL conn /as sysdba Connected.SQL alter system set db_recovery_file_dest_size 10G; System altered.SQL alter system set db_recovery_file_dest /home/oracle/oracle-data scopespfile; System altered.SQL shutdown immediate; Database closed. Database dismounted. ORACLE instance shut down.SQL startup mount; ORACLE instance started. Total System Global Area 1603411968 bytes Fixed Size 2213776 bytes Variable Size 402655344 bytes Database Buffers 1174405120 bytes Redo Buffers 24137728 bytes Database mounted.SQL alter database archivelog; Database altered.SQL alter database open; Database altered. # 检查日志归档是否开启 SQL archive log list; Database log mode Archive Mode Automatic archival Enabled Archive destination USE_DB_RECOVERY_FILE_DEST Oldest online log sequence 1 Next log sequence to archive 1 Current log sequence 1# 启用补充日志记录 SQL ALTER DATABASE ADD SUPPLEMENTAL LOG DATA; Database altered.#创建用户 CREATE USER admin IDENTIFIED BY admin123; GRANT dba TO admin;数据准备 [oracleef6d9de18e59 ~]$ sqlplus admin/admin123  SQL CREATE TABLE PERSONS(ID NUMBER(10),NAME VARCHAR2(128) NOT NULL,PRIMARY KEY(ID)); Table created.SQL INSERT INTO PERSONS VALUES (1, zhangsan); SQL INSERT INTO PERSONS VALUES (2, lisi); SQL INSERT INTO PERSONS VALUES (3, wangwu);SQL CREATE TABLE PERSONS_1(ID NUMBER(10),NAME VARCHAR2(128) NOT NULL,PRIMARY KEY(ID)); Table created.SQL INSERT INTO PERSONS_1 VALUES (1, zhangsan); SQL INSERT INTO PERSONS_1 VALUES (2, lisi); SQL INSERT INTO PERSONS_1 VALUES (3, wangwu);02  Flink 环境配置 将 FlinkCDC-Oracle 的依赖和 Doris-Flink-Connector 包放到 Flink 的 lib 目录下同时启动 Flink 集群。 # 下载相关依赖 wget https://repo.maven.apache.org/maven2/com/ververica/flink-sql-connector-oracle-cdc/2.3.0/flink-sql-connector-oracle-cdc-2.3.0.jar wget https://repository.apache.org/content/repositories/snapshots/org/apache/doris/flink-doris-connector-1.16/1.5.0-SNAPSHOT/flink-doris-connector-1.16-1.5.0-20230811.065053-1.jar -O flink-doris-connector-1.16-1.5.0-SNAPSHOT.jar# 启动Flink集群 bin/start-cluster.sh03  一键提交整库同步作业 本次同步以 PERSON 开头的所有的表。 FLINK_HOME/bin/flink run \-Dexecution.checkpointing.interval10s \-Dparallelism.default1 \-c org.apache.doris.flink.tools.cdc.CdcTools \./lib/flink-doris-connector-1.16-1.5.0-SNAPSHOT.jar \oracle-sync-database \--database test_db \--oracle-conf hostname127.0.0.1 \--oracle-conf port1521 \--oracle-conf usernameadmin \--oracle-conf passwordadmin123 \--oracle-conf database-nameHELOWIN \--oracle-conf schema-nameADMIN \--including-tables PERSONS.* \--sink-conf fenodes127.0.0.1:8030 \--sink-conf usernameroot \--sink-conf password\--sink-conf jdbc-urljdbc:mysql://127.0.0.1:9030 \--sink-conf sink.label-prefixlabel \--table-conf replication_num1详细参数可参考https://doris.apache.org/zh-CN/docs/dev/ecosystem/flink-doris-connector 提交成功后可以在 FlinkWeb 上看到该同步任务的状态。 进入 Doris 可以查看自动创建的表以及同步成功的全量数据。 mysql use test_db; Reading table information for completion of table and column names You can turn off this feature to get a quicker startup with -A Database changed mysql show tables; ------------------- | Tables_in_test_db | ------------------- | PERSONS | | PERSONS_1 | ------------------- 2 rows in set (0.00 sec) mysql select * from PERSONS; ---------------- | ID | NAME | ---------------- | 2 | lisi | | 3 | wangwu | | 1 | zhangsan | ---------------- 3 rows in set (0.01 sec) mysql select * from PERSONS_1; ---------------- | ID | NAME | ---------------- | 2 | lisi | | 3 | wangwu | | 1 | zhangsan | ---------------- 3 rows in set (0.01 sec)在 Oracle 中模拟实时增删改数据 INSERT INTO PERSONS VALUES(4,doris); UPDATE PERSONS SET name  zhangsan-update WHERE ID 1; DELETE PERSONS WHERE ID 2; 在 Doris 中进行验证可以确认增量数据已经成功同步。 mysql select * from PERSONS;                                                                                                                               -----------------------                                                                                                                                  | ID   | NAME            |                                                                                                                                  -----------------------                                                                                                                                  |    1 | zhangsan-update |                                                                                                                                  |    4 | doris           |                                                                                                                                  |    3 | wangwu          |                                                                                                                                  -----------------------                                                                                                                                  3 rows in set (0.01 sec)  通过以上操作成功实现将 Oracle 中数据整库同步到 Doris 中同时也实现了上游全量与增量数据的自动接入。 实际使用反馈 原先将 Oracle 数据同步到 Doris 中时需要手动创建 Source 和 Sink 表而使用 Doris-Flink-Connector 后可以实现多表、整库数据一键同步极大简化了开发流程该工具还能实现字段类型自动转换数据同步更加简单便捷。 —— 远景动力 资深大数据工程师 孙全隆 在使用 Doris-Flink-Connector 之前我们一般是通过 DataX 定时从业务系统中抽取数据当进行全量同步时抽取数据会对业务系统造成一定的压力且该方式只能做到小时级的同步。期间我们也尝试了 FlinkCDC该方式虽然可以实现数据实时写入 Doris 但每个表都需要手动创建新任务配置工作量大且会浪费服务器资源。而 Doris-Flink-Connector 可以实现一键化脚本操作为我们减少了繁杂的手工配置流程高效稳定的实现了整库数据快速同步。 —— 郑煤机数耘科技 资深大数据工程师 杨开元 Doris-Flink-Connector  一键操作即可快速实现 Oracle 数据整库同步到 Doris节省了手动配置以及编写复杂同步代码的步骤避免了手动同步中可能出现数据不一致的问题。不仅能提高数据的准确性和可靠性也极大提升了工作的效率。 —— 海程邦达 资深大数据工程师 王新 在实时数仓的建设过程中对于 ODS 贴源数据层的同步需求Doris-Flink-Connector  能够很好的解决全量数据、增量数据、增量表、表结构变更自动监听。同时它也对 Stream Load 逻辑进行了优化可以避免频繁对空数据进行 Load减轻了数据库压力。此外Doris-Flink-Connector 能够帮助我们节省大量 Flink 集群资源特别是业务变更频繁时期能很好及时的同步上游状态确保上下游数据的一致性。 ——旺小宝 数据架构师 米华军 我们在 MySQL 和 Orcale 两个场景下均进行了全量 增量的尝试Doris-Flink-Connector 是真正的拆箱即用真正实现了一键式操作、无感知建表这为开发人员节省了不少时间成本同时在使用期间遇到问题SelectDB 技术同学的响应速度非常给力帮助我们快速推进数据同步工作。 —— 博思软件 资深大数据开发工程师 刘工 总结 Doris-Flink-Connector 通过集成 FlinkCDC能够将上游 Oracle 数据库中的数据快速同步到 Doris 中。特别是在整库同步场景中用户只需执行一键导入命令即可快速将整个数据库的全量和增量数据导入到 Doris 中。这一功能的引入大大降低了数据同步的门槛使数据同步变得更加简单高效。 最后欢迎有需要的小伙伴使用该工具感兴趣的伙伴可以在评论区留言或私信申请进入专项支持群如果你在使用过程中遇到任何问题均可向我们反馈~ # 作者介绍 吴迪 SelectDB 生态研发工程师。
http://www.yutouwan.com/news/68088/

相关文章:

  • 十大购物网站排名相关文章wordpress
  • 大淘客网站上的推广怎么做wdcp搭建网站教程
  • 网站做用户记录网站优化公司服务
  • 湖北建设执业资格注册中心网站做旅游的网站有哪些
  • 网站开发研究背景傻瓜式建设网站的软件
  • 自助游网站开发分析报告做视频网站要什么软件
  • 做二手房怎找房源网站nginx 防御 wordpress 攻击
  • wordpress怎么开启多站点电商公司的网上设计
  • 手机适配网站百度推广投诉电话
  • 烟台中企动力提供网站建设宜春个人网站建设
  • 莆田网站制作企业面向搜索引擎网站建设
  • 耐克1网站建设的总体目标网站备案 视频
  • 学网站建设与管理有用吗营销型网站建设专家
  • 网站关键词排名seo网站服务器租用报价
  • 建立网站的原因百度ai营销中国行
  • python做网站好吗怎么注册自媒体号挣钱
  • 自己创建网站403wordpress插件授权破解版
  • 深圳网站建设机构长春网站建设方案报价
  • 北京怀柔网站制作如何制作小程序赚钱
  • 做问卷用哪个网站长春市长春网站制作站优化
  • 网站怎么做会被收录企业网站模板下载需谨慎
  • 视频网站的建设目标wordpress 视频
  • dedecms购物网站html怎么做网站后台
  • 云南网站建设肖庆华wordpress 搬家 换域名
  • 网站建设费用包括怎么让关键词快速上首页
  • 廊坊网站建设代理注册公司怎么样
  • 福建网站开发速成班输入关键词搜索
  • 个人网站注册平台钱怎么建立一个公司网站
  • 买了个域名怎么做网站西安医疗网站制作
  • 网站运营者大连微信网站建设