当前位置: 首页 > news >正文

做建材的哪些网站寿光网站建设价格

做建材的哪些网站,寿光网站建设价格,微信朋友圈推广平台收费标准,天津手机版建站系统哪个好一、数仓建模方法论 1.1 ER模型#xff08;Entity Relationship、实体关系模型、范式模型#xff09; ER模型是Bill Inmon提出的一种建模方法#xff0c;实体关系模型将复杂的数据抽象为两个概念 ---- 实体和关系 该模型在范式理论上符合3NF#xff0c;这种模型目的是减少…一、数仓建模方法论 1.1 ER模型Entity Relationship、实体关系模型、范式模型 ER模型是Bill Inmon提出的一种建模方法实体关系模型将复杂的数据抽象为两个概念 ---- 实体和关系 该模型在范式理论上符合3NF这种模型目的是减少数据冗余保证数据的一致性这种模型不适合直接用于分析统计 范式一共有6种范式级别越高数据冗余越低 第一范式1NF、第二范式2NF、第三范式3NF 巴斯-科德范式BCNF、第四范式4NF、第五范式5NF 如下图为根据ER模型所建立的模型较为松散物理表多需多表join所以不适合分析统计 1.1.1 第一范式1NF 第一范式1NF的核心原则属性不可切割 如下图“5台电脑”要拆分为数量“5”和商品“电脑”两个字段 1.1.2 第二范式2NF 第二范式1NF的核心原则不能存在非主键字段“部分函数依赖”于主键字段【除主键外其他字段完全依赖于主键】 如下图主键是学号课名姓名完全依赖于学号部分依赖于学号课名因此是不满足第二范式的需将姓名拆分出来 1.1.3 第三范式3NF 第三范式1NF的核心原则不能存在传递函数依赖【决定某字段值的必须是主键】 如下图系主任传递依赖于学号系主任依赖于系名系名依赖于学号因此为传递依赖 1.2 维度模型重点 维度模型是Ralph Kimball提出的一种建模方法维度模型将复杂的业务抽象为两个概念 ---- 事实和维度 该模型关注的重点在于用户如何更快的完成需求分析及数据分析 如下图为根据维度模型所建立的模型中间是事实表周围是一圈维度表模型更清晰、简洁 1.2.1 事实表 事实表是数据仓库维度建模的核心紧紧围绕着业务过程来设计其包含与该业务过程有关的维度引用维度表外键以及该业务过程的度量通常是数字类型 以上图为例维度表外键对应OderIdProductIdLocationId等度量对应SalesAmount 事实表的三种类型分为事务事实表、周期快照事实表、累计快照事实表 事务事实表重点 事务型事实表用来记录各业务过程它保存的是各业务过程的最细粒度的操作事件。 设计事务事实表时一般可遵循以下四个步骤: 选择业务过程→声明粒度→确认维度维度外键→确认事实度量 周期快照事实表 周期快照事实表以具有规律性的、可预见的时间间隔来记录事实主要用于分析一些存量型例如商品库存账户余额或者状态型空气温度行驶速度指标。一般是直接从业务系统同步获得。 比如有一张记录账户余额变动的表每次计算账户余额要进行聚合操作而使用周期快照事实表则可以直接获得其余额不用再进行聚合操作 对于空气温度、行驶速度这些状态型指标由于它们的值是连续的所以无法使用事务型事实表统计而只能定期对其进行采样构建周期型快照事实表。 累计快照事实表 累计快照事实表是基于一个业务流程中的多个关键业务过程联合处理而构建的事实表如交易流程中的下单、支付、发货、确认收货业务过程。 累积型快照事实表通常具有多个日期字段每个日期对应业务流程中的一个关键业务过程里程碑。 订单id用户id下单日期支付日期发货日期确认收货日期订单金额支付金额100112342020-06-142020-06-152020-06-162020-06-1710001000 累积型快照事实表主要用于分析业务过程里程碑之间的时间间隔等需求。使用累积型快照事实表进行统计就能避免事务事实表的关联操作从而变得十分简单高效。 1.2.2 维度表 事实表围绕业务过程进行设计而维度表则围绕业务过程所处的环境进行设计 维度表主要包含一个主键和各种维度字段维度字段称为维度属性。 设计维度表时一般可遵循以下三个步骤: 确定维度表→确定主维表和相关维表→确定维度属性 1确定维度表 确定与每个事实表相关的维度 如果存在多个事实表与同一个维度都相关的情况这种情况需保证维度的唯一性即只创建一张维度表。如果某些维度表的维度属性很少例如只有一个**名称则可不创建该维度表而把该表的维度属性直接增加到与之相关的事实表中这个操作称为维度退化。 2确定主维表和相关维表 主维表与相关维表指的是业务系统中某维度相关的表 3确定维度属性 确定维度属性即确定维度表字段。维度属性主要来自于业务系统中与该维度对应的主维表和相关维表。维度属性可直接从主维表或相关维表中选择也可通过进一步加工得到。 1.3 维度表的星型模型、雪花模型 规范化是指使用一系列范式设计数据库的过程其目的是减少数据冗余增强数据的一致性。通常情况下规范化之后一张表的字段会拆分到多张表。 反规范化是指将多张表的数据冗余到一张表其目的是减少join操作提高查询性能。 在设计维度表时如果对其进行规范化得到的维度模型称为雪花模型如果对其进行反规范化得到的模型称为星型模型。 雪花模型与星型模型是针对于维度表来说的区别在于是否进行规范化 如下图item表和location表雪花模型对其进行了规范化拆分出来了一张表 数据仓库系统的主要目的是用于数据分析和统计所以是否方便用户进行统计分析决定了模型的优劣。采用雪花模型用户在统计分析的过程中需要大量的关联操作而采用星型模型则方便、易用且性能好。所以出于易用性和性能的考虑维度表一般是很不规范化的。 1.4 维度表的变化 维度属性是会随时间变化的比如客户的手机号。 保存维度数据的历史状态通常有以下两种做法分别是全量快照表和拉链表。 全量快照表 离线数据仓库的计算周期通常为每天一次所以可以每天保存一份全量的维度数据。 优点 简单有效方便理解和使用 缺点 浪费存储空间尤其是当数据的变化比例比较低时。 拉链表 拉链表记录每条信息的生命周期一旦生命周期结束就重新开始一条新的记录把当前日期放入生效开始日期如果当前信息至今有效在生效结束日期中填入一个极大值如9999-12-31。 该方式更加高效的保存维度信息的历史状态。 拉链表适合于数据会发生变化但是变化频率不高的维度。 二、数据的同步策略 数据的同步策略有全量同步和增量同步 2.1 全量同步 全量同步就是每天都将业务数据库中的全部数据同步一份到数据仓库这是保证两侧数据同步的最简单的方式。 2.2 增量同步 增量同步就是每天只将业务数据中的新增及变化数据同步到数据仓库。采用每日增量同步的表通常需要在首日先进行一次全量同步。 通常维度表使用全量同步事实表使用增量同步 表同步策略事务事实表增量同步周期快照事实表全量同步累计快照事实表增量同步维度表中的全量快照表全量同步维度表中的拉链表增量同步 三、数仓设计 1.1 数仓分层规划 维度建模的事实表存放在DWD层维度表存放在DIM层 1.2 数仓构建流程 数据仓库模型设计除横向的分层外通常也需要根据业务情况进行纵向划分数据域。 划分数据域的意义是便于数据的管理和应用。 通常可以根据业务过程或者部门进行划分。 1.3 业务总线矩阵 业务总线矩阵中包含维度模型所需的所有事实业务过程以及维度以及各业务过程与各维度的关系。 矩阵的行是一个个业务过程矩阵的列是一个个的维度行列的交点表示业务过程与维度的关系。
http://wiki.neutronadmin.com/news/317423/

相关文章:

  • 企业网站建设背景图片识别 在线百度识图
  • 上海住远建设工程监理公司网站如何做网商商城的网站
  • 建站网站的图片怎么做类似淘宝的网站
  • 上海市杨浦区建设小学网站wordpress网页播放器
  • 销售网站页面特点企业网站的建设的目标人物是
  • 想建立什么网站吗制作投票链接哪家好厂商
  • 重庆城乡建设网站外贸网站建设网站
  • 电子商务网站建设与管理实训心得建设网站时 首先要解决两个问题 一是什么
  • 公司网站建设费如何入账建站网址打不开
  • 大型网站多少钱企业建网站流程
  • 数据库里建设好的网站为什么外网进不去网站西安装修公司哪家好
  • vue可以做pc的网站湛江网站制作多少钱
  • 查询网站开发语言排号卡分销系统开发
  • 网站阵地建设管理办法ui动效网站
  • 黎平网站建设网站常见的风格
  • 百度指数 网站机械网站建设中心
  • 德阳中恒网站建设传奇霸主官方网站
  • 可以做网站的编程有什么软件东莞响应式网站哪里好
  • 网站开发工程师前景如何替换网站
  • 网站内容建设 互联互通wordpress 主题 最简单
  • 兰州建设工程信息网站html网站登录界面模板
  • 网站域名实名认证物业建设网站
  • 网站icp备案怎么做电商平台搭建方案
  • 宁波网站建设联系方法高密市建设局网站
  • 网站建设用模板个人网站 flash
  • 网站开发实战 王wordpress 访问缓慢
  • 个人能进行网站开发互联网项目网
  • 酒店网站建设一般考虑哪些因素沙朗做网站公司
  • php app网站建设访问网站 403.14错误
  • 免备案网站空间购买谷歌搜索引擎入口2022