免费注册个人网站,网站建设的毕设报告,品质好房,一人之下王也前言#xff1a;更多关于数智化转型、数据中台内容可扫码加群一起探讨 阿里云数据中台官网 https://dp.alibaba.com/index 作者#xff1a;数据小海豚
随着大数据趋势的迅速增长#xff0c;数据的重要性与日俱增#xff0c;企业内看数据、用数据的诉求越来越强烈#x…前言更多关于数智化转型、数据中台内容可扫码加群一起探讨 阿里云数据中台官网 https://dp.alibaba.com/index 作者数据小海豚
随着大数据趋势的迅速增长数据的重要性与日俱增企业内看数据、用数据的诉求越来越强烈其中最常见的就是各种经营报表数据
老板早晨9点准时需要看到企业核心的经营数据以便进行企业战略及方向决策 业务负责人不定期进行个性化的项目筹划需要多维、及时效果数据以优化项目安排 运营需要和高层一致但粒度不同的经营分析数据并进行活动策略调整 ……
举个经营报表的例子
这个例子并不复杂但是对于分析师或者业务开发者实际执行的复杂度和工作量并不小而且类似的工作每日都在重复……业务发展越快带来的问题就越来越多 加工时间长、人工成本高招再多的分析师也难以满足需求 代码可读性差数据可维护性差类似需求需要反复、重复开发 代码开发不规范加工过程中难以避免的计算存储浪费 得到的数据指标复用性差导致重复建设数据越来越不标准规范
这种情况下对业务的直接影响就是决策周期长数据需求满足慢决策易出错数据指标口径不一致。
既要保证数据生产时效性——及时产出数据并满足需求又要支持数据多样性——企业自下而上不同业务分析场景最后还要保证数据准确性——任何时间、不同岗位的人都能用同样的数据解读经营情况怎么才能做到呢
企业的发展加速离不开20世纪的文档管理转到21世纪的信息管理。同样的如果繁复的指标代码编写工作也可以如计算器一般界面可视化点选复杂的代码研发过程由计算器自行处理完成就好了。
而Dataphin的自动化建模功能就可以很好实现这个能力。
1、选择组合条件
如下图确定需要统计计算的值Dataphin里称为“原子指标”——最小的数据值统计单元比如用户数这样的统计值等然后组合如下内容
A. 统计计算值需要应用的分析对象Dataphin里称为“统计粒度”——维度或维度的组合比如用户星级、用户状态等B. 数据统计计算的时间周期Dataphin里称为“统计周期”——统计数据需要跨越的时间长度比如最近1天、最近30天、自然周、自然月的等C. 数据统计的其他个性化限定条件Dataphin里称为“业务限定”——数据记录的筛选过滤条件比如生鲜业务类型、PC端、女性等
2 预览指标
选择完毕组合条件后可以预览组合出来的派生指标 1组合的指标默认名取“原子指标时间周期业务限定”组合名保证命名标准规范。 2历史已生成的组合不再生成保证指标建设统一无重复
3 一键自动化生成
确认需要提交的指标后一键【提交】分钟级指标生成 1自动汇聚至以“统计粒度为主题”的汇总逻辑表表下保证管理标准规范 2代码和调度依赖关系系统自动生成 3派生指标基于汇总逻辑表可快速雪花模型查询使用指标、分析对象的属性信息。 ①派生指标自动汇聚至汇总逻辑表 ②派生指标所在汇总表节点代码及调度关系自动生成
③汇总表及派生指标可查询消费
4 复杂需求实现
上面主要是基于简单统计指标实现实际上报表需求还有类似 比率型、乘积型等复合统计方式比如“客单价销售额/客户数”这类也可以通过Dataphin的衍生原子指标实现
1衍生原子指标是基于原子指标的再组合
2基于衍生原子指标新建派生指标时需要保证拆解到最细粒度的原子指标有相同的分析维度、时间周期允许维度的计算路径不同、设置的业务限定不同。
①新建衍生原子指标 ②基于衍生原子指标新建派生指标
总结
上面步骤可以看到派生指标的计算生成离不开原子指标、业务限定、统计粒度的协助这其中有什么奥秘呢
其实很简单用Dataphin高效创建派生指标掌握这1张图就够了
1原子指标为核心原子指标的来源表为中心 2统计粒度取自来源表的关联维度以及关联维度上的关联维度 3业务限定基于来源表为中心的雪花模型做定义 4统计周期可任意搭配使用 数据中台是企业数智化的新基建阿里巴巴认为数据中台是集方法论、工具、组织于一体的“快”、“准”、“全”、“统”、“通”的智能大数据体系。目前正通过阿里云数据中台解决方案对外输出包括零售、金融、互联网、政务等领域其中核心产品有
Dataphin一站式、智能化的数据构建及管理平台Quick BI随时随地 智能决策Quick Audience全方位洞察、全域营销、智能增长Quick A 跨多端全域应用体验分析及洞察的一站式数据化运营平台
官方站点 数据中台官网 https://dp.alibaba.com
原文链接 本文为云栖社区原创内容未经允许不得转载。