京东物流基于Doris的亿级数据自助探索应用
时间:2021-08-19 16:29:55
手机看文章
扫描二维码
随时随地手机看文章
[导读]导读:京东智慧物流在数据应用方面,主要是基于大数据预测分析技术实现智能化的调度、决策,提升物流效率,最终提升客户的体验。但面对亿级数据的业务场景,将会面临着不同的问题和不同的处理方案。今天讨论了京东物流在亿级数据管理和应用方面,利用ApacheDoris进行的探索和实践。01业务...
导读:京东智慧物流在数据应用方面,主要是基于大数据预测分析技术实现智能化的调度、决策,提升物流效率,最终提升客户的体验。但面对亿级数据的业务场景,将会面临着不同的问题和不同的处理方案。今天讨论了京东物流在亿级数据管理和应用方面,利用Apache Doris进行的探索和实践。01业务场景介绍首先和大家分享下京东物流业务的需求和亿级数据自助应用的背景。介绍京东物流经营数据发展路线,底层数据的演进思路,业务对于数据诉求迭代。1. 业务需要什么京东物流除了包括快递服务的仓、运、配三个环节外,它的一体化供应链物流服务,则更多是基于对商品销售和供应链的理解,合理规划仓网,分布库存,提前将用户需要的货物储存到其在全国范围数百个不同等级的仓库中。当用户下单后,商品将直接从最近的仓库送达站点,开始配送。用户下单后,快递公司会通过干线网络,将货物运输至对应的区域,再分发至配送站点进行配送。这些服务以一体化解决方案的形式提供予客户,满足客户的各种需求,业务极其复杂。对于我们数据侧的建设工作者来说,会遇到各种各样的现实问题:
- 早:海量数据的多维查询已经成为常态,高时效保障是业务的最新追求,甚至要求实时;
- 散:数据存储在不同的业务系统,各个系统没有标准的数据规范, 数据重复建设;
- 重:日报、周报、半月报、月报等工作效率低,部分重复工作多,数据统计费时费力;
- 慢:全国区域、战区以及各产品群数据场景多样,无法快速响应数据变化;
- 缺:缺少统一的数据资产管理,运营人员无法方便、快捷地进行统一的数据分析;
- 难:领导获取数据难, 营销投入产出比衡量难,数据驱动业务难,数据价值挖掘难。
- 长远解决方案:用户需求反哺,沉淀方法论,线下分析报表化,支持自助探索。
- 短期解决方案:导出时,弹窗提醒法律风险;导出形成账单,并每月发送给区总了解。
- 分析权限:因历史积累,访问大数据开发分析平台的权限不匹配当前安全要求。例如,有些业务分析师可以访问库内全量表,未区分区域;
- 指标权限:指标的访问权限控制散落在各系统管理,无法做到统一控制,容易混乱和遗漏。
- 分析权限:梳理BDP访问权限,按照业务特性缩小访问范围,并制定岗位权限白皮书;
- 指标权限:指标出口由统一数据API进行控制,指标查看权限设置由指标收口人在资产管理平台统一设置。
- 内部工具调研,京东动力目前处于快速迭代阶段,调研现阶段支持功能,定制化开发的相应速度;
- 外部工具调研,从成本,市场成熟度,产品易用性,扩展性,性能等多维度交叉比对市场主流BI工具的优缺点;
- 内外部工具对比,业务方、产品经理以及研发三方组成专家评分组,对内外部工具进行评分;
- 工具对比结论,最终确定BI工具实施方案。
- 京东动力作为分析工具
- 动力从商城数据中台引入
- 性能慢:分钟级,高峰期出不来
- 上卷、下钻等功能缺失
- 体验不友好,拖拽繁琐
- 提数,本地分析
- 隐患:数据导出后无法跟踪
- 引入更适合的工具
- 调研:动力的计划,Tableau、永洪BI等
- 提供便捷自助服务:一站式分析平台,集数据准备、报告制作、数据分析为一体,业务人员也能轻松、快速地制作并分析数据报告,带来业务驱动的数据分析工作模式。多维度下钻和上卷。
- 内嵌丰富组件,上线周期短,组件丰富,可以对所有数据源进行合并、搜索、交互和分析。
- 移动跨屏,无缝支持PC、iPhone、iPad和Android,并在这些终端设备上保持一致、易用的用户体验。
- 高性能,秒级计算,利用列存储和内存计算,实现千万级数据分析的秒级响应;提升性能,支撑更多的分析维度和更大的数据范围。
- 自主分析不便捷,加工链条过长,需要前端,UI,产品以及UI多方配合,资源协调困难,沟通成本较高;
- 定制化研发投入多,定制化开发,不同维度的分析需要开发不同的汇总以及前段展示界面,底表模型变更影响范围广;
- 图表组件不丰富,对于每种新的应用场景均需要不同的额开发集成,各功能模块之前需要联调测试,开发周期长,暂不支持移动端;
- 无法跨屏展示