所有栏目
43

一文讲清数据平台与数据中台的关系与区别

2024/5/14

  如果您是IT领域或者数据领域的从业者,一定对IT行业“创造”概念的能力深有体会,也一定经常被看起来名称相似,但又不同的各种概念绕的云里雾里,摸不着头脑。今天我们要讨论的是数据平台和数据中台两个概念,您是不是觉得这两个概念都有所了解,但真要对他们的关系、区别说出个一二三四来,又一时无从下手?今天,就带您一起梳理、分析并总结,让您通过本文快速了解数据平台和数据中台。

  01 定义

  首先,我们先来看看他们的定义:
  数据平台数据平台是以处理海量数据存储、计算及流数据实时计算等场景为主的一套基础设施,旨在提供数据采集、处理、存储、分析、可视化的一站式服务能力。

  数据中台是一套可持续“让企业的数据用起来”的机制,是一种战略选择和组织形式,数据中台依据企业特有的业务模式和组织架构,通过有形的产品实施方法论支撑,实现数据能力的抽象复用共享,赋能业务部门,提高实现数据价值的效率

  02 核心能力及解决的问题

  数据平台的核心能力以 Hadoop、Spark、Hive 等作为大数据基础能力层,在大数据组件上搭建包括数据分析,机器学习程序等 ETL 流水线,以及包括数据治理系统、数据仓库系统、数据可视化系统等核心功能。
  数据平台解决的核心问题大数据平台解决了海量多源、异构、实时数据的计算、存储、处理、整合、分析与可视化等问题。强调要将数据打通,消除数据孤岛。
  数据中台的核心能力
  阿里认为数据中台其三项核心能力分别为OneModel 负责统一数据构建及管理,OneID 负责将核心商业要素资产化,OneService 负责向上提供统一的数据服务。听起来有些复杂,我们可以这样理解数据中台的核心能力,即通过提供工具、流程和方法论,来实现数据能力的抽象、共享和复用,赋能业务部门,提高数据价值变现的效率。“抽象”是为了达成“OneModel”、“共享”则是为了“OneID”、“复用”才能让“OneService”更有意义。
  数据中台解决的核心问题
  1.解决数据孤岛问题,强调数据集中存储、统一管理,从而降低了使用数据服务的门槛;
  2.重复造轮子,系统越发臃肿,费时费力费钱;
  3.强调数据共享和复用的概念,数据中台通过提供灵活的数据服务,使得业务人员能够快速响应市场需求,促进了服务的创新。


  03 区别分析

  其实,数据平台和数据中台的建设目的都是发掘数据价值,高效实现数字化运营,如果必须要将数据平台和数据中台区分开来,可以从以下两个角度来分析:

  3.1 本质区别

  从本质上来讲,数据平台更关注技术基础设施,侧重于提供数据管理和处理的技术基础设施和工具集合;而数据中台更加强调数据在业务中的角色,数据中台是具备业务属性的,输入的是原始数据,输出的是业务部门可以直接使用的数据能力或可直接销售的数据产品。
  举一个制造型企业的例子
  如果数据中台是企业的制造工厂,那数据平台更像是制造工厂里的设备(切割机、电焊机等)。数据平台可以对数据进行加工和处理(切割机、电焊机可以对钢材进行切割和焊接),数据中台则可以按照业务需要、工作流程、方法论将数据包装成服务和产品(制造工厂可以按照标准、工艺,利用切割机、电焊机将钢材加工成模具或柜子)

  3.2 功能区别

  从功能的角度讲,数据中台更像是数据平台的一个超集。
  数据平台提供了包含Hadoop、Spark、Hive、HBase、Flume、Sqoop、Kafka、Elasticsearch的大数据基础能力层,并在这些组件上搭建了包括数据分析、机器学习程序、数据治理系统、数据仓库系统、数据可视化系统等ETL流水线。
  数据中台在数据平台的基础之上,数据中台还应该提供全局的数据应用资产管理、全局的数据治理机制、自助的、多租户的数据应用开发及发布、数据应用运维、数据应用集成、数据即服务,模型即服务、数据能力共享管理、完善的运营指标等系统功能。

  04 总结

  介绍了这么多,相信大家已经不再是“平台”、“中台”傻傻分不清楚的状态了,小兵对两者的区别再做一个总结:
  数据平台是以海量、多源异构、实时数据计算、处理、存储为主的一套基础设施侧重于数据管理和处理的技术基础设施和工具集的提供;

  数据中台:是一套持续提升数据价值,推动业务创新的机制,是一种战略选择和组织形式。在提供基础的技术设施的基础上,还加入了业务属性强调数据在业务中的角色,以支持更高效的业务运作和创新,数据中台更注重数据的整合、流通、共享、复用和业务价值的提升。

转载自公众号数据分析小兵