所有栏目
6

【数升之声】从数据编织看复杂数据应用

2024/9/12

什么是数据编织

  近年来,国际知名咨询机构Gartner提出了数据编织(Data Fabric)这一设计理念,并从2018年起连续几年被列为年度数据和分析技术领域的十大趋势之一,成为数据管理领域的又一重大的创新实践模式。数据编织不是一个具体的产品,而是一种数据管理和集成的架构理念,它通过集成、管理和提供数据访问来简化复杂的数据环境。数据编织利用自动化和智能技术,如机器学习和人工智能,实现数据的无缝连接和统一视图,帮助企业更高效地管理和利用数据资源。

  数据编织的核心在于实现数据的动态发现、连接和分析,以及通过知识图谱、元数据管理等技术手段,构建一个灵活、可扩展的数据管理框架。它能够支持企业在多云和混合云环境中,快速、灵活地访问和整合分散在不同系统和平台上的数据资源,从而提高数据的可用性和分析的效率。


  数据编织包括的关键组件一般包括:数据源层,能够连接各种类型的数据源,包括内部和外部数据;数据目录层,利用新技术自动识别和分析元数据,构建知识图谱;知识图谱层:通过AI/ML算法简化数据集成设计,提供数据的智能推荐;数据集成层:提供自动编织、动态集成的能力,支持多种数据集成方式;数据消费层:面向所有类型的数据用户,提供数据和服务。

  数据编织的目标是实现“数据找人”而非“人找数据”,通过自动化和智能化的数据管理,减少人工干预,提高数据处理的速度和准确性。随着企业对数据依赖程度的增加,数据编织作为一种现代化的数据管理和集成方法,正逐渐成为企业数字化转型的重要支撑。

数据编织的启发

  从数据编织的设计理念可以看到,它是针对复杂的数据结构,通过灵活、可重用、增强的以及有时自动化的数据集成来支持跨业务的数据访问和应用实现。数据编织架构的目标是简化组织的数据集成基础设施,并创建一个可扩展的解决方案,本质上是减少技术成本,提高数据应用效率。数据编织构建于现有架构之上,利用了现有的元数据和基础设施,无需“彻底替换”现有设计。它通过将被动元数据转换为主动元数据,识别跨两个或多个使用相同数据的系统的行动,从而增强数据集成和数据管理任务的自动化。

  目前,在数字化转型进程中,大批的集团化企业正在从数据生成时代,进入数据深度挖掘和赋能的数据价值时代,数据编织正是适应数据结构和存储高度复杂的环境而应运而生的技术架构和方法。数据编织的目标聚焦在几个关键价值:

  1、简化数据管理:集团化企业通常面临数据源多样化和数据结构复杂的挑战。数据编织通过提供一个统一的数据视图和集成平台,简化了数据的发现、访问和管理过程;

  2、提高数据的可访问性和一致性:数据编织能够确保数据对于需要它的用户来说是可访问的,并且无论数据存储在何处都能保持一致性,这对于集团化企业中的跨部门和跨业务单元的数据共享尤为重要;

  3、支持数据驱动的决策:通过提供准确的数据和分析,数据编织帮助企业领导和业务用户做出基于数据的决策,从而提高决策的速度和质量;

  4、促进数据共享和协作:数据编织支持跨部门和团队的数据共享,促进了协作和创新,这对于集团化企业中的多个业务单元协同工作至关重要;

  5、应对数据安全和合规性要求:集团化企业往往需要遵守严格的数据保护法规。数据编织可以帮助企业确保数据的安全性,同时遵守数据保护法规和公司政策;

  6、支持数字化转型:数据编织是数字化转型的重要组成部分,它有助于企业加强沟通交流,改善信息可见性,并提供新的软件功能,从而推动企业的数字化进程。

  7、降低技术成本:通过自动化和智能化的数据管理,数据编织减少了人工数据管理的工作量,降低了因数据集成和管理不善而产生的额外成本。

  8、提高数据资产价值:数据编织有助于企业更有效地管理和利用数据资产,通过数据资产的价值评估和优化,推动企业的数据驱动增长。

  相比于数据中台、数据湖等复杂数据集成应用的软硬件产品性解决方案,数据编织提供的是一种数据管理和集成的架构方法,具有更柔性的成长空间,是非常值得期待和实践的技术。特别是,数据编织为集团化企业提供了一个灵活、可扩展的数据管理和集成的软架构设计方案,是当前企业基于复杂多变的数据环境完成多元数据应用需求的重要实践方法。