您当前的位置:首页 > 电脑百科 > 程序开发 > 架构

什么是理想的数据中台架构

时间:2021-06-11 11:04:54  来源:CIO之家   作者:

当人们谈论数据中台时,他们在谈论什么

当下,人人都在谈论数字化转型,但怎么转,做什么,中台有可能成为企业推进数字化转型的有效方法之一。“中台”早期是由美军的作战体系演化而来的,使用“中台”这种作战体系,目的就在于给予前方高效、灵活和强大炮火支持。2015年,阿里巴巴率先提出了“中台战略”,以及其有名的“大中台、小前台”的机制。2018年8月,阿里发布“双中台+ET”数字化转型方法论,阿里的双中台包括了数据中台和业务中台。在“业务中台”模式下,前端业务部门可以像搭积木一样调用平台上的产品技术模块,从而快速搭建新业务场景。“数据中台”则打破了不同业务部门之间的烟囱式IT架构,从而打通数据孤岛,实现了“一切业务数据化”的目标。ET大脑是指其面向特定行业的智能化解决方案。

在阿里中台概念的引领下,很多企业也提出了自己的“中台战略”。如把内部一些通用性技术平台、支撑系统打包在一起,称之为技术中台;把一些大的业务服务系统,逻辑上集中起来称之为业务中台;或干脆把现有的数据仓库、数据治理平台、数据运维平台整合称之为数据中台;还有一种更简单的方式,就是把以前内部IT支撑系统的后台直接改名,与数据相关的部分就叫数据中台,与业务耦合度较紧密的就叫业务中台。以上定义,各有各有道理,但有一点大家都有一致的意见,就是建立中台的目的在于:减少冗余,增加复用,快速响应用户需求。

一般来说,数据中台是指企业利用大数据技术,对内外部海量数据统一进行采集、计算、存储,并使用统一的数据规范进行管理,数据规范包括数据口径、数据模型、元数据规范、参考数据标准、主数据标准、业务规则等。更进一步,广义的数据中台,还包括企业长期积累下来与业务有较强关联性的一些技术组件,如业务标签,算法模型,数据产品等。数据中台的主要作用在于将企业内部所有数据统一处理形成标准化数据,挖掘出对企业最有价值的数据,构建企业数据资产库,对内对外提供一致的、高可用大数据服务。

阿里公司数据中台案例分析

阿里是数据中台概念的首先提出者,其案例更具分析意义。从网络中流传的一幅阿里巴巴数据中台全景图(图1)可以看出,阿里的数据中台包括了计算与存储平台、数据资产管理、智能数据研发、统一数据中心中间件(OneService)四大模块,最上层支撑着阿里数据、数据大屏、生意参谋等大数据应用。

什么是理想的数据中台架构

图1: 阿里巴巴数据中台全景图

阿里的统一数据中心中间件又分为萃取数据中心、公共数据中心和垂直数据中心三部分,垂直数据中心负责从阿里旗下各个业务单元采集数据,公共数据中心类似数据仓库,将所有数据按不同主题域(电商、文娱、营销、物流、金融等)分类管理,萃取数据中心负责按照业务需求,将各主题域数据加工处理,建立起消费者、企业、内容、商品、位置五大数据体系。阿里数据中台的目的旨在对内提供数据基础建设和统一的数据服务,对外提供服务商家的统一化数据产品。

通过以上架构,可以看出,阿里提出的数据中台模式有以下一些特点。首先是对全域数据的采集与存储,实现了对企业中各业务类别数据的整合和集中化管理。其次是按照规范化的数据架构(数据仓库规划、数据模型构建、指标定义规范等)统一研发数据,实现数据口径、数据模型标准化。第三是建立业务需求驱动的几大数据体系,深度萃取数据价值;第四是集成数据资产管理能力,从数据的运营、应用、管理、分析、可视化五方面统一管理数据资产。

通过这样的数据中台架构设计,阿里实现了对下屏蔽各数据来源不同的现状,对上提供统一的数据服务接口和标准化数据。数据中台将阿里内部诸如淘宝、天猫、聚划算这些数据孤岛一一打通,将公共数据能力积累沉淀,对内对外提供数据共享服务,新的业务需求再出现的时候,开发人员不用再从头做起,直接基于数据中台提供的能力,就可以快速完成新应用开发。

一种理想的数据中台架构

企业建设数据中台的最终目标还是赋能业务,服务用户。数据中台的建设也不应该只是一个口号,一次运动,或一个项目,而是需要企业不断去投入资源、迭代更新,通过数据中台的建设,驱动企业业务创新和发展。企业建设数据中台,可以通过合理规划、复用内部现有已经完善的大数据处理工具来支撑建设,充分借鉴业界数据中台建设实践,从核心需求出发,以某垂直业务的数据入手,打通数据采集、存储、计算、治理、服务的工作全流程,逐步扩展到全域数据的接入、加工和管理,建设起自有的数据中台。

什么是理想的数据中台架构

图2:理想中的数据中台架构

数据中台包括哪些内容,做哪些事情,图2是笔者理想中的数据中台架构。共分为五个大的功能组成。

数据采集。为数据中台提供汇集数据的能力,应提供统一的数据获取接入方式,数据来源包括内部数据和外部数据,数据类型应支持结构化和非结构化数据采集。传统的ETL工具仍然可以复用,实现数据采集、转换、加载等关键处理过程。采集方式上应能支持对周期性接口文件的批量采集,对产生频率高、实时性强的数据以数据流形式采集,针对企业外部互联网数据,使用网页爬虫自动抓取的方式采集。

数据计算。为数据中台提供统一的大数据计算能力,针对不同大数据处理场景,所需提供的数据计算能力也不同,一般主要包括批量离线计算(如MapReduce)、内存计算(如Spark、Ignite)、在线流式计算(如Storm、Samza、Spark Streaming、S4)等。特别是人工智能技术的广泛发展和应用,基于大数据对机器学习算法模型的训练工具(如Mahout、Spark MLib、Caffe、Keras、TensorFlow)也可以归为数据计算工具的类别。

数据存储。数据中台中全域数据的存储中心,按照不同的数据类型,可以采用图2中一种或多种数据存储系统的“混搭”架构。传统数据仓库(如DB2/ORACLE/Teradata)是最为成熟稳定的数据存储方式,承载着及时性、准确性要求高的企业核心应用。分布式关系数据库,也常简称为MPP数据库,相较于传统的关系型数据库,具有高性能处理能力、高数据吞吐能力的优势。NoSQL分布式数据库属于非关系型数据库管理系统,在大数据简单存取上具备关系型数据库无法比拟的性能优势。分布式文件系统(HDFS)是当前最常见的大数据存储方式,它具极高的性价比,扩展性强。数据湖作为一种新的存储大量复杂格式数据,避免企业数据孤岛化的数据架构方案,可用来将不同结构的数据统一聚合和存储。

数据治理。亦称之为数据资产管理,指的是为了实现对企业中数据资产价值的获取、管控、交付等目的,基于制定的数据规范,对数据资产所做的一系列管理活动。数据标准管理指对数据口径、公共术语、参考数据、数据编码等制定和实施标准化的管理活动。数据模型管理负责对系统中核心的逻辑模型、物理模型、数据库表、字段、视图等进行统一管控、促进其规范化。元数据管理的作用是统一管理所有业务系统元数据,包括业务元数据、技术元数据、流程元数据和数据管理制度元数据。数据质量管理,指运用质量管理技术稽核、度量、评估和改进数据的质量水平。数据安全管理,指通过制定和执行数据安全政策和措施,为数据提供的认证、授权、审计等安全管理能力。

数据服务。包括了与业务相关的、可复用的一些公共技术组件或产品,如数据目录、数据标签、数据分析、数据开放接口、机器学习算法模型等,它们可以使用SAAS方式直接对外提供服务,也可以以更小粒度如API、消息接口、文件接口、服务接口、SDK软件包等方式只提供组件能力或数据服务,内部或外部第三方应用不必关心底层数据准备情况,直接调用数据服务模块对外提供的服务接口,就可以方便进行二次开发,借以增强自身的能力。

以上五个功能部分中,数据采集、数据计算、数据存储三部分能力,企业已经都有现成的一些积累,不需要重复开发,只要合理规划进行统一,就很容易获取和建设起来。数据治理的能力,常常分散在各个支撑系统中,需要统一抽取出来,对以前考虑不全的内容需要补充。数据服务能力,则更多是与业务关联的、复用性较好的应用组件,需要企业长期提炼、积累和优化。

结语

大数据时代,数据常被比作石油,数据中台的作用就是炼油厂。在没有数据中台的时候,企业内部、外部数据不断积累,数据采集方式多种多样,数据计算、存储方式各自为政,数据治理只限于某些业务条线或主题域内数据,数据服务方式也是五花八门,造成了企业内部数据口径、数据模型、参考数据、质量标准、服务接口参差不齐,数据加工效率低下,极大制约了数据对应用的支撑能力。有了数据中台,通过对海量数据进行统一采集、计算、存储、治理,进行标准化,形成对企业真正有价值的数据资产,才能为上层大数据应用提供高质量的数据服务。数据中台,未来有望成为企业大数据核心能力掌控的重要抓手。

CIO之家 www.ciozj.com 微信公众号:imciow



Tags:数据中台   点击:()  评论:()
声明:本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,如有任何标注错误或版权侵犯请与我们联系(Email:2595517585@qq.com),我们将及时更正、删除,谢谢。
▌相关推荐
不知几年前,数据中台这个概念开始变得很热闹,各个机构都要上中台,中台架构意味着先进,人见人爱,也冒出许多以中台为业的软件公司。然而,大概从去年中开始,听说又有好多机构开始忙着...【详细内容】
2021-08-19  Tags: 数据中台  点击:(79)  评论:(0)  加入收藏
数据中台不是一个单纯的系统,而是一套架构、一套数据流转模式。数据中台需要采集数据作为原材料进行数据加工、数据建模,然后分门别类地储存,再根据实际的业务场景,打造各类数据...【详细内容】
2021-08-16  Tags: 数据中台  点击:(58)  评论:(0)  加入收藏
在人工智能、大数据等技术发展和企业数字化转型加速的双重驱动下,数据中台在众多赛道中脱颖而出,成为行业焦点。除了提供综合解决方案的互联网头部企业之外,专注于某一具体场景...【详细内容】
2021-07-28  Tags: 数据中台  点击:(112)  评论:(0)  加入收藏
当人们谈论数据中台时,他们在谈论什么当下,人人都在谈论数字化转型,但怎么转,做什么,中台有可能成为企业推进数字化转型的有效方法之一。“中台”早期是由美军的作战体系演...【详细内容】
2021-06-11  Tags: 数据中台  点击:(125)  评论:(0)  加入收藏
这几年的数据领域出现好多的概念,例如:人工智能、物联网、边缘计算、数据治理、数据湖、数据中台……可谓是“百花齐放”!一时间大家都在提新概念,但却不是所有人都...【详细内容】
2021-02-25  Tags: 数据中台  点击:(152)  评论:(0)  加入收藏
导读:《终于有人把数据中台讲明白了》一文讲到数据中台的定义和价值,本文将介绍数据中台到底包括什么内容。企业建设数据中台的过程中哪些能力是必选项,哪些是可选的,将在本文一...【详细内容】
2020-11-10  Tags: 数据中台  点击:(113)  评论:(0)  加入收藏
转载本文需注明出处:微信公众号EAWorld,违者必究。 数据中台的概念由来已久,从技术产品构成上来讲,比如数仓、大数据中间件等产品组件相对完备。但是我们认为依然不能把数据中...【详细内容】
2020-10-20  Tags: 数据中台  点击:(77)  评论:(0)  加入收藏
近一年来,由于大家都知晓的原因,大部门行业受到严重冲击,企业们达到了生死存亡之际。然而,眼看着一些企业通过灵活运用互联网和大数据而趁着疫情当口找到自己的突破点,实现蝶变(例...【详细内容】
2020-08-04  Tags: 数据中台  点击:(69)  评论:(0)  加入收藏
Dataphin(智能数据构建与管理)是阿里巴巴数据中台团队研发的数据中台产品,它用于阿里集团(含蚂蚁科技)内部的数据中台建设,即它是阿里巴巴集团自己使用的数据中台产品。。Dataphin...【详细内容】
2020-07-04  Tags: 数据中台  点击:(1564)  评论:(0)  加入收藏
“数据中台”作为2019年科技圈公认的最火概念,当仁不让地占据了各大行业数字化转型舞台的“C位”。众多机构纷纷加紧布局,开启了头部企业对数据中台的探索热潮——...【详细内容】
2020-06-15  Tags: 数据中台  点击:(88)  评论:(0)  加入收藏
▌简易百科推荐
为了构建高并发、高可用的系统架构,压测、容量预估必不可少,在发现系统瓶颈后,需要有针对性地扩容、优化。结合楼主的经验和知识,本文做一个简单的总结,欢迎探讨。1、QPS保障目标...【详细内容】
2021-12-27  大数据架构师    Tags:架构   点击:(3)  评论:(0)  加入收藏
前言 单片机开发中,我们往往首先接触裸机系统,然后到RTOS,那么它们的软件架构是什么?这是我们开发人员必须认真考虑的问题。在实际项目中,首先选择软件架构是非常重要的,接下来我...【详细内容】
2021-12-23  正点原子原子哥    Tags:架构   点击:(7)  评论:(0)  加入收藏
现有数据架构难以支撑现代化应用的实现。 随着云计算产业的快速崛起,带动着各行各业开始自己的基于云的业务创新和信息架构现代化,云计算的可靠性、灵活性、按需计费的高性价...【详细内容】
2021-12-22    CSDN  Tags:数据架构   点击:(10)  评论:(0)  加入收藏
▶ 企业级项目结构封装释义 如果你刚毕业,作为Java新手程序员进入一家企业,拿到代码之后,你有什么感觉呢?如果你没有听过多模块、分布式这类的概念,那么多半会傻眼。为什么一个项...【详细内容】
2021-12-20  蜗牛学苑    Tags:微服务   点击:(8)  评论:(0)  加入收藏
我是一名程序员关注我们吧,我们会多多分享技术和资源。进来的朋友,可以多了解下青锋的产品,已开源多个产品的架构版本。Thymeleaf版(开源)1、采用技术: springboot、layui、Thymel...【详细内容】
2021-12-14  青锋爱编程    Tags:后台架构   点击:(20)  评论:(0)  加入收藏
在了解连接池之前,我们需要对长、短链接建立初步认识。我们都知道,网络通信大部分都是基于TCP/IP协议,数据传输之前,双方通过“三次握手”建立连接,当数据传输完成之后,又通过“四次挥手”释放连接,以下是“三次握手”与“四...【详细内容】
2021-12-14  架构即人生    Tags:连接池   点击:(16)  评论:(0)  加入收藏
随着移动互联网技术的快速发展,在新业务、新领域、新场景的驱动下,基于传统大型机的服务部署方式,不仅难以适应快速增长的业务需求,而且持续耗费高昂的成本,从而使得各大生产厂商...【详细内容】
2021-12-08  架构驿站    Tags:分布式系统   点击:(23)  评论:(0)  加入收藏
本系列为 Netty 学习笔记,本篇介绍总结Java NIO 网络编程。Netty 作为一个异步的、事件驱动的网络应用程序框架,也是基于NIO的客户、服务器端的编程框架。其对 Java NIO 底层...【详细内容】
2021-12-07  大数据架构师    Tags:Netty   点击:(16)  评论:(0)  加入收藏
前面谈过很多关于数字化转型,云原生,微服务方面的文章。虽然自己一直做大集团的SOA集成平台咨询规划和建设项目,但是当前传统企业数字化转型,国产化和自主可控,云原生,微服务是不...【详细内容】
2021-12-06  人月聊IT    Tags:架构   点击:(23)  评论:(0)  加入收藏
微服务看似是完美的解决方案。从理论上来说,微服务提高了开发速度,而且还可以单独扩展应用的某个部分。但实际上,微服务带有一定的隐形成本。我认为,没有亲自动手构建微服务的经历,就无法真正了解其复杂性。...【详细内容】
2021-11-26  GreekDataGuy  CSDN  Tags:单体应用   点击:(35)  评论:(0)  加入收藏
最新更新
栏目热门
栏目头条