您当前的位置:首页 > 互联网百科 > 云计算

阿里云的“终端云化”实践,基于ENS进行边缘架构构建

时间:2022-09-14 11:50:21  来源:  作者:VideoMachine


 

 

“ 终端无休止的更新迭代,软件对计算资源的需求激增。

 

技术作者|王广芳

内容编辑|IMMENSE

这是个万物更迭速度惊人的时代。

世界多元延展,大众需求激增,而满足需求,终端设备的死亡迭代随之疯狂加速。

于是,手机、电脑被无休止的更新换代,究其背后,本质是消费终端软件对计算资源的需求激增所致。

情况同样映射在企业。

数字化时代的今天,IT终端是企业的重要生产力。据了解,PC终端设备的使用寿命是3-6年,随着使用年限的增加,运行速度慢、性能不足、故障率提高等问题层出不穷。

企业如果选择IT设施更替,会周期性产生高昂成本,由此产生的存量IT设备也逐渐成为管理、数据、应用、安全的孤岛,造成极大的运维压力和成本。

在此之上,5G时代让各行业探索的新场景和新应用不断涌现,软件功能的不断丰富、智能操作系统的不断升级,对场景中终端设备的要求也越来越高,这也是对计算资源需求的与日俱增。

于是,腾挪计算资源,将终端设备“就近上云”,可能是最好的解法。即终端云化。

01 终端云化:打破硬件的桎梏

近几年,“终端云化”技术开始规模化落地,其核心思想是“计算卸载”,即将智能终端的计算任务卸载到边缘云虚拟终端处理,解决终端设备在算力和存储等方面的不足。

比如最近火爆的云游戏,使得在低配的手机、PC端甚至智能电视上玩大型高画质游戏成为可能。

为了更好的理解终端云化的优势和特点,下面将以阿里云视图计算产品VEC(Visual Edge Computing)为例进行说明。

视图计算VEC重点服务的是视频图像设备(消费电子、摄像头、车载终端等)上云场景,通过设备终端的标准协议接入,提供设备管理、视图处理、视图存储等服务。

“终端云化”技术打破了硬件的桎梏,其优势可总结为以下两点:

一是功能演进与终端设备解耦。

功能和性能的演进不再依赖终端设备的配置和升级,面对各种周期长、一致性差、兼容性等问题,只需要云端服务统一升级即可。

比如:VEC服务的普通摄像头需要增加AI识别功能,不需花费巨资更换高价的智能摄像头,只需将接入到云端的视频流对接AI识别服务,简单配置参数即可。

二是高效的规模化管理。

当终端设备规模到达一定规模后,终端本身的管理以及终端上生产数据的管理就是一个很大的挑战了,尤其是VEC服务的视图类设备,会产生大量的视频或图片数据,在云端基于平台进行设备管理、流处理、流存储的能力是设备端无法企及的。

视图计算VEC作为终端云化的典型场景,重点构建了视图设备一键上云标准化协议、截图/录制/转码/混流等流媒体处理、视图AI、视图存储等核心技术能力,但最核心的竞争力来自基于边缘云打造的架构优势。

02 “终端云化”为何依赖边缘云?

边缘云节点无处不在,离用户更近、数据处理延时低,可带来更好的体验。

边缘云能为”终端云化“带来什么?

仍然拿视图计算VEC来进行说明,常规的VEC系统设计可以是完全的中心架构,构建起来比较简单,如下图所示。


 

可以看到,VEC系统应用统一部署在一个Region,面向全网所有的视图设备提供GB协议和自研协议的接入服务,并支持接入设备以RTP或RTMP协议推流,进行切片录制、截图、转码、AI分析、存储、实时播放、录像回看等服务。

但是VEC产品服务了海量的视图设备,视图流数据需要持续上传到平台进行处理,如果全部数据都到中心统一处理,成本是非常高的。

这类比较典型的终端云化大流量场景,如果能够将流量收敛到边缘进行处理,将明显降低流量成本,提升产品的竞争力。

同时,如果全网设备统一推流到中心,并不能确保所有设备推流的低延时体验,边缘就近接流是非常有必要的。

此时,边缘架构的两大优势就显现出来了。

一是就近接入,接流网关可以基于边缘节点进行广泛覆盖,支持设备的就近低延时接入;

二是更低成本,设备的视图流数据可以在边缘完成处理和存储,优化流量和存储成本。

03 完整的边缘架构系统是如何构建的?

接下来,如何设计业务系统的边缘架构?

中心架构与边缘架构的主要差异是,从“中心-终端”两层架构到“中心-边缘-终端”三层架构的演进。边缘云作为中间层,整体思路上将重点考虑终端能力的上移和中心能力的下沉。

终端能力上移可以降低终端硬件要求以及软件复杂度,对于海量终端的场景,在终端成本优化和易运维方面会有明显收益,这也是VEC在视图设备上云场景提供的价值逻辑。

中心能力下沉则主要评估业务系统中边缘和中心有成本差异的模块,比如VEC的视图流在边缘接入后可以在边缘完成处理和存储,后续的视图数据读取也可以直接从边缘访问,这样就大幅收敛了边缘回到中心的流量,带宽成本得到优化。


 

对VEC系统中心模块和边缘模块的评估,可以提炼为以下几类情况:

 

  • 全局统一管控类的模块需要部署在中心,比如设备管理、权限管理等;
  • 中心和边缘部署差异不明显,可根据场景灵活选择,或者优先中心部署,运维相对更简单,比如信令网关等;
  • 针对边缘下沉场景需要在中心增加一些模块,比如节点管理、针对边缘多节点的调度等;
  • 服务型模块(视图流处理和存储相关模块)尽量下沉边缘,通过调度进行区域分布式服务,比如接流网关、流处理、视图存储等。

 

最终的VEC边缘架构如下图所示。

其中ENS是阿里云的边缘云产品-边缘节点服务(Edge Node Service),提供了虚机、容器等多种形态实例,块存储、对象存储等多种存储服务,以及LB、NAT等多种网络组件,在全国完成重点城市的全域覆盖。

VEC基于ENS进行边缘架构构建,明显降低了技术方案落地的研发成本,同时在边缘基础设施层的稳定性方面产品级的保障,可以更专注业务系统自身的技术迭代。


 

针对边缘架构,系统要建设一些关键能力,更好地发挥边缘架构的优势,主要包括:

资源与业务调度能力

资源由中心统一模型升级为边缘分布式模型,配套的资源和业务调度成为系统核心能力,包括访问和流量就近调度,以及节点故障或水位较高时的可用性调度等;

云边协同管控能力

中心管控和边缘管控一起形成闭环,比如用户通过中心OpenAPI编排一个处理流程,首先切片录制,存储为固定时长的文件,然后读取文件进行AI识别,就涉及到中心解析模板->多模块参数下发边缘->边缘模块按流程和参数处理->识别的结构化信息回传中心->中心信息处理等云边交互管控的复杂链路;

云边稳定且安全的通信能力

中心与边缘基于互联网的远程通信RPC,需重点考虑通信安全和通信可靠性,云边协同管控依赖云边稳定且安全的通信能力;

边缘自治管控能力

边缘需要具备一定的自治管控能力,以应对高性能、高可用、云边一致性等场景的要求,比如减少边缘处理逻辑中对中心的依赖,以及当云边通信短时不可用时能够持续服务并在恢复后进行状态同步等。

构建一套完整的边缘架构系统,还需要什么?配套的系统能力。

主要包括:

边缘节点高效部署

边缘节点部署包括节点资源的申请和初始化,以及边缘模块应用的部署和发布。边缘架构需要大量的边缘节点进行服务,节点的部署和纳管必须标准且高效,应用容器化部署是一个不错的选择。

配置管理及配置动态下发

业务调度和云边协同管控等核心能力都有基于策略和配置进行动态管理的需求,实现灵活的场景适配,以及全网资源更高效的使用。

远程运维系统

远程运维能力包括边缘状态和日志的采集上报、监控告警、远程诊断和处置等,互联网的不稳定增加了远程运维的挑战,运维动作的链路长,故障因素多,需要针对核心运维场景做全链路能力建设。

VEC的支撑系统大图如下,其中应用部署发布、服务发现治理、集群扩缩容等关键能力是基于ENS容器平台构建的。


 

 

“ 边缘云的发展吸引了越来越多技术人的关注,在关注、参与边缘云自身能力演进的同时,相信更多的技术人更有机会做的事情,是推动自己的业务架构向边缘架构演进。 

 

视图计算的架构可以面向更多终端云化的场景进行扩展,演进成为更加通用的终端云化平台。

在平台技术方面,可以将目前自研的ODCAP(Open Device Cloud Access Protocol)开放设备上云协议用于更广泛的终端云化接入和管理,同时提供可视化的视图流处理编排引擎,方便终端数据的复杂处理流程定义。

在边缘架构演进方面,视图数据被存储到了数量众多的边缘节点中,数据操作都需要先定位节点再进行读写,复杂度较高。

技术上应该考虑将多个物理节点的存储抽象成一个逻辑存储,并封装一套标准的逻辑对象存储接口,这套接口可以和中心的对象存储接口在使用体验上完全一致。这个能力也已经在阿里云边缘云ENS上孵化完成,开始对外产品化服务。

随着边缘场景的不断丰富,边缘云才能获得更好的发展。而边缘云的使命,就是支持各类边缘场景和架构更好、更快、更稳的构建和发展。

总之,真正好的技术,是可以打破桎梏,弥合鸿沟的。



Tags:阿里云   点击:()  评论:()
声明:本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,不构成投资建议。投资者据此操作,风险自担。如有任何标注错误或版权侵犯请与我们联系,我们将及时更正、删除。
▌相关推荐
阿里云史上最大力度降价背后:舍利润换规模,否认与华为打价格战
出品 | 搜狐科技作者 | 梁昌均编辑 | 杨锦2月29日,疯狂星期四,阿里云宣布史上最大力度降价。在今日的2024战略发布会上,阿里云宣布全线云产品官网售价全面下调,平均降价幅度超过...【详细内容】
2024-03-01  Search: 阿里云  点击:(17)  评论:(0)  加入收藏
阿里云DDOS防御如何安装
阿里云DDOS防御是一种保护云服务器免受分布式拒绝服务(DDoS)攻击的重要工具。DDoS攻击是一种常见的网络安全威胁,它通过向目标服务器发送大量的请求来使其超负荷运行,从而使其无...【详细内容】
2024-01-17  Search: 阿里云  点击:(82)  评论:(0)  加入收藏
云服务2023:阿里云急转弯,腾讯云被集成,百度云加速赶
文|奇偶派回望2023年伊始,伴随着特殊时期的结束和国家数字化转型相关政策的落地,叠加以ChatGPT为代表AI新增量的出现,市场对中国云服务行业的表现普遍给予了较高的期待值,希望其...【详细内容】
2024-01-09  Search: 阿里云  点击:(40)  评论:(0)  加入收藏
阿里云盘关闭个性化推荐的方法
很多新手小伙伴还不了解阿里云盘在哪关闭个性化推荐,所以下面小编就带来了阿里云盘关闭个性化推荐的方法,有需要的小伙伴赶紧来看一下吧。阿里云盘在哪关闭个性化推荐?1、首先...【详细内容】
2023-12-14  Search: 阿里云  点击:(41)  评论:(0)  加入收藏
如何使用阿里云虚拟主机和域名设置网站?
本文档将向您展示如何使用阿里云虚拟主机来设置一个新网站,并完成一个域名。如果您按照此处的步骤操作,您将启动并运行一个新网站,可以使用您选择的名称在全球范围内访问,并托管...【详细内容】
2023-11-29  Search: 阿里云  点击:(184)  评论:(0)  加入收藏
阿里云 11.12 故障原因曝光
针对阿里云 11.12 的重大服务故障, 该公司发给客户的一份「官方故障报告」昨天在网上被广泛流传。事件回顾:阿里云严重故障,全线产品受影响(已恢复)影响范围1、OSS、OTS、SLS、MN...【详细内容】
2023-11-16  Search: 阿里云  点击:(113)  评论:(0)  加入收藏
对话阿里云CTO周靖人:“炼出”一个大模型应用,最快需要多久?
文 丨 新浪科技 周文猛在2023云栖大会上,阿里云宣布将升级云计算体系,打造一朵AI时代最开放的云。阿里云CTO周靖人在接受新浪科技《科创100人》采访时表示,模型已经成为业务系...【详细内容】
2023-11-03  Search: 阿里云  点击:(219)  评论:(0)  加入收藏
阿里云首席技术官周靖人:通义千问2.0将发布,AI技术快速变革影响生活方方面面
10月31日上午,在杭州西湖区云栖小镇国际会展中心,“2023杭州·云栖大会”正式开幕。主论坛上,阿里云首席技术官周靖人发表主题演讲。周靖人讲述阿里云发展历程,从2009年,阿...【详细内容】
2023-10-31  Search: 阿里云  点击:(127)  评论:(0)  加入收藏
阿里云通义千问宣布向全社会开放,近期将开源更大参数规模大模型
新浪科技讯 9月13日上午消息,阿里云宣布通义千问大模型已首批通过备案,并正式向公众开放,广大用户可登录通义千问官网体验,企业用户可以通过阿里云调用通义千问API。通义千问在...【详细内容】
2023-09-13  Search: 阿里云  点击:(76)  评论:(0)  加入收藏
阿里云还会继续降价吗?
虽然在大多数时候,降价和利润通常站在对立面。但对云业务而言,降价往往会起到“以价换量”的效果——当云用户逐渐增加,分摊云成本的分母变多,成本降至足够低的时候,原...【详细内容】
2023-08-16  Search: 阿里云  点击:(63)  评论:(0)  加入收藏
▌简易百科推荐
生成式AI:云计算的关键之战
“美国有一家铁路公司,过去两年我们一直在交谈。终于,他们这次打电话给我们,希望迅速推进上云迁移。”近日,亚马逊云科技全球客户技术支持与服务副总裁Uwem Ukpong向记者谈及企...【详细内容】
2024-04-08    21世纪经济报道  Tags:云计算   点击:(12)  评论:(0)  加入收藏
云计算:数据存储与处理的革命性技术
当我们谈论“云计算”时,我们实际上在讨论的是一种基于互联网的新型计算模式。云计算允许用户通过网络访问并使用存储在数据中心(也称为“云”)的共享计算资源。这些资源可以包...【详细内容】
2024-03-04  徐文轩    Tags:云计算   点击:(18)  评论:(0)  加入收藏
云服务2023:阿里云急转弯,腾讯云被集成,百度云加速赶
文|奇偶派回望2023年伊始,伴随着特殊时期的结束和国家数字化转型相关政策的落地,叠加以ChatGPT为代表AI新增量的出现,市场对中国云服务行业的表现普遍给予了较高的期待值,希望其...【详细内容】
2024-01-09    奇偶派  Tags:云服务   点击:(40)  评论:(0)  加入收藏
云计算这一年:冰与火之歌奏响
©⾃象限原创作者丨程心在电影《奥本海默》中,当奥本海默第一次见证了原子弹的爆炸成功,巨大而刺眼的白光穿越了200英里的距离和层层防护,那一刻世界仿佛被抽离,人们见证了...【详细内容】
2023-12-26    自象限  Tags:云计算   点击:(41)  评论:(0)  加入收藏
为什么 Traefik 是云原生首选网关?
根据 Traefik Labs 团队对于 Traefik 在云原生生态中的定位:云原生反向代理和负载均衡器及网关解决方案。一、从生态拥抱视角看:Traefik 的发展前景从云原生生态视角来看,Traef...【详细内容】
2023-11-29  架构驿站  微信公众号  Tags:网关   点击:(67)  评论:(0)  加入收藏
2024年的云趋势:云计算的前景如何?
适应复杂的生态系统、提供实时功能、优先考虑安全性和确保可持续性的需求正在引领云计算之船。多样化的工作负载允许探索通用的公共云基础设施范例之外的选项。由于需要降低...【详细内容】
2023-11-23    千家网  Tags:云计算   点击:(69)  评论:(0)  加入收藏
基于云的应用设计和部署:综合指南
什么是基于云的应用?基于云的应用是设计在云计算环境中运行的软件应用程序。在这里,应用及其相关数据不在本地计算机上存储和执行,而是在云中托管和操作。基于云的应用运行在...【详细内容】
2023-11-23  千家网  微信公众号  Tags:   点击:(65)  评论:(0)  加入收藏
云平台存储应急演练常见问题分析
相比于传统架构成熟的应急处置体系,业界关于云平台存储开展应急演练和管理方面则稍显欠缺。本文将梳理云平台存储应急演练与传统IT架构的区别,列举云平台存储常见的故障场景,并...【详细内容】
2023-11-21    IT168  Tags:云平台   点击:(69)  评论:(0)  加入收藏
阿里云 11.12 故障原因曝光
针对阿里云 11.12 的重大服务故障, 该公司发给客户的一份「官方故障报告」昨天在网上被广泛流传。事件回顾:阿里云严重故障,全线产品受影响(已恢复)影响范围1、OSS、OTS、SLS、MN...【详细内容】
2023-11-16    OSC开源社区  Tags:阿里云   点击:(113)  评论:(0)  加入收藏
云计算的五个网络要求
网络和云团队应该在其云策略中考虑带宽和延迟优化、安全性、网络冗余、服务质量和网络自动化等因素。云计算和SaaS架构的出现颠覆了整个IT行业,并扩展到了网络领域。能够从世...【详细内容】
2023-11-14    千家网  Tags:云计算   点击:(70)  评论:(0)  加入收藏
站内最新
站内热门
站内头条