在刚刚结束的GECCO 2020国际会议中,华为云擎天架构的调度算法团队同时获得OCP与USCP运筹优化算法赛道第一名,且算法运行结果刷新了十个文献算例的已知最优解。充分展现华为云在云资源调度、多目标优化等领域的技术积累,更为解决云上超大规模离散优化问题提供全新思路。
获奖证书
GECCO会议始办于1999年,是进化计算领域最重要的盛会之一。本届比赛吸引了来自英国、法国等全球知名研究机构和顶尖学者,如法国的优化解决方案提供商Artelys(ROADEF Challenge 2018冠军),法国格勒诺布尔大学,英国伦敦大学学院等。华为云擎天架构算法团队与华中科技大学吕志鹏教授团队,针对“面向云的高性能求解器”进行深度技术合作,并将设计的Weighting-Based Parallel Local Search(WPLS)算法应用于本次比赛,实现在邻域设计、邻域快速评估机制、邻域解选择策略、并行化加速等方面的多项突破,方案全场景领先第二名10%。
计算机科学中的“进化计算”,指一系列“受生物进化启发的全局优化算法”,及研究此类算法的人工智能等子领域,主要应用于最优化问题的求解。而OCP(Optimal Camera Placement,最优摄像头部署问题)与USCP(Unicost Set Covering Problem,单成本集合覆盖问题)作为经典的离散优化问题,是已被证明的NP-Hard问题,其中USCP更是Karp提出的21个NP-Complete问题之一,在计算复杂性理论研究方面具有重要意义,并被广泛应用于边缘站点选址、软件模糊测试等实际工业场景中。
OCP问题可以简单描述为:假定一个城市需要部署一组摄像头进行监控全覆盖,而每个摄像头部署的位置(400万个可选位置)、角度及可覆盖的监控区域都不尽相同,如何使用最少的摄像头实现城市监控的全覆盖。USCP问题则是采用更为抽象的数学集合形式进行描述,二者本质相同
OCP问题示意图
此次比赛提供了基于实际的城市监控布局转换而来的数据集合,其中最大的数据包含了380万以上的监控候选位置。要从380万个候选位置中选出最优的布局方案,搜索空间高达,该数字远远超过宇宙中所有原子的数量总和,即使动用全世界的算力,也无法在有限时间内逐一验证每一种方案的优劣。
庞大搜索空间,大幅提升赛题难度
AI、5G等技术的蓬勃发展,催生应用对海量算力、极致时延体验等更高要求,而云计算作为数字经济时代的核心生产工具,正逐步向边缘延伸,以满足澎湃算力的随时、随地、随需获取并实现业务的就近接入。现实的挑战是,如何进行海量边缘站点选址、规划各站点容量,并通过智能全域调度实现全局业务接入体验最优,其本质也可以抽象为以集合覆盖问题为核心的一系列优化问题。例如,云站点选址可抽象描述为:
云服务商拟在全国范围内部署海量站点以实现接入全覆盖,满足客户的业务需求。调研筛选出大量备选站点,但因时延、服务质量、实际环境等约束,每个站点可以覆盖的区域有限。已知各站点可覆盖区域及对应建站成本,要求给出可实现全覆盖的最优站点部署方案。
凭借华为云擎天架构算法团队在云资源规划、调度领域的持续探索实践,本次比赛提交的Weighting-Based Parallel Local Search(WPLS)算法同时结合了机器学习与运筹优化中的技巧,在局部搜索的过程中使用了禁忌表策略,并且自学习地调整评估函数来跳出局部最优。在实现上,该算法借助于华为云鲲鹏和昇腾实例的独特硬件优势和特点,最大程度地发挥了算法的并行化加速能力,使用极短的时间就能找到接近于理论最优解的方案,做到云上实践与算法理论的绝佳融合。
历经8年技术积淀的华为云擎天架构,通过对极简数据中心、专用硬件、虚拟化、云操作系统等全栈技术投入,提供硬核性能、极致稳定、极优效能、云边端协同的云服务,为华为云、华为云Stack、华为云边缘提供一致体验与一致生态。
“智慧云脑”作为华为云擎天架构的管控面,是面向云、AI、5G时代的分布式云操作系统,实现全域资源供给极优、多样性算力使用极简。其中,全域资源调度能力可支撑未来10万级分布式站点间复杂的调度协同,完成中心与边缘、边缘与边缘之间的智能按需调度,根据业务诉求匹配最优节点,实现就近接入。面向租户,智慧云脑通过资源画像及预测算法实现算力的智能推荐,让应用负载运行在最合适的算力之上。
未来,华为云将继续发挥全栈技术创新能力,与伙伴一起使能千行百业,助力政企实现数字化转型和智能化升级。