您当前的位置：首页 > 电脑百科 > 人工智能

安卓手机上跑15亿参数大模型，12秒不到就推理完了

时间：2023-07-05 11:44:45 来源：作者：机器之心Pro

+ 加入收藏

作者：泽南、杜伟

生成式 AI 上端侧，要用真正的技术。

早晚会有这一天，但它还是比想象来得早了一些：大模型在手机上运行的预言被实现了。

上个月的计算机视觉学术顶会 CVPR 上，生成式 AI 成了重要方向，高通会议中展示了一把未来有望成为「主流」的 AI 应用：用手机跑大模型 AI 画图。

CVPR 是 AI 领域最负盛名的重要会议，我们曾在其中见证过人工智能的几次重要突破，今年在获奖和入围的论文中，既有通用大模型，也有 AI 画图的研究，可谓一下进入了生成式 AI 的新时代。

在 CVPR 2023 上，高通共有八篇论文被主会议收录，并行的展示覆盖生成式 AI、计算机视觉、XR 和自动驾驶汽车等领域的理论创新，以及应用方向。

在这场最先进技术的碰撞中，有不少令人期待的未来图景。

15 亿大模型，手机 12 秒跑完

几个月前，高通就曾在巴塞罗那 MWC 通信展上玩了一把手机跑 Stable Diffusion。此次对于终端侧生成式 AI，高通首先展示了完全在Android/ target=_blank class=infotextkey>安卓手机上运行 Contro.NET 图像生成图像模型，并实现了速度「全球最快」。

用时是多少呢？不到 12 秒。要知道，ControlNet 拥有 15 亿参数，而二月份高通演示在手机上运行 10 亿参数的 Stable Diffusion，当时还花了 15 秒左右。

这让人不得不感叹，终端侧的生成式 AI 能力又进化了。

作为一种生成式 AI 绘画解决方案，ControlNet 被认为是扩散模型中的大杀器，它通过额外输入控制预训练大模型如 Stable Diffusion，可以精细地设定生成图像的各种细节。先输入一张参考图，然后根据输入的 prompt 进行预处理，就能对生成的图像进行精准控制。

此次在高通 AI Research 的展示中，普通安卓手机仅用 11.26 秒便可以运行 ControlNet 生成一张图片，并且无需访问任何云端，完全本地化，交互式体验良好且运行非常高效。下面是一个动图演示：

我们知道，AI 画图的教程里通常会有对计算机配置的建议，在 ControlNet 上训练需要 16G 显存的 GPU，而推理用 M1 芯片需要 5 到 10 分钟，高通却能让手机做到效率更高，这是如何实现的呢？

高通此次对 ControlNet 模型架构进行了软硬件全栈式 AI 优化，以低功耗、低延迟地实现高质量图像生成。其中用到的关键 AI 工具和软硬件包括了高通 AI 模型增效工具包（AIMET）、高通 AI 引擎和高通 AI 软件栈。我们一一来看。

首先是 AIMET，它是高通创新中心推出的端侧 AI 模型效率工具包，能够提供模型量化和压缩服务，通过量化感知训练，将浮点运算模型转化为整数运算模型。此处高通利用 AIMET 及 Qualcomm AI Studio 完成 ControlNet 模型的 INT8 量化压缩，节省更多功耗，提升运行效率。

其次是高通 AI 引擎，它是高通终端侧 AI 优势的核心，采用异构计算机构，包括高通 Hexagon 处理器、Adreno GPU 和 Kryo CPU。目前高通第二代骁龙 8 搭载了迄今最快、最先进的高通 AI 引擎。ControlNet 正是在第二代骁龙 8 的高通 Hexagon 处理器上，完成了 AI 加速。

还有高通 AI 软件栈负责应用的构建、优化和部署。在跑 ControlNet 时，高通 AI 引擎 Direct 框架基于 Hexagon 处理器的硬件架构和内存层级进行运算排序，提升性能并最小化内存溢出，降低运行时延和功耗。

这么一套集 AI 模型压缩工具、硬件和软件框架于一体的全栈式优化下来，在手机上十几秒跑大模型的不可能变成了可能。

接近落地，可以展示

除了给 AI 绘画做移动版优化，高通还在数字人、神经网络视频编解码等其他技术方向进一步探索 AI 能力的延展。

在 CVPR 上，利用基于视觉的大语言模型（LLM），高通打造了一个「数字健身教练」，它能够与用户实时互动，像真人教练一样给予鼓励，还能纠正并帮助达成自己的健身目标。既然是大模型驱动，AI 教练实现了极强的互动性，看起来健身私教要开始焦虑了。

在技术上，数字健身教练将用户的运动视频流交给动作识别模型进行处理，根据识别的动作提供提示并反馈给大模型。然后健身教练通过一个文本生成语音的数字化身，将 AI 的答复反馈回用户。

得益于大模型的能力，数字化身能够实时、不间断地为用户提供相关的健身反馈，比如「你的形体看起来棒极了」、「你的双臂应与肩膀同宽」。

现在看起来和 AI 训练就不能偷懒了，它会对用户的健身互动进行评估，给出你的耐力、强度和形体分数，还告诉完成了多少组动作。同时也会给用户提出相关建议。

与此同时，在神经网络视频编码这一技术方向，高通又实现一个「全球首次」。同样是在手机端，高通首创了 1080p 的视频编码和解码过程。

对于神经网络编解码而言，它可以针对特定视频需求进行定制，并运行在通用 AI 硬件上。在计算能力有限的终端设备上实现高分辨率（如 1080p、2k 等），则要借助 AI 算法的创新。

高通全新设计了高效的神经网络视频帧间压缩架构，在搭载骁龙芯片的手机设备上，实现了 1080p 的视频编解码，视频解码速率也来到了每秒 35 帧上下，并且能够保留丰富的视觉结构和复杂动作。

看起来，移动端生成式 AI、神经视觉编码领域的很多技术已接近应用层，落地的速度追上了 GPT 系列更新的速度。高通在做的事，解决了生成式 AI 面临的大问题。

生成式 AI 的未来在端侧

我们知道，生成式 AI 有重塑所有行业的潜力，人工智能正在经历自己的闪耀时刻，问题在于：生成式 AI 虽然更聪明，但也更耗费算力。

有研究表示，每次基于生成式 AI 的网络搜索查询（query），其成本是传统搜索的 10 倍。全球每天都有超过 100 亿次搜索请求，而且，移动端的搜索占比超过了 60%。

除了要买更多 GPU，我们更要考虑的是如何能让大模型跑在手机上 —— 毕竟大家每天在用的都是端侧设备。

对此，高通已有一个整体的规划。今年 4 月，高通通过介绍「混合 AI」的概念，提出了大模型等 AI 任务处理在云端和终端共同进行的范式。

所谓混合 AI，是指充分利用边缘侧终端算力支持生成式 AI 应用的方式，相比仅在云端运行的 AI，前者能够带来高性能、个性化且更安全的体验。

在其愿景下，我们根据 AI 模型和查询需求的复杂度等因素，选择不同方式在云端和终端侧之间分配负载：如果模型、提示或生成内容的长度小于某个限定值，且精度足够，推理就可以完全在终端侧进行；如果任务相对复杂，则可以部分依靠云端模型；如果需要更多实时内容，模型也可以接入互联网获取信息。

在未来，不同的生成式 AI 用不同分流方式的混合 AI 架构，AI 也能在此基础上持续演进：

‍大量生成式 AI 的应用，比如图像生成或文本创作，需求 AI 能够进行实时响应。在这种任务上，终端可通过运行不太复杂的推理完成大部分任务。

在终端设备充当「感知器官」的任务中，终端负责初步处理任务，云端运行大模型将生成的内容发回端侧，这种操作节省了算力需求和带宽。

终端和云端的 AI 计算也可以协同工作来‍处理 AI 负载。在大模型的工作过程中，每次推理生成的标记（token）都需要读取全部参数才能完成，使用闲置算力通过共享参数来推测性并行运行大语言模型，可以提升性能并降低能耗。

最后，混合 AI 还支持模型在终端侧和云端同时运行，也就是在终端侧运行轻量版模型时，在云端并行处理完整模型的多个 token，并在需要时更正终端侧的处理结果。

混合 AI 覆盖的边缘终端包括智能手机、汽车、个人电脑和物联网终端设备，或许会成为未来生成式 AI 应用的标准。

但如何做到混合 AI ？对此，必须对 AI 的全栈进行优化。在生成式 AI 出现以前，高通就在推动 AI 处理向边缘进行转移。很多的日常功能，都是利用终端侧 AI 进行支持的，如暗光拍摄、降噪和人脸解锁。

如今，高通已构建起业界领先的硬件和软件解决方案，从端侧芯片上的高通 AI 引擎，云端专用芯片，到将其统一在一起的异构计算机制，在运行 AI 负载时，高通现在已可以充分利用硬件和软件来加速终端侧 AI 的推理速度。

而在部署时，利用高通 AI 软件栈，开发者可以充分发挥高通 AI 引擎性能，并实现多端部署，模型构建一次，就可以应用到多种不同硬件上。

在高通的业务中，低功耗、高性能的 AI 已经形成了横跨智能手机、汽车、XR、PC 和企业级 AI 等领域的庞大终端 AI 生态系统。从拍照，语音助手，到增强 5G 信号的黑科技，持续利用先进 AI 技术，让这家公司保持了市场领先的地位。

在这背后，是高通 AI Research 对 AI 研究超过 15 年的持续投入。高通一直致力于 AI 基础技术的研究，从感知、推理再到认知，我们见证了终端 AI 技术的不断拓展。而在这个过程中，由高通发表的 AI 论文也逐渐影响了整个行业。

仅在生成式 AI 上，最初高通探索了生成式模型的压缩方式，并进一步提升了生成痕迹（Artifact）的感知效果，其利用 VAE 技术创建的视频和语音编解码器，将模型规模控制在了 1 亿参数以下。高通还将生成式 AI 理念延伸到无线领域来替代信道模型，提高了手机通信的效率。

CVPR 2023 上展示的技术，是高通生成式 AI 布局的重要一环。随着端侧 AI 计算能力的持续优化，混合 AI 的潜力将会进一步被释放。预计在未来几个月，高通还要在手机上部署超过 100 亿参数的大模型。

生成式 AI 可以打造全新体验，变革生产力水平，高通在边缘侧以低功耗运行生成式 AI 的独特专长，让生成式 AI 具有了融入人们日常生活的可行性。这些能力将会跟随全球出货的数十亿块芯片，很快进入到人们的手中。

在本周上海举行的世界人工智能大会 WAIC 上，高通将会有多位高管参与演讲，并有望在现场展示移动端运行 Stable Diffusion、ControlNet 等能力，让来看展的人可以近距离接触一下未来。

Tags：大模型点击:() 评论:()

声明：本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,不构成投资建议。投资者据此操作，风险自担。如有任何标注错误或版权侵犯请与我们联系，我们将及时更正、删除。

▌相关推荐

华为笔记本将接入盘古大模型！全新华为MateBook X Pro即将发布

快科技4月10日消息，华为官方宣布，华为将于4月11日举办新品发布会。据了解，此次发布会将推出全新的华为MateBook X Pro，而预热海报的主题是“轻且强”。这里的“强”不仅仅是指性...【详细内容】

2024-04-10　　Search: 大模型点击:(4)　　评论:(0)　　加入收藏

行业大模型快速落地的一年，如何做？

生成式AI正成为时下科技企业“讲故事”的关键词之一。但从发展上看，无论是“文生文”的大语言模型，还是“文生图”的多模态模型，更多的是辅助人们进行一些简单的办公，或者提供一...【详细内容】

2024-04-10　　Search: 大模型点击:(3)　　评论:(0)　　加入收藏

AI是万灵药？Meta要把大模型塞进AR眼镜里

寻找下一块“屏幕”，这无疑是最近几年科技行业的一个热门赛道。随着个人计算机点燃了互联网，智能手机让移动互联网无处不在之后，这前后两次造富神话的出现，也让所有人都在期待下...【详细内容】

2024-04-09　　Search: 大模型点击:(5)　　评论:(0)　　加入收藏

AI程序员上岗垂类大模型应用迎来井喷期

能自动写代码的“AI员工”、逐渐告别不够好用的智能客服，无需费时费力开发的工业AI控制器……随着人工智能大模型能力开始深入多个行业，IT、工业生产、金融、服务...【详细内容】

2024-04-07　　Search: 大模型点击:(4)　　评论:(0)　　加入收藏

AI干掉声优？音频大模型追逐“图灵时刻”

七十年前，“人工智能之父”图灵提出，如果人无法判断屏幕的另一侧究竟是人还是机器，就证明机器具备了人一样的智能。这一经典的图灵测试如同北斗星一般，指引着AI行业的工作者们不...【详细内容】

2024-04-03　　Search: 大模型点击:(5)　　评论:(0)　　加入收藏

大模型Kimi火了，长文本“卷”出新高度

近日，AI智能助手Kimi宣布支持200万字无损上下文，在长上下文窗口技术上再次取得突破，引燃人工智能领域新一轮投资热情。　　摄影/宁颖OpenAI官方去年11月发布的GPT-4 Turbo，支持1...【详细内容】

2024-03-29　　Search: 大模型点击:(13)　　评论:(0)　　加入收藏

大模型应用的 10 种架构模式

作者 | 曹洪伟在塑造新领域的过程中，我们往往依赖于一些经过实践验证的策略、方法和模式。这种观念对于软件工程领域的专业人士来说，已经司空见惯，设计模式已成为程序员们的重...【详细内容】

2024-03-27　　Search: 大模型点击:(13)　　评论:(0)　　加入收藏

超长文本是AI大模型的能力突破口吗？

◎记者刘怡鹤近日，能“一口气读完20万字小说”的AI大模型应用Kimi再次为国内AI产业添了一把火。业内认为，国产大模型能力提升或成今年国内AI领域最核心的主线。超长上下文是...【详细内容】

2024-03-26　　Search: 大模型点击:(8)　　评论:(0)　　加入收藏

百度AI“咬”了一口苹果大模型商用有戏了？

百度3月25日突传利好。据知情人士透露，百度将为苹果今年发布的iPhone16、Mac系统和ios18提供AI功能。消息人士称，苹果曾与阿里以及另外一家国产大模型公司进行过洽谈，最后确定...【详细内容】

2024-03-26　　Search: 大模型点击:(19)　　评论:(0)　　加入收藏

Kimi引燃大模型“长文本竞赛”，阿里360百度急出手

从ChapGPT到Sora，从数千亿参数到千万长文本，大模型浪潮下，永远不缺热点。近日，“Kimi概念股暴涨”“Kimi为宕机道歉”等词条先后冲上微博热搜，让月之暗面这家刚成立一年的人工智...【详细内容】

2024-03-25　　Search: 大模型点击:(15)　　评论:(0)　　加入收藏

▌简易百科推荐

行业大模型快速落地的一年，如何做？

2024-04-10　　　　钛媒体APP　　Tags:行业大模型　点击:(3)　　评论:(0)　　加入收藏

互联网充斥“针对小白的AI课”，能相信吗？普通人不学AI课程会被淘汰？

早前，一位标榜清华大学博士和多家公司AI顾问名头的百万级粉丝量博主，向用户大力推介“所有人都需要学”的AI入门课程。不过，这些课程最终因贩卖焦虑、蒙骗学员而被平台下架。然...【详细内容】

2024-04-10　　　　九派新闻　　Tags:AI课　点击:(5)　　评论:(0)　　加入收藏

藏在AI背后的“吃电狂魔”

人工智能时代的能耗黑洞据估算，到2027年，人工智能行业每年将消耗85~134太瓦时的电力，相当于瑞典或荷兰一年的总用电量。马斯克判断，电力缺口最早可能会在2025年发生，“明年你会看...【详细内容】

2024-04-09　　　　雪豹财经社　　Tags:AI 　点击:(3)　　评论:(0)　　加入收藏

OpenAI和谷歌再起纷争：AI的尽头是内容

日前，纽约时报的一篇报道称，人工智能公司 OpenAI为收集高质量训练数据而开发了一个语音转录模型Whisper。该模型主要用于转录 OpenAI 获取的超过 100 万小时的 YouTube 视频，也...【详细内容】

2024-04-09　　小编也疯狂　　新浪网　　Tags:AI 　点击:(2)　　评论:(0)　　加入收藏

AI产业的灰色暗面：OpenAI、谷歌、META如何搞训练语料

财联社4月7日讯（编辑史正丞）种种迹象显示，目前站在全世界AI领域潮头浪尖的这些公司，早在几年前就已经陷入对训练语料的“绝望”追逐中——为此他们不惜修改政策条款...【详细内容】

2024-04-09　　　　财联社　　Tags:AI产业　点击:(3)　　评论:(0)　　加入收藏

和“数字人”交朋友，当心隐私被出卖......

在虚拟社交中如何在保护用户隐私和数据安全的同时提供高质量的社交体验？如何避免过度依赖虚拟社交找到虚拟与真实之间的平衡点？《中国消费者报》记者就此展开了调查APP里有个...【详细内容】

2024-04-09　　　　中国消费者报　　Tags:数字人　点击:(6)　　评论:(0)　　加入收藏

AI“复活”成产业链：成本可降至数百元

大模型应用落地，带火数字人(11.560, 0.29, 2.57%)赛道。文|《中国企业家》记者李艳艳实习生孙欣编辑|姚赟头图来源|《流浪地球2》电影画面截图清明节前，预估会有需求的庞立...【详细内容】

2024-04-09　　　　中国企业家　　Tags:AI“复活” 　点击:(3)　　评论:(0)　　加入收藏

多方热议人工智能产业新机遇

编者按&emsp;&emsp;从前沿科技展会到高层对话平台，从上海、重庆到博鳌，从线上到线下……一场场高规格、大规模的盛会中，人工智能正在成为各界热议的高频词。赋能千...【详细内容】

2024-04-08　　　　中国家电网　　Tags:人工智能　点击:(5)　　评论:(0)　　加入收藏

人形机器人时代来了吗

日前，由中国人形机器人(11.080, -0.05, -0.45%)百人会主办的人形机器人大赛在北京经济技术开发区开赛。工作人员向参观者展示一款人形机器人。参观者与一款陪护型人形机器人...【详细内容】

2024-04-08　　　　中国青年报　　Tags:人形机器人　点击:(6)　　评论:(0)　　加入收藏

AI重塑社交：腾讯与字节跳动的新赛场

文|新火种一号编辑|美美最近，腾讯和字节跳动这两大互联网巨头几乎同步推出了各自的AI社交产品，尽管腾讯和字节跳动在前段时间刚刚“破冰”，但这一举措不仅意味着这两大巨头之...【详细内容】

2024-04-07　　　　蓝鲸财经　　Tags:AI 　点击:(8)　　评论:(0)　　加入收藏

推荐资讯

统计局解读3月份CPI和	万亿赛道“低空经济”
美联储透露重磅信号，酝	央行、证监会、财政部
证监会：推动注册制走深	大幅回暖！全国天气冲击
国家统计局：3月份居民	手机号不用了记得解绑