作者丨张睿
编辑丨康晓
出品丨深网·腾讯新闻小满工作室
在“百模大战”席卷硬科技赛道后,基于不同场景的应用成为大模型竞争的又一发力点,这一次,拥有庞大用户基数的头部手机厂商也扣动了扳机。
自今年8月起,华为、小米、vivo、OPPO、荣耀都透露了大模型的相关信息,并表示新一代旗舰手机会率先接入大模型。
据《深网》统计,华米OV的语音助手将具备端侧大模型能力,语音助手在不联网情况下也有语言理解、图片生成等功能。
在大模型备案审核通过后,各家的语音助手也将拥有类似ChatGPT的深度对话、编程等能力。
与文心一言等以App形式存在的大模型不同,接入端侧大模型的手机语音助手交互形式更多样,例如vivo的蓝心小V不仅可以语音生成图片,还可以直接转发至朋友圈。
当然,自研大模型是个“无限烧钱”的竞争,投入动辄数十亿元起。投入大模型需要强大资金储备做后盾,以大模型驱动手机软、硬件的每一次进化背后都是“钞能力”。
但无可否认,在智能手机出货量持续下滑的行业态势下,大模型或许会成为手机行业突破自身创新窘境和模式局限性的一个机遇。
把大模型装进手机的两种路径
手机厂商部署大模型主要有两种路径,一是做轻量化和本地部署的手机端侧大模型;二是采用云、端协同的架构设计,即在云端部署百亿、千亿级别的大模型训练模型,在手机端侧部署十亿级别的大模型,推出大模型矩阵。
主攻手机端侧大模型的手机厂商以小米和荣耀为主。
今年4月,小米组建了AI大模型团队,并训练出13亿和60亿参数规模的大模型。“小米大模型技术的主力突破方向为轻量化、本地部署,小米考虑的是优先在手机上实现端侧跑通,让每个人都能更好在手机上使用大模型。”小米董事长雷军在年度演讲上透露。
目前,小米手机的智能语音助理小爱同学已经升级了大模型版本,并开启了邀请测试。
与小米相比,荣耀自研大模型主要搭载了骁龙8Gen3这一快车。
2023年10月25日,高通发布新一代移动处理平台骁龙8 Gen3。与上一代产品骁龙8Gen2相比,骁龙8 Gen3不仅GPU、NPU性能大幅提升,更重要的是,它可以在终端侧运行100亿参数的模型。
荣耀CEO赵明在高通骁龙峰会上透露,荣耀自研的端侧大模型参数规模达到70亿。“荣耀通过自研70亿参数的端侧大模型,可以很好地划分个人隐私与人类知识库的边界,让用户隐私得到更好保护,这也是荣耀未来重点的创新方向,荣耀Magic6将接入自研大模型。”
与小米、荣耀主攻端侧大模型不同,华为、vivo、OPPO自研大模型采用“云、端协同”路径,其推出的大模型矩阵覆盖十亿、百亿、千亿多个参数量级。
与ChatGPT等通用人工智能大模型不同,华为的盘古大模型是一个面向垂直行业的大模型系列,目前已经迭代到3.0版本。据公开资料显示,盘古3.0可以为客户提供100亿参数、380亿参数、710亿参数和1000亿参数的系列化基础大模型。
在手机层面,华为P60和Mate60系列手机的小艺智慧助手已经接入盘古大模型,并开启了公测。
同样采用大模型矩阵的,还有vivo自研的蓝心大模型(BlueLM)和OPPO自主训练的安第斯大模型(AndesGPT)。其中,蓝心大模型覆盖10亿、70亿、700亿、1300亿、1750亿模型参数5个版本;安第斯大模型包含十亿至千亿以上多种不同参数规模的模型规格。
图为蓝心大模型矩阵
图为安第斯大模型(AndesGPT)架构
对于为何要推出大模型矩阵的原因,vivo副总裁、AI全球研究院院长周围在接受采访时透露,“主要受大模型形态、用户需求及算力成本的影响”。一是矩阵模式可以解决多模态大模型不同研发阶段的需求;二是可以让用户在云上使用大模型的同时在端侧本地化运行关键数据,满足隐私及安全需求;三是可以有效平衡云端算力成本过高的问题。
无法停止的烧钱游戏
虽然大模型的训练、推理和逻辑能力受模型框架、数据质量、训练方法等多重因素的影响,但现有大模型的智能水平主要取决于算力投入程度。
业内一种公认说法是,做好AI大模型的算力门槛是1万枚英伟达A100芯片。
有行业人士给《深网》算了一笔帐,搭建一个算力集群的成本就在几十亿元。“此前一台计算服务器的成本大约在5万块钱左右,现在满配的GPU服务器价格在100万-200万元之间,一个算力集群一般要配备500台服务器。”
购买AI芯片仅是手机厂商自研大模型成本之一。由于大模型训练一次的成本极高(例如GPT4一次训练成本就要6300万美元),所以在模型训练之前,手机厂商需要对原始数据进行纠错、价值观把控等,数据清洗也是一块不小的支出。
“现在应用一次云端大模型的成本大概在1.2-1.5分左右,vivo国内3亿用户每天用十次,一年算下来也有百亿左右的支出。”vivo副总裁周围透露。
周围表示,数据和算力成本仅占自研大模型投入的一半,人员成本占了一半。自2017年组建AI全球研究院至今,vivo每年在人工智能上的投入保守估计在20到30亿元。
算力、数据、人员成本仅是vivo等头部手机厂商部署云端大模型的必要成本之一。与百度、阿里巴巴等互联网公司主要在云端部署大模型不同,头部手机厂商自研大模型的最终目的是服务用户,让手机拥有大模型能力。
但在手机端侧运行大模型受手机存储空间、耗电等一系列技术的影响,参数量越大,大模型在手机上越难跑通。
“10亿参数模型要占用手机1GB内存,70亿占有4GB,130亿占用7GB,所以我们优先考虑的是10亿模型擅长做什么,再慢慢把其他功能做起来。”vivo AI解决方案中心总监谢伟钦对《深网》解释。
大参数要占用大量的存储空间,这意味着要在手机上跑通大模型就要同步升级内存、SoC芯片等硬件,这对手机厂商来说,又是一笔不菲的投入。
手机行业急需一场颠覆性的创新
在ChatGPT点燃通用人工智能之前的很长一段时间里,手机行业的创新集中在通讯、摄影、屏幕大小和形态等老生常谈的领域。
在消费电子寒冬下,手机厂商“挤牙膏式”的改变很难激起用户的购买欲望,换机周期一度从2021年的28个月延长至现在的43个月。而大模型的智能涌现能力恰巧让手机行业看到了颠覆性创新的可能性。
“大模型是颠覆性的技术范式转变,和蒸汽机、电力及计算机一样,对人类进步具有里程碑的意义。”多位手机品牌的创始人都曾在公司内部如此给大模型定调。
一加创始人、OPPO首席产品官刘作虎表示,AIGC会为移动生活的体验带来革命性的变化,未来的手机会成为用户的超级助理。
“我们在2017年部署大模型时,沈炜(vivo创始人)就要求我们高规格投入以抓住这个百年难遇的趋势。”周围透露。
在vivo、OPPO等手机厂商的预期里,接入大模型的手机会演化成全新的智能体,成为用户的专属私人助理。
曾有行业人士对《深网》表示,“100亿-150亿参数级别的模型可以覆盖绝大多数生成式AI的用例。如果终端可以支持这一参数级别,那么运算可全部在终端上进行,无需云端处理运算,届时手机会会成为真正的个人助理。”
华为、vivo、OPPO自研大模型的最高参数级别已经达到千亿级别,但目前在端侧只能执行语言理解、文本创作、图片生成等简单的操作,涉及到订票、APP交互、设备控制等操作还是要调动云端大模型能力。
眼下,头部手机厂商在大模型的探索还处于起步阶段。后续,随着模型迭代、创新应用和产品的推出,以大模型为竞争原点的时代正式开启。