每经记者:王郁彪 每经编辑:刘雪梅
2023年的春天,AI迫不及待地“破土”了。
英伟达创始人黄仁勋说,我们正处于AI的“iphone时刻”。言语间,难掩兴奋。根据瑞银分析,ChatGPT使用了约1万颗英伟达GPU来训练AI模型。而外界普遍预计,ChatGPT的商业化将需要应用超过3万颗。
此岸彼岸,AI持续澎湃。即便入局的门槛如此之高,大模型的应用与尝试,却还是像颗陨石一样溅落大洋,激起阵阵涟漪。
“AI引发新一轮生产力革命,主要源自多方面的进步。”京东集团副总裁、京东科技智能服务与产品部负责人何晓冬博士在接受《每日经济新闻》记者采访时表示,“包括硬件、摩尔定律和GPU等的进步,算力提升、数据迅速增加,还有像Transformer这样的模型结构的发明。”
两年前,何晓冬在接受记者采访时曾预判,“未来5年是AI落地产业化窗口期”。如今仅过去三年时间,新的想象便提前降临。5月6日,被誉为“中国智能科技最高奖”的吴文俊人工智能科学技术奖颁发,京东云旗下的言犀团队凭借“任务型智能对话交互关键技术及大规模产业应用”斩获科技进步奖,何晓冬获吴文俊人工智能科学技术奖杰出贡献奖。
言犀团队“任务型智能对话交互关键技术及大规模产业应用”获得吴文俊人工智能科学技术奖科技进步奖。 图片来源:企业供图
“今年的规划是要发布面向产业的言犀大模型,预计参数量千亿级,会在京东内部生态落地实践后再对外开放。”何晓冬透露。京东做的是生长在数智供应链上的产业AI,和所有人一道,共赴这场AI在春日的圆梦。
人机对话70年飞跃:从ELIZA到ChatGPT
新一轮AI革命的热潮由ChatGPT开启,就像是一场命运的定数。因为人工智能魔方的开启,也要从人机对话说起。
1950年,图灵发表了一篇划时代的论文,文中预言了创造出具有真正智能的机器的可能性。由于注意到“智能”这一概念难以确切定义,他提出了著名的“图灵测试”(注:如果一台机器能够与人类展开对话而不能被辨别出其机器身份,那么称这台机器具有智能。)
受“图灵测试”启发,16年后,1966年,美国麻省理工学院人工智能实验室的约瑟夫·维森鲍姆等人开发了最早的人机对话机器人ELIZA,关于聊天机器人的新时代就此来临。
但当时的ELIZA只是简单模仿人的行为,谈不上智能。到上世纪90年代,人机对话才进入了一个新的发展阶段,大家开始讨论怎么让计算机理解人类意图与执行命令。
记者注意到,2012年以来,苹果的Siri、谷歌的google Assistant、微软小冰、亚马逊的Alexa等为代表的智能对话机器人走进“寻常百姓家”。这些机器人不但能完成人下达的任务,还能逐渐跟用户建立情感上的联系。
而伴随人机对话交互技术的成功应用,其也逐渐成为整个AI赛道绝对炙手可热的领域。
何晓冬从技术演进的角度回顾ChatGPT时表示,这几十年走过了一个比较长的周期,但在最近几年,迎来了爆发式增长。
“上个世纪50年代是基于规则,80年代是基于统计模型,到了本世纪深度学习崛起以后,开始向神经网络、替代模型崛起。特别是到了2017年Google的Transformer发表以后,之后又分出了一个系列,直到今天的GPT4。”何晓冬如此解释。
的确,在过去近10年时间里,人工智能模型经历了从小模型到以Transformer为代表的大模型的转变。
而指数级的增长,速度与规模的递进,更令人震惊。“三年前说大模型,这个‘大’是10亿级别的,现在则已经升至千亿级别。三年之内,关于大模型大的定义已经涨了100倍。”何晓冬表示。
多模态大模型将至 “AI的商业化路线已经清晰”
智能对话技术在过去70年有了巨大的飞跃,从“图灵测试”提出的设想,最后变成了一个真正的产品。
原因何在?何晓冬认为,过去往往是静态数据,都是小规模人工标注的。现在则是在特别复杂的交互场景下的动态数据,如ChatGPT过去四个月积累的数据。此外,过去更加关注单点算法和AI组件,现在则更加关注综合性AI系统、产品生态,以及关注技术能结合什么场景实现大规模落地。
“OpenAI公开表示用的就是Transformer,他并不介意。但他做到了别人做不到的高度,因为在后台完成了一系列的技术创新。多个模型有机结合,协同优化,导致最后呈现出一个非常领先的产品。”何晓冬补充说。
“我们现在讲大模型,更多的是谈语言模型,而在语音、图像、文本等不同模态,诞生了包括多模态数字人、AI艺术创作等多种应用。可以预见的是,大模型理念和技术正在迅速向多模态扩展。”
一次新技术变革不只带来一个工具,而是所有的商业模式都值得围绕技术突破进行重塑。人们从过去低效率地查阅黄页,过渡到搜索引擎时代,又从搜索引擎时代过渡到了智能交互时代,技术突破带来用户体验和商业模式的革命性变迁。
而围绕技术的突破,每一次新的跃动都潜在巨大的机遇。这是无数人为AI狂热的根本所在。
何晓冬告诉记者,就此,AI的商业化路线已经很清晰了。最先突破的是文本生成的商业化,图像会很快进入商业化,或者说某种意义上已经商业化。随后的视频、游戏、3D也会迅速跟上。
AI热潮的余波一轮轮震荡开来。越来越多的公司,预备从不同角度切入大模型的研发与应用尝试。有些抢速度,有些拼技术,甚至有些在入场门槛前徘徊,被资金、技术、人才等各类问题困住脚步。因为大家都知道,赶不上这趟车,可能就没下一列了。
向产业延伸 京东将发布千亿级大模型
ChatGPT爆火后,国内多个大厂相继躬身入局。京东是最早的一批,在言犀人工智能应用平台的基础上,京东云也曾发布过K-PLUG、织女等产业大模型。
在通用语言理解基础模型方面,京东探索研究院不久前曾对织女大模型进行了再升级,提出规模更大、性能更强、迁移性更好的Vega v2模型。应用于情感分析、语义匹配、语法纠错、智能问答、常识推理等多种下游自然语言处理任务。
记者了解到,智能服务是京东云“产业AI”的首个落点。何晓冬告诉记者:“客服场景是一个很严肃、很深的任务型对话,我们需要解决真实世界的深度复杂问题,意味着它并不仅仅只是独立的对话。”
“哪怕最简单的对话,比如,你问客服昨天下单的苹果手机今天什么时候送达。意图清晰,但ChatGPT是回答不了的,因为它需要跟物流、订单等整个业务系统串联。”何晓冬说,“某种意义上,京东云做AI的优势,就是基于自身供应链复杂场景沉淀技术能力,再广泛服务产业生态。”
他进一步向记者举例,比如京东云正在做的智能政务热线,数据显示,AI将大同12345的呼入电话接起率提升至100%;智能热线提升了东莞市受理市民诉求办理满意率达到96.8%;
面对京东大模型的推进进程,何晓冬透露,今年的规划是要发布面向产业的言犀大模型,预计参数量千亿级,会优先在零售、金融行业落地,再泛化至其他产业。
AI不是现实世界的复刻,而是人类想象力的延伸。这是David Holz在创办Midjourney时定下的宗旨。
但现阶段,AI先要做好的仍是响应更多现实世界复杂真实的需求,而真正可以预期和进一步想象的空间延伸,也将来源于此。