腾讯在9月7日召开的数字生态大会上,正式发布了“混元大模型”。
在大模型竞赛风起云涌的上半场,腾讯的动作并不算快。最早发布大模型的巨头是百度。今年3月16日,百度宣布正式推出文心一言,并开放测试邀请。8月31日,百度大模型文心一言面向全社会开放,个人可在应用商店搜索“文心一言”下载应用。
阿里巴巴则在今年4月紧随百度发布大模型“通义千问”,阿里云随即升级其音频转写平台“听悟”,并配备AI驱动的会议分析能力。7月,阿里云推出生成式AI文生图模型“通义万相”。8月,阿里云开源了通义千问70亿参数通用模型和对话模型,目前这两款模型均开源、免费、可商用。
相比之下,腾讯在去年4月才首次对外披露了混元AI大模型的研发进展。今年2月初,业界有传言称腾讯在研发类ChatGPT对话式产品,成立了混元助手项目组,对此腾讯回应道:“在相关方向上已有布局”,此后便鲜有相关消息。
在今年5月的财报会议上,腾讯曾被股东质疑公司动作相对百度、阿里较为“迟缓”,当时腾讯CEO马化腾回复称,“互联网企业都有很多积累,我们也一样在埋头研发,但并不急于早早做完,把半成品拿出来展示。”
如今亮相的“混元大模型”已然是腾讯的“成品”,那么它究竟如何呢?
对标ChatGPT一直是国内大模型的主要基调,“在口语化文本精确理解、超长记录高效提炼、理解生成实时处理上,腾讯混元大模型中文能力已经超越GPT3.5。”腾讯副总裁蒋杰称,“你可以把混元看作是一个在内部开源的模型,公司的每个业务都可以看到我们发布的所有能力,并基于这个能力去与应用相结合。”
混元大模型的核心卖点在于,它是由腾讯全链路自研的通用大语言模型,可以流畅进行专业领域的多轮对话,具备强大的中文创作能力,复杂语境下的逻辑推理能力,以及可靠的任务执行能力,对行业更重要的是,混元将作为腾讯云MaaS服务的底座,客户可直接调用或作为基底模型构建专属应用。
在数字生态大会上,蒋杰展示了混元大模型“更成熟、更可靠”的能力。
此前,大模型产品经常出现答非所问、胡编乱造的“幻觉”问题,蒋杰通过关羽和秦琼的问答案例,意在说明预训练阶段通过“探真”算法进行事实修正,经过预训练算法及策略的整体优化后,相比其他主流开源大模型,混元大模型降低了30%-50%的幻觉率。在面对各种诱导提问时,腾讯通过强化学习的方法,让混元大模型学会识别陷阱问题,对安全诱导类问题的拒答率提升了20%。
减少AI幻觉和提高防骗能力,都是提高C端用户体验感很重要的两项能力。腾讯宣称腾讯云、腾讯广告、腾讯游戏、腾讯金融科技、腾讯会议、腾讯文档、微信搜一搜、QQ浏览器等超过50个腾讯业务和产品,已经接入腾讯混元大模型测试,并取得初步效果。
从公布的产品矩阵可以看出,混元大模型和其他友商一样,既有面向ToB领域的云、协同办公、文档编辑等业务,也有腾讯广告、腾讯游戏、QQ浏览器等面向大量C端用户的产品。
在ToB领域,采购了混元大模型服务的企业客户可以基于API直接调用大模型相关能力,或基于混元定制专属的行业大模型。收费方面,混元大模型将为每个在白名单中的已实名腾讯云企业账号提供累计10万token的免费调用额度,免费额度用完后,腾讯混元API刊例价是千tokens 0.14元(1token约等于1个中文汉字或3个英文字符),百度为0.012元千tokens,其它大模型为0.018元千tokens。
构建大模型的意义在于行业应用。李彦宏在最近的2023百度云智大会上曾强调,“基于基础大模型开发出来的应用才是模型存在的意义。”
腾讯下一步将如何在旗下业务或产品中实现大模型落地应用,以此促进各项业务的增长,将备受关注。尤其是微信和QQ两大国民级应用,怎么将大模型应用和庞大的C端用户体验结合,将是腾讯最为关键的部分。
虽然如今混元大模型已发布,但其能力依然没有完全展露,腾讯企点分析AI助手在9月只面向大客户开放内测申请,微信上的混元大模型小程序还需申请才能内测,腾讯旗下诸多游戏产品如何结合大模型进行升级,也并未在发布会上详细展现。而就微信和QQ是否以及何时会接入混元大模型,目前也尚不确定