9月13日,阿里云通义千问入局,成为最新一个面向全社会开放的大模型。而自8月31日首批国产大模型产品获批上线,这场“狂欢”已经持续了近半个月。但元语智能联合创始人兼COO朱雷在与许多具体企业和项目的接触过程中明显感到,从8月初开始,企业们便已纷纷在大模型项目采购等方面作出了实质性的布局。
如果说过去半年大模型商业化的探讨是困在内测里的“站在今天看明天”,那么面向公众开放后对商业化的探讨,就颇有种“站在明天看今天”的意味。这可能是迄今为止大模型最接近“赚钱”的一次,当然也是成本、模式等问题最为现实和迫切的一次。
“过去7个月他们都处于一种观望的状态,但8月初就已经明显开始筹备落地,比如采购项目,找机构对潜在的大模型供应商进行测评,判断它们是否在效果上可以达到预期等。”以金融机构为例,朱雷讲述了他经历的过程和转变。
朱雷的另一个身份,是大模型榜单SuperCLUE的联合发起人。也是因为评测需求的走高,让朱雷能够站在第三方的角度,全面接触大模型供需最关键的两端。
在朱雷看来,这些大型企业关注的重点,并不是某一家大模型厂商是否通过备案,而是这个信号表明官方对大模型的广泛应用有了非常正面的态度,所以他们才会积极地响应,包括内部立项审核、公开招标等。
8月31日,包括百度、商汤集团、抖音、百川智能、智谱AI等在内的8家企业和机构通过《生成式人工智能服务管理暂行办法》备案,顺利面向公众开放自己的大模型。9月5日,360智脑大模型、讯飞星火认知大模型接棒,9月13日,阿里云通义千问大模型最新入局。
第二批备案的大模型也在加速中。9月1日,国家互联网信息办公室发布了《关于第二批深度合成服务算法备案的信息公告》,公告显示,第二批深度合成服务共计110个算法信息完成备案。至此,我国累计已有151款算法完成深度合成服务算法备案。
大模型“命运的齿轮开始转动”。百度创始人李彦宏曾提到,当“文心一言”向数以亿计的互联网用户大规模开放服务后,就能够获得大量真实世界中的人工反馈,这将进一步改进基础模型,并以更快速度迭代。
今年3月16日,百度率先推出“文心一言”,成为国内首个、全球大厂中首个生成式AI产品。数据显示,8月31日0点至24点,文心一言共计回复网友超3342万个问题,平均一分钟回答23000个问题。
对于上线至今包括累计回答问题、新增用户等数据及未来业务融合情况等问题,北京商报记者联系了百度、商汤集团、抖音及智谱AI,但截至发稿未收到回复。
“大规模推向市场,数据的飞轮才能转起来。”在接受北京商报记者采访时,无界AI联合创始人马千里作出了这样一个概括。不过在他看来,备案通过与产品的质量没有本质关联,更主要是从信息安全角度考量,但通过备案面向公众开放,也意味着可以加快技术迭代,开启商业化进程。
在安全问题上,蚂蚁集团大安全AI算法资深专家郑霖提到,这种安全并不是完全从模型层面或者技术层面将风险完全封锁,而是通过一套机制来保证生成过程中尽可能不出问题,即便要出问题也能够尽快响应尽可能地消除影响,“大模型给我们各行各业的发展带来新的机会和潜力,本质上是在保证安全的前提下,更注重发展”。
跨过安全关之后,面向公众开放更重要的点在于,大模型的商业化探讨终于有了实质性的意义。
商汤集团直观地描绘出了大模型的商业化潜力。在给北京商报记者的回复中,商汤集团提到,2023年上半年,商汤集团在“日日新”大模型基础上发布了生成式AI产品系列,包括“商量SenseChat”“秒画SenseMirage”及“如影SenseAvatar”等,带动生成式AI相关收入取得三位数的强劲增长。
财报数据显示,2023年上半年,生成式AI相关的业务收入对商汤集团业务的贡献率已经由2022年的10.4%增至20.3%,同比增长率为670.4%。
北京商报记者发现,目前上线的大模型,大多提供的是一种文生文领域类似于“办公助手”或是“问答助手”的角色。
在不久前举行的外滩大会上,小冰CEO李笛也曾呼吁,当前行业最大的问题就是“太雷同”。有数据显示,全国有至少130家公司研究大模型产品,其中做通用大模型的有78家。
对于“同质化”的情况,朱雷认为,是因为在to C层面,大家普遍都还没有想清楚到底该做什么,所以只能先沿用ChatGPT的模式。
但他同时强调,这只是大模型发展初期的一个阶段化表现,在to C层面还无法达到万物生长的时候,先按照这个模式做,在收集到更多数据之后,下一阶段可能就会尝试新的东西。
这种探讨也延伸出了另一个问题,to B和to C,谁会是大模型商业化的第一站?不久前,妙鸭相机的爆火成为国内AIGC领域第一个真正意义上破圈的现象级产品,但复盘妙鸭相机的走红,却不难发现这一成功的不可复制性。
“to C端的开发可以短期积攒人气,增加曝光,但大模型想实现长线盈利,最先取得突破的一定是B端。”在北京市社会科学院副研究员王鹏看来,当下大模型厂商可以在自己较为擅长的领域做垂直化的市场化开发,但如果只应用在固定领域难免资源浪费,而应用至其他行业又会因为缺乏相关资源而处于相对弱势的情况,合作就会成为必然。
而大模型从开发到合作,本身就是一个to B的逻辑。合作方将应用融入到行业企业,又是一个以to B为核心的逻辑。
“总而言之,大模型商业化的根本,还是要看应用与市场的融合,要看清需求到底是什么,是否真的能够利用大模型实现企业的提质降本增效。”王鹏总结称。
朱雷也判断,B端对人工智能应用的场景非常明确,行业受AI厂商的“教育”持续了很多年。而且企业对于模型能力边界也有了更多的了解,再加上在科技领域的预算通常较多,因此预计B端的落地要比C端快得多,“今年四季度可能会有很多落地场景出现”。
但这也不意味着C端不会弯道超车。不久前,基于文心一言,百度输入法宣布全面升级,打造行业首个“基于大模型的输入法原生应用”。李彦宏也曾提到,计划逐步将文心一言融入所有业务。
而大模型的应用也可能为流量打开更大的入口。财报显示,百度App在2023年6月的月活跃用户达6.77亿,同比增长8%。李彦宏曾提到:“利用文心一言逐步优化百度搜索的功能,相信能够为用户提供更为新颖和直观的使用体验,推动我们的移动互联网生态获得更多流量,推动用户使用时长的增加。”
不久前,印度媒体提到,OpenAI仅运行其人工智能服务ChatGPT每天就要花费约70万美元,若不加速自身商业化进程,很有可能在2024年底不得不申请破产。
AI和AIGC已成确定趋势的当下,OpenAI破产论显得有些荒谬。但这也折射出一个关键的问题,对于号称吞金兽的大模型,如何跑通商业模式,覆盖高昂的训练和推理成本,是一个不得不考虑的现实问题,也是困住人工智能老生常谈的问题。
始于计算机视觉领域,近身肉搏于安防场景,上一轮人工智能的火爆,催生了“AI四小龙”的出现。但同质化的应用场景以及技术本身高投入的烧钱特性,让AI企业始终困于亏损泥潭,人工智能企业一度陷入了越做越亏的怪圈。
相比起来,大模型的压力可能还要更大。马千里提到,上一阶段的人工智能浪潮,研发出的一套模型能耗其实很低,但现在的大模型需要做推理,“有100万用户可能就会有100万用户的推理成本,导致其成本更高,投入也更大”。
乘风大模型浪潮,商汤集团找到了翻盘的希望。2023年上半年,商汤集团亏损净额同比收窄2%,但仍达到了31.43亿元。对于大模型“烧钱”导致的亏损问题,北京商报记者也联系了商汤集团,但截至发稿未收到回复。
“目前国内提供大模型服务的厂商基本都是在赔本赚吆喝,或者在布局一些东西,尚未真正探索出一条可以实现盈利的商业化模式。”在郑霖看来,大模型的训练和推理成本更高,因此其应用要考虑的就是如何找到更加匹配的模式才能将成本收回。
事实上,包括一些大模型助手、智能客服语音等应用在内,其本质并没有改变原有的模式,这种效果早已可以以常规模型实现,现在只不过换成了大模型,因此也带来了额外的争议,即客户为什么会为这样一种多出来的成本而买单?
从底层向上,朱雷为北京商报记者梳理出了大模型商业化的几种可能。对于大模型本身,首先可以考虑做私有化部署,相当于卖模型的收费模式。此外,可以将模型布局到云上,进而销售API接口,“国内所有大模型厂商都会有这个模式,预计每家价格都差不多,可能会比GPT3.5贵一些,但比GPT4便宜很多”。
顺着这个逻辑再往上,中间层的销售思路就会转向解决方案,类似于销售一个平台,客户可以在平台上进行训练等。在这种方式下,企业可以按照平台的模式收费。而中间层可能还会进一步衍生,促进推理加速的框架、评估评测、数据集相关等大模型产业链上工具层企业的商业化转化。
相比起来,最上层的商业化体现也最直接,即推出商业化产品,向用户收费,典型应用如妙鸭相机。
王鹏提到,未来大模型形成商业模式,一方面可以走大公司路线,与成型的大企业合作,拿到稳定的订单维持足够的现金流。但不能忽略的是,大企业本身也有开发大模型的能力,可能会出现一种“悖论”的存在。
另一方面可以面向大量中小商户走“薄利多销”的路线,毕竟市场存在明显的二八原则,瞄准中小商户,促进其数字化转型,也是一条可尝试的路径。
但有数据显示,我国中小企业的发展周期基本在三年左右,创办三年之后依然可以维持正常经营的企业只占总数的1/3。“企业是否愿意去购买这样一个大模型服务,是与整个市场环境或者说与企业的特点有重要关联的。”郑霖表示。
北京商报记者 杨月涵