您当前的位置:首页 > 电脑百科 > 人工智能

大模型竞速2024:服务、应用、MaaS

时间:2024-01-05 17:29:27  来源:光子星球  作者:

年末的大模型赛道静悄悄。

既没有电商领域的drama反转,也没有游戏行业那般的连续地震,除了行业媒体的零星解读外,相对突破赛道圈层而进入大众视野的消息,还是字节跳动与百度两家头部与海外大模型相互套壳的新闻。

或因大模型在商业化天平的两端都未曾诞生足够引领潮流的产品,即使国内“百模大战”热闹了一整年,但预想中的“iphone时刻”仍未到来,以致于市场对相关消息出现了脱敏现象——大模型的推出与后续的刷榜难以再获取市场关注。

在落地成果出现之前,市场进入了明显的冷静期。但不可否认的是,国内的创新仍在发生。过去一年,我们见证了国内大模型从无到有再到枝繁叶茂,其中文领域能力持续爬坡,以及各玩家在商用落地道路上的诸多探索。

说白了,我们踏上这条道路也仅仅一年时间。得与失的讨论更应该集中在“得”而非“失”之上。

头部公司带领的三次转向

亚里士多德提出的第一性原理认为,万事万物都有一个根基性命题或假设,不能缺省,也不能被违背。以此来浅析当下的大模型行业,其数据、算力、能力等维度的攀升显然是题中之义。

因此,领跑中国大模型速度的是头部科技企业,数据与算力储备为他们踏入新时代风口提供了不小的先发优势。

据不完全统计,国内大模型数量已达200以上。共同缔造“中国速度”的先行者是百度、阿里、字节等头部互联网公司。先行者效应下,他们的一举一动也一定程度上牵动行业的发展方向。

自百度三月发布文心一言起,直至年中时期如腾讯、京东、华为等大厂搭上大模型的班车,这段时间可以说是国内大模型赛道的混沌期。

所谓混沌,是初生的无序状态。平台类大厂、互联网大佬与高校科研团三股势力在ChatGPT3.5的爆点后迅速达成“生成式AI代表未来”的共识,以捣鼓出自家的大模型为第一要务。彼时的业内语境中,训练模型被戏称为“炼丹”,然而炼的什么丹、给谁吃、有什么用以及怎么用,大多都还处于盲目的状态。

有人向往AGI的星辰大海,有人希望重塑千行百业,有人仅仅只是炒作拉股价。

这段时期内,大模型的中文领域能力大部分不及GPT3.5,其价值停留在纸面上,有待发掘。自用户层看,“松鼠鳜鱼法”与不少开放测试的大模型一直重复初次回答的糟糕体验亦是混沌期的小小注脚。

年中,距离开源“英雄”LLaMA为业界提供了模型结构、训练方法等标准答案已有4个月,够多个大厂复用其成果。这进一步缩小了国内模型能力代差,GPT3.5的里程碑被越来越多的玩家触及,通用大模型发展进入相对平稳的瓶颈期

与此同时,GPU供不应求下的算力紧张、大模型厂商的造血内需推动将大模型落在实处的清风逐渐吹起。

在商业化落地不明朗,成本、周期难把控等问题下,大干快上通用模型被描绘为春秋笔法。此后两个月是行业大模型的集中发布期。腾讯云的MaaS解决方案、京东产业大模型与华为盘古大模型为赛道的垂直转向定下基调。

一时间,金融、工业、教育等主要产业的垂直模型如雨后春笋般出现。

在PMF(产品市场匹配)的第一性要求下,主流范式是只取基础模型的理解能力与少量对话、推理能力“一瓢饮”,调用大模型时代前的AI模型与数据库获取结果,最后再由大模型“组装结果”。

这一模式虽相较基础模型的万卡规格相去甚远,亦一定程度上缓解幻觉问题,但精调、部署的基本流程下依旧刚需数百张GPU和不短的时间成本。因而其更像是厂商对大模型落地的迫切与客户企业的降本需求“一拍即合”的权宜之计。

此外,一个值得思考的问题是AI生产力工具,为我们带来的究竟是降本还是增效?

针对不同发展阶段的企业,AI工具的能力偏向将显著影响接受度和满意度。通过SFT(精调)行业大模型的范式以快速落地看,企业购买大模型能力并未给业务带来本质上的增效,而是为既有AI工具和模型配上一个大脑。

换言之,此前的行业大模型更偏向于降本而非增效,更适用于收缩期的企业,尤其是已建立起AI工具体系的大型企业。那么行业大模型相对更易向上渗透,抓住大B而非小B的现状也就不难理解了。

此后,垂直模型的技术底座持续演进,目前以调用向量数据库和RAG(检索增强生成)两个“外挂”为中心轴,不过这是后话了。

今年9月,大模型管理办法实施,聚光灯渐渐有从产业向用户转移的趋势。直至以PC为首的消费电子赛道抱上了大模型前进的大腿,既是载体也是入口的智能设备,为大模型在C端的商业落地找到全新场景。

自脱离混沌期起,国内大模型玩家就一同走上了产品化的道路。但总体来看,早在3月末便提出的主线任务——MaaS还处于未发力的状态。就像早期的行业大模型一般,赛道向外兜售的只是模型能力,而非模型服务。

两字之差,指向大模型未能从技术价值转换为生态价值。做个不算恰当的比喻,在AI高速公路上,各厂商只能象征性地建几所收费站。

目前基础模型底座能力无人称王,大家同台竞技之下无人能站稳生态高位。整体情况导向了两条2024年的大模型掘金之路——模型服务创新与应用。

大厂创企,机会均等

逐鹿九州,是大模型厂商试图冲击生态位置的现状。

只是目前看来,追求模型能力已不是冲击高位的最优解,就像Sam·Altman所言:“扩大模型规模的收益在递减”。

首当其冲的是愈发紧张的AI算力,据Omdia统计数据,今年Q3也就是英伟达发布GPU禁令前,腾讯、百度、阿里三家购入100系GPU的数量分别为50K、40K与25K,三者相加也不及微软和OpenAI其一。

另一方面,OpenAI虽给出 Scaling Law(模型能力虽训练计算量提升的扩展定律)来解释大模型之“大”,但包括算力、人力、电力等在内的成本侧已无法容忍过多资源投入仅为百尺竿头更进一步,这一点基本已是业内共识。

大力不能出奇迹,意味着大厂先发的算力、规模等优势正在逐渐消弭。

从AI infra来看,规模效应递减的根源在于算力紧张与数据敝帚自珍。但自技术层面,更多问题已经成为南墙:有毒内容与幻觉尚未有解法、AI前沿为商业公司把持后,开源程度日益递减等。

参数量的顶级规格已经停留在万亿量级许久,玩家们开始思考如何通过巧思而非大力来推动AI行业向前。

一条路径是“小而美”,曾有传言称GPT4是由十数个MOE小模型聚合而成,MOE也成为当下微软、谷歌等头部企业竞逐的新领域。尤其是其和端侧设备的结合,新时代AI硬件有着足够的想象空间。

大模型的软硬件生态从结合到协同的发展速度令人咂舌。今年初,大模型语境中的模型训练还是万卡集群,年末时候,高通骁龙8 Gen3便展现了百亿参数模型的端侧运行能力。国内已有OPPO、vivo、小米等手机厂商推出端侧模型,其服务与应用或将于2024年全面爆发。

另一条路径是Long Context,模型能力突破艰难的情况下,让模型底座发挥作用的惯常范式是SFT,然而训练成本掣肘,长文本的Prompt有可能在向量数据库与检索增强生成的基础上彻底消磨精调的存在。

回首创企,智谱AI、月之暗面、百川智能等创业独角兽也携AgentTuning(智能体增强)、Long Context、RAG等独特的模型服务创新崭露头角。

创业公司的“破坏性创新”能力早在此前的商业史上便屡有验证。由“生成式AI”代表未来这一基本共识发散开来的不同技术路线昭示着更多样化的AI未来图景。

重塑开发生态

OpenAI塑造了2023年AI赛道关于大模型的共识,追赶的旋律就此开始谱写。此后的GPT4以及GPT4V的出现更让人深感大山似乎不可逾越。

但近来发生的两件事情,终归给到国内玩家们希望。

先有《The Verge》报道字节跳动因使用ChatGPT的API以训练自家大模型,因而遭OpenAI予以“封号”处理;后有谷歌最新发布的Gemini-Pro承认在中文领域训练中使用了百度文心一言的数据。

不出意外,重复造轮子的基础模型之争于此踩了一下刹车,而数据集的价值再次被放大。随着推特、Reddit 等移动平台关闭免费的API接入点,在不远的未来,或许通过数据采集器搜集平台数据用于AI训练的 Pretrain 模式将彻底成为历史。

进一步说,字节套壳GPT亦或是谷歌套壳文心一言,本质上是模型架构的趋同与数据价值的跃升。那么中文高质量数据实际上也是国内大模型的护城河。

在此基础上,我们更不需要担心模型层会落后于海外过多。反而是在应用层面,百花齐放才是AI时代应有的面貌。如此来看,李彦宏一直反复唠叨,“我们不需要这么多基础大模型,我们需要更多应用”的说法有其合理性。

应用本身是商业化落地的终极载体之一,更重要的是应用的开发过程——率先构筑完善AI Native应用开发生态的基础模型厂商将抢占生态价值的高位,推动自家大模型的价值从技术价值转为生态价值。

典型的案例便是苹果税,或是手游行业众所周知的Android/ target=_blank class=infotextkey>安卓渠道商。只是移动生态早已固化,远非当下“百模大战”的混乱可比。

如果我们沿用上文的比喻,当下大模型厂商加码模型能力,试图做AI高速公路收费站,或许现在更需要的是收费站中间的服务站。完善的应用开发工具链所构筑的开发生态能极快加速爆款应用的出现时间。

12月20日,百度副总裁侯震宇将AI原生应用开发新范式定义为AI Native 应用生态的关键组件之一,百度亦再次迭代应用开发工具链并推出了AppBuilder,正如文心一言发布时一般抢先了一个身位。

可以预见的是,我们也将很快看到除百度外的玩家通过新场景、新系统共同打造新的开发生态。

即使AI应用开发生态的必然性前置会让应用爆发的时间节点稍为后置,但考虑到今年大模型的“中国速度”,2024年基本可以确定是AI应用喷涌之年。

目前来看,国内AI社交、AI游戏的发展已初具规模,更多赛道正在接受AI的改造,重塑应用的生产力与生命力。AI加入后是否会变更赛道既往的商业模式,是产品经理迫切需要解决的Konw How 。

我们确定,2023年的结束并非大模型周期的结束。或许我们仍会为GPT等海外大模型的能力提升而感到压力,但我们也能还之以应用层的创新。而不再时刻盯着OpenAI的中国大模型,也将真正走出属于自己的道路。



Tags:大模型   点击:()  评论:()
声明:本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,不构成投资建议。投资者据此操作,风险自担。如有任何标注错误或版权侵犯请与我们联系,我们将及时更正、删除。
▌相关推荐
AI程序员上岗 垂类大模型应用迎来井喷期
能自动写代码的“AI员工”、逐渐告别不够好用的智能客服,无需费时费力开发的工业AI控制器……随着人工智能大模型能力开始深入多个行业,IT、工业生产、金融、服务...【详细内容】
2024-04-08  Search: 大模型  点击:(4)  评论:(0)  加入收藏
AI程序员上岗 垂类大模型应用迎来井喷期
能自动写代码的“AI员工”、逐渐告别不够好用的智能客服,无需费时费力开发的工业AI控制器……随着人工智能大模型能力开始深入多个行业,IT、工业生产、金融、服务...【详细内容】
2024-04-07  Search: 大模型  点击:(3)  评论:(0)  加入收藏
AI干掉声优?音频大模型追逐“图灵时刻”
七十年前,“人工智能之父”图灵提出,如果人无法判断屏幕的另一侧究竟是人还是机器,就证明机器具备了人一样的智能。这一经典的图灵测试如同北斗星一般,指引着AI行业的工作者们不...【详细内容】
2024-04-03  Search: 大模型  点击:(5)  评论:(0)  加入收藏
大模型Kimi火了,长文本“卷”出新高度
近日,AI智能助手Kimi宣布支持200万字无损上下文,在长上下文窗口技术上再次取得突破,引燃人工智能领域新一轮投资热情。  摄影/宁颖OpenAI官方去年11月发布的GPT-4 Turbo,支持1...【详细内容】
2024-03-29  Search: 大模型  点击:(13)  评论:(0)  加入收藏
大模型应用的 10 种架构模式
作者 | 曹洪伟在塑造新领域的过程中,我们往往依赖于一些经过实践验证的策略、方法和模式。这种观念对于软件工程领域的专业人士来说,已经司空见惯,设计模式已成为程序员们的重...【详细内容】
2024-03-27  Search: 大模型  点击:(13)  评论:(0)  加入收藏
超长文本是AI大模型的能力突破口吗?
◎记者 刘怡鹤近日,能“一口气读完20万字小说”的AI大模型应用Kimi再次为国内AI产业添了一把火。业内认为,国产大模型能力提升或成今年国内AI领域最核心的主线。超长上下文是...【详细内容】
2024-03-26  Search: 大模型  点击:(8)  评论:(0)  加入收藏
百度AI“咬”了一口苹果 大模型商用有戏了?
百度3月25日突传利好。据知情人士透露,百度将为苹果今年发布的iPhone16、Mac系统和ios18提供AI功能。消息人士称,苹果曾与阿里以及另外一家国产大模型公司进行过洽谈,最后确定...【详细内容】
2024-03-26  Search: 大模型  点击:(17)  评论:(0)  加入收藏
Kimi引燃大模型“长文本竞赛”,阿里360百度急出手
从ChapGPT到Sora,从数千亿参数到千万长文本,大模型浪潮下,永远不缺热点。近日,“Kimi概念股暴涨”“Kimi为宕机道歉”等词条先后冲上微博热搜,让月之暗面这家刚成立一年的人工智...【详细内容】
2024-03-25  Search: 大模型  点击:(15)  评论:(0)  加入收藏
Kimi爆了 国产大模型应用元年还远吗?
国产大模型应用Kimi近日可谓横空出世。根据Similarweb数据,Kimi智能助手的周度访问量由23年12月初的15万提升至近期(3.10-3.16)的超过200万,APP端下载量也快速提升,从2月初的效率...【详细内容】
2024-03-22  Search: 大模型  点击:(14)  评论:(0)  加入收藏
国产大模型开卷“比谁长”?Kimi爆火点燃长文本竞争赛道
来源:财联社近日,又一现象级AI应用Kimi爆火出圈,在用户端和资本市场都掀起波澜,引发多个Kimi相关概念股异常波动。海天瑞声(688787.SH)、中广天择(603721.SH)等上市公司纷纷回应“无...【详细内容】
2024-03-22  Search: 大模型  点击:(5)  评论:(0)  加入收藏
▌简易百科推荐
多方热议人工智能产业新机遇
编者按  从前沿科技展会到高层对话平台,从上海、重庆到博鳌,从线上到线下……一场场高规格、大规模的盛会中,人工智能正在成为各界热议的高频词。赋能千...【详细内容】
2024-04-08    中国家电网  Tags:人工智能   点击:(4)  评论:(0)  加入收藏
​人形机器人时代来了吗
日前,由中国人形机器人(11.080, -0.05, -0.45%)百人会主办的人形机器人大赛在北京经济技术开发区开赛。工作人员向参观者展示一款人形机器人。参观者与一款陪护型人形机器人...【详细内容】
2024-04-08    中国青年报  Tags:​人形机器人   点击:(4)  评论:(0)  加入收藏
AI重塑社交:腾讯与字节跳动的新赛场
文|新火种 一号编辑|美美最近,腾讯和字节跳动这两大互联网巨头几乎同步推出了各自的AI社交产品,尽管腾讯和字节跳动在前段时间刚刚“破冰”,但这一举措不仅意味着这两大巨头之...【详细内容】
2024-04-07    蓝鲸财经  Tags:AI   点击:(6)  评论:(0)  加入收藏
第一批用 Kimi 做内容的网红已经杀疯了
作者:王东东 文章来自:斗战圣佛小组技术信仰派 VS 市场信仰派 朱啸虎和月之暗面老板杨植麟在前几天有一场不算 battle 的 battle。battle 的争论点是:大模型有没有戏。技术派...【详细内容】
2024-04-04    斗战圣佛小组  Tags:Kimi   点击:(4)  评论:(0)  加入收藏
昆仑万维发布面向人工智能时代的六条人才宣言
过去的一年多,是人工智能取得非凡进步的一年。在这充满突破性技术飞跃和备受争议的一年里,我们见证了人工智能的快速发展和广泛的影响,人工智能已经迅速地融入了我们的生活,深刻...【详细内容】
2024-04-03    砍柴网  Tags:昆仑万维   点击:(7)  评论:(0)  加入收藏
AI干掉声优?音频大模型追逐“图灵时刻”
七十年前,“人工智能之父”图灵提出,如果人无法判断屏幕的另一侧究竟是人还是机器,就证明机器具备了人一样的智能。这一经典的图灵测试如同北斗星一般,指引着AI行业的工作者们不...【详细内容】
2024-04-03    第一财经网  Tags:AI   点击:(5)  评论:(0)  加入收藏
生成式人工智能有哪些新趋势?
相较于去年,当下我们所能体验的人工智能技术的范围已经大幅提升。从搜索引擎、电商平台再到社媒平台,只要是以搜索结果为导向的内容,都会出现它的身影。但其实,人工智能的应用场...【详细内容】
2024-04-03  品谈教师帮    Tags:人工智能   点击:(6)  评论:(0)  加入收藏
AI世界的新难题:互联网的信息不够用了!
高质量数据的紧缺正成为AI发展的重要障碍。4月1日,据媒体报道,随着OpenAI、Google等企业不断深入发展AI技术,科技巨头们遇到了一个新问题:现有的互联网信息量可能不足以支撑他们...【详细内容】
2024-04-02  硬AI    Tags:AI   点击:(6)  评论:(0)  加入收藏
今天起,ChatGPT无需注册就能用了!
 来源:量子位    金磊 克雷西 发自 凹非寺  就在刚刚,OpenAI狠狠地open了一把:从今天起,ChatGPT打开即用,无需再注册帐号和登录了!  像这样,直接登录网站,然后就可以开启对...【详细内容】
2024-04-02    量子位   Tags:ChatGPT   点击:(7)  评论:(0)  加入收藏
AI时代,面对死亡有了第二种选择?
今年春节期间,罗佩玺瞒着妈妈用AI技术“复活”了外婆,她将妈妈现在的模样和外婆留下的老照片合成在一起。时隔60多年,妈妈和外婆终于又“见面”了,这是她送给妈妈的生日礼物。收...【详细内容】
2024-04-02    中国青年报  Tags:AI时代   点击:(7)  评论:(0)  加入收藏
站内最新
站内热门
站内头条