您当前的位置：首页 > 新闻资讯 > 科技

AI“百模大战”打响谁能称王？

时间：2023-04-28 14:51:17 来源：财联社作者：

+ 加入收藏

“根据现在的反馈，任务性能测试上，包括ChatGPT在内，没有一个大模型能够全部达标。”这基本上是业内对雨后春笋般不断涌现的人工智能大模型的共识。

ChatGPT推出后，基于大语言模型技术的同类型产品还在加快涌现。进入4月以来，从互联网大厂，到A股上市公司，以及一众创业公司，再加上高校科研院校，都先后发布各自的大模型，总数已经超过30家。

短短数月，多个模型竞相涌现，各家模型实力究竟如何？国内大模型是否过剩了？行业终局，究竟是百花齐放，还是赢家通吃？在这场技术变革的讨论声中，大模型带来的新能力里，哪些是最为关键的，最有可能带来长期影响的？

▍AI大模型如雨后春笋任务性能测试还未有“满分答卷”

据民生证券的统计，国内已有超30个大模型亮相，行业俨然一副“百模大战”的场景。

根据《科创板日报》记者约访的人工智能行业人士反馈来看，业内目前还没有就具体模型给出直接的评判定论，但他们提供了一些维度，供外界做参考。

思必驰联合创始人兼首席科学家、上海交通大学教授俞凯在接受《科创板日报》记者采访时表示，一个必须要承认的事实是，现在的大模型，只有ChatGPT通过了通用性测试（用户破亿），国内大模型与之对比，均还存在差距。

俞凯告诉记者，衡量一个大模型实力，第一是可以基于任务的性能测试，即通过定义任务集的方式，去比较所有大模型在每个任务上面的完成度。这种性能测试与人类能力对齐，包括理解能力、推理能力、判断能力等。根据现在的反馈，任务性能测试上，包括ChatGPT在内，没有一个大模型能够全部达标。

第二，从安全性角度去判断，这一点更多的体现为大模型与人类价值观的耦合程度。

第三，是模型运行角度，从工程特性去判断。“这是一个特别重要的能力。”俞凯强调，如该大模型能够接收多大的文本、回答反应的速度、运行的性能等。

俞凯所言，侧重于技术指标。当然，也有从资源禀赋层面作出判断的。

大模型领域资深行业人士王钧（化名）则告诉记者，做大模型对团队要求非常高，资金、技术、工程、产品、商业化等多个方面都不能有短板，最终考验的是：核心成员对大方向、大节奏有没有真正想清楚，能不能获取足够多的资源和支持，能否吸引各方面的关键人才加盟，吸引了一群不同背景的牛人之后，能不能磨合好。

“其中最稀缺的是核心算法研究和平台工程的技术人才，这方面整个华人圈子人数都不多。”王钧强调。

人才之争，这在大模型市场的起势阶段已有十分鲜明的写照。

“先发制人”的百度，派出的掌舵者是CTO王海峰，创业者团队中，澜舟科技的周明，衔远科技的周伯文等，他们在人工智能行业的影响力已经无需多言。此前，高调官宣人工智能创业的王慧文，入局的第一步就是在其个人社交媒体平台发英雄帖，重金（新公司75％的股份）招聘顶级研发人才。

“判断做得好不好的标准，不能看各公司自己的宣传，一些业界公认的评测基准当然也可以作为参考，但最重要的还是用户的认可，用户尤其是高频或者付费用户最多的才是最好的。”王钧称。

▍逼近了AGI核心产业应用“泛化性”才是关键

囿于各种商业原因，对于各公司大模型实际的数据、测试反馈指标、投入的资源情况，乃至用户数据等，外界很难全然知晓，那么对其实力情况，也很难去做全然科学的判断。

但记者注意到，受访者们均提到了一个显性的评测角度，那就是“用户反馈”，如回答的反应速度、准确性、可用性、上下文连贯逻辑等。这也是为何，每逢一个大模型新品推出，用户第一时间会去关注回答是否会“翻车”。

就国内当下几个代表性大模型，《科创板日报》记者此前均有过实际体验，结合多位用户的使用反馈，目前大模型整体呈现如下特征：

ChatGPT-4是一个多模态大型语言模型，支持图像和文本输入，以文本形式输出，在“模拟人类”的文本输出方面，以及用户规模上，综合实力领先。

相比之下，国内大模型种类多样，能力各有千秋，目前更注重探索产业应用，用于解决产业技术壁垒问题。

在中文语义方面，国内包括文心一言、千义通问等各模型理解能力有高有低，并未明显拉开距离。在对刁钻中文语句的理解方面，因国内大模型的训练数据主要来自中文语料库，相比于ChatGPT主要来自英文语料库，国产大模型因而会更胜一筹。

但也有个例。复旦大学邱锡鹏教授团队发布国内首个类ChatGPT模型MOSS，其英文回答水平比中文高，原因在于，英文作为科研主流语言，在学术界和工业界中得到广泛应用，积累了大量高质量的语料数据，且相较中文数据，英文数据开源程度高。

另外，MOSS在设计时考虑了人类的伦理道德准则，不会产生有偏见或可能有害的回答，这在一定程度会避免一些潜在的法律风险和商业伦理问题。这一点上，ChatGPT则没有明确地处理。

大模型测评声仍在此起彼伏。但俞凯坦言，目前去评判各模型能力如何以及好坏，其实不是合适的时间点。

在他看来，现在已经面世的大模型，变革在于，基本都已实现思维链的涌现能力，逼近了AGI（通用人工智能）最核心的部分，业界现在更关注大模型是否有足够的“泛化性”，即广泛使用，但从产业角度而言，国内大模型的用户量级也还未达到泛在化。

“在未达到广泛的通用性之前，以通用性的标准去做评判，还是需要慎重。”俞凯强调。

▍大模型并未过剩先发者未必就是"王者"

多个模型短期内同时涌向市场，也有观点提出，现在需要这么多大模型吗？换句话说，大模型现在过剩了吗？

行业普遍认为，尽管现在这么多大模型出现，但还远达不到过剩的程度。

王钧认为，大模型对厂商的技术、资金、实力要求，目前只能说现在的产品刚刚能够用得上。

俞凯表示，未来的行业AI应用范式将从一个通用模型变成一簇通用模型，大模型会分化，如按照领域区分，按功能区分，结合具体行业具体场景。现在来看，非常专业的精深大模型还没出来，这些会在今后不断涌现。

达观数据创始人兼CEO陈运文在接受《科创板日报》记者采访时也表示，大模型赛道目前国内是处于探索赶超阶段，技术本身也还不成熟，未来还有很大的成长空间，“就像现在的饮料品牌一样，如果拉长时间线来看，今天的大模型数量其实并不多。”

那么在未来，行业的终局，究竟是百花齐放，还是赢家通吃？

俞凯和陈运文均表示，未来将会是百花齐放的状态，原因就在于现在正处于起步阶段，未来大模型在每个行业里面生长出来的产品形态都会不一样，而面向不同的行业，也将会出现垂直行业的应用模型。

王钧则表示，大模型的高门槛决定了这是少数玩家才能做的事情，未来不会是百花齐放的姿态，但究竟会不会像搜索引擎一样一家独大，还是操作系统只有两三家的局面，亦或是云计算多家发展的格局，“现在没法判断，还是有些变量。”

多位资深业内人士告诉《科创板日报》记者，在人工智能大模型上，OpenAI只是暂时一个暂时领先的“先发者”，微软绑定OpenAI后确实取得了一定的竞争优势，但要看到谷歌、亚马逊、Meta等也正在奋起直追。未来到底哪家公司能够携AI大模型取得类似苹果今天一样的全球市场地位，目前还极难判断。先发者并不是最后王者的案例太多太多，以中国互联网发展为例，最先出发的是新浪、搜狐、网易，但后面真正切得大蛋糕的却是腾讯、阿里和字节等。

▍要更多地关注和深入思考AI的应用场景

无论是诧异ChatGPT的惊人表现，还是对“百模大战”的思考，今日种种关于大模型的讨论，本质无外乎这场技术革命给人类带来的机会和挑战。

但在网易有道CEO、计算机科学博士周枫看来，在这场技术风潮讨论中，还有一个问题没有被充分讨论，那就是大模型带来的新能力中，哪些是最为关键的，最有可能带来长期影响的。

周枫认为，与之前众多的自然语言处理技术相比，大语言模型至少具有三项根本性新能力：涌现能力、作为基座模型支持多元应用的能力、支持对话作为统一入口的能力。

周枫表示，涌现能力之所以重要，不仅因为它们是大模型出现后才有的新能力，而且由大模型涌现出来的，多数是非常重要的能力。例如，常识推理能力一直是AI领域的重大难题，而大模型的出现使得常识推理取得了重大进展。再比如，一旦‘推理‘能力涌现，“思维链提示”策略就可以用来解决多步推理的难题。“因此，涌现能力的出现，是大模型带来的一项根本性变化”。

在基座模型方面，周枫说到，大型模型不仅可以缩短每个具体应用的开发周期，减少所需人力投入，也可以基于大模型的推理、常识和写作能力，获得更好的应用效果。因此，大模型可以成为AI应用开发的大一统基座模型，这是一个一举多得、全新的范式，值得大力推广。

本轮让大语言模型真正火爆的契机，是基于对话聊天的ChatGPT。周枫表示，虽然之前的聊天机器人存在各种问题，但大型语言模型的出现再次让聊天机器人这种交互模式可以重新想像。未来或将涌现出很多类似的以对话形态让助手完成各种具体工作的项目。

“这三项能力在学术界已经被广泛讨论，甚至被视为常识，但是在产业界和产品团队中却缺乏足够的关注。”周枫称，“这些大模型技术的特点已经改变了我们对业务和产品规划的思考方式，也会改变很多产品的经济模型。因此，产品经理和业务负责人需要更多地关注和深入思考这些新能力的应用场景。”

俞凯也认为，在这场技术变革，除了技术层面的参数量级，资源层面的算法、算力、数据、人才资金等的讨论，更需要关注的是，除大语言模型之外，其他与人工智能体系相关的东西。

这些就包括对语言的理解，对对话式人工智能的理解，以及对多模态人工智能的理解等。这些不仅是单独算法的问题，还关涉业务，训练策略，以及对人工智能技术历程的理解。

来源：财联社

Tags：AI 点击:() 评论:()

声明：本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,不构成投资建议。投资者据此操作，风险自担。如有任何标注错误或版权侵犯请与我们联系，我们将及时更正、删除。

▌相关推荐

Meta推出新版自研AI芯片：性能较上代提高三倍，降低对英伟达依赖

AI（人工智能）芯片紧缺之际，越来越多科技巨头选择自行研发。当地时间4月10日，社交巨头Meta公布了自主研发芯片MTIA的最新版本。MTIA是Meta专门为AI训练和推理工作设计的定制芯片...【详细内容】

2024-04-11　　Search: AI 点击:(0)　　评论:(0)　　加入收藏

英特尔发布新一代AI芯片并首推AI芯片代工 “单挑”英伟达和台积电

新华财经上海4月11日电当地时间4月9日，英特尔在Vision 2024客户和合作伙伴大会上宣布推出最新AI芯片产品Gaudi 3加速器。英特尔称，相比英伟达的H100 GPU，Gaudi3 AI芯片的模型...【详细内容】

2024-04-11　　Search: AI 点击:(2)　　评论:(0)　　加入收藏

AI“复活”亲人成生意，哪些红线待划定？

提供一张照片、一段10多秒的音频，即可让逝者在视频中“活”过来——AI“复活”亲人成生意，哪些红线待划定？本报记者陶稳《工人日报》(2024年04月11日 06版)阅读提示...【详细内容】

2024-04-11　　Search: AI 点击:(2)　　评论:(0)　　加入收藏

科技巨头狂撒千亿美元 “买照片”，只为训练AI模型？

高质量的数据，越来越值钱。你能想象，那些被遗忘在网盘的陈年老图，有朝一日能价值千金？就在最近，路透社报道称，苹果公司正与图像托管网站Photobucket协商，希望得到这家公司近130亿张...【详细内容】

2024-04-10　　Search: AI 点击:(0)　　评论:(0)　　加入收藏

数字水印国标将出，AI生成内容标识成新焦点

日前，全国网络安全标准化技术委员会就国家标准《信息安全技术数字水印技术实现指南》公开征求意见，这是数字水印技术方面的首份国家标准，旨在解决由于缺乏统一实施流程、服务接...【详细内容】

2024-04-10　　Search: AI 点击:(1)　　评论:(0)　　加入收藏

互联网充斥“针对小白的AI课”，能相信吗？普通人不学AI课程会被淘汰？

早前，一位标榜清华大学博士和多家公司AI顾问名头的百万级粉丝量博主，向用户大力推介“所有人都需要学”的AI入门课程。不过，这些课程最终因贩卖焦虑、蒙骗学员而被平台下架。然...【详细内容】

2024-04-10　　Search: AI 点击:(7)　　评论:(0)　　加入收藏

AI是万灵药？Meta要把大模型塞进AR眼镜里

寻找下一块“屏幕”，这无疑是最近几年科技行业的一个热门赛道。随着个人计算机点燃了互联网，智能手机让移动互联网无处不在之后，这前后两次造富神话的出现，也让所有人都在期待下...【详细内容】

2024-04-09　　Search: AI 点击:(6)　　评论:(0)　　加入收藏

藏在AI背后的“吃电狂魔”

人工智能时代的能耗黑洞据估算，到2027年，人工智能行业每年将消耗85~134太瓦时的电力，相当于瑞典或荷兰一年的总用电量。马斯克判断，电力缺口最早可能会在2025年发生，“明年你会看...【详细内容】

2024-04-09　　Search: AI 点击:(3)　　评论:(0)　　加入收藏

AI+数字人成为市场关注焦点，大屏AI数字人助力展厅设计创意升级

随着各行业产业的数字化转型加速，人工智能时代的到来，展馆展厅行业也步入数字时代，各式的展馆展厅设计在融合了全息投影、虚拟现实、数字沙盘、互动投影、互动桌面等多种技术后...【详细内容】

2024-04-09　　Search: AI 点击:(4)　　评论:(0)　　加入收藏

聚焦AI自动驾驶热闹背后的三个灵魂拷问

2024年，如果还有人没听说过人工智能，那恐怕就不是一句OUT能够形容的了。Artificial Intelligence简称AI，已经是老少皆知、无远弗届的存在。从美国瑰丽七股（Magnificent Seven）、...【详细内容】

2024-04-09　　Search: AI 点击:(4)　　评论:(0)　　加入收藏

▌简易百科推荐

Meta推出新版自研AI芯片：性能较上代提高三倍，降低对英伟达依赖

2024-04-11　　　　澎湃新闻　　Tags:Meta 　点击:(0)　　评论:(0)　　加入收藏

英特尔发布新一代AI芯片并首推AI芯片代工 “单挑”英伟达和台积电

2024-04-11　　　　上海证券报　　Tags:英特尔　点击:(2)　　评论:(0)　　加入收藏

AI“复活”亲人成生意，哪些红线待划定？

2024-04-11　　　　工人日报　　Tags:AI 　点击:(2)　　评论:(0)　　加入收藏

科技巨头狂撒千亿美元 “买照片”，只为训练AI模型？

2024-04-10　　　　镁客网　　Tags:AI模型　点击:(0)　　评论:(0)　　加入收藏

谷歌推出适用于安卓设备的“查找我的设备”网络

IT之家 4 月 9 日消息，谷歌今日推出了适用于安卓设备的“查找我的设备”网络，其功能类似于苹果的“查找”网络，旨在帮助用户定位丢失、被盗的安卓产品。IT之家注意到，与苹果的“...【详细内容】

2024-04-09　　　　IT之家　　Tags:安卓　点击:(2)　　评论:(0)　　加入收藏

你的自拍和聊天记录，正被硅谷大厂砸数十亿美元疯抢

2026年的数据荒越来越近，硅谷大厂们已经为AI训练数据抢疯了。它们纷纷豪掷十数亿美元，希望把犄角旮旯里的照片、视频、聊天记录都给挖出来。不过，如果有一天AI忽然吐出了我们的...【详细内容】

2024-04-09　　　　新智元　　Tags:硅谷　点击:(2)　　评论:(0)　　加入收藏

谷歌搜索史上最大变革！考虑对AI搜索收费

快科技4月7日消息，据国外媒体报道，谷歌正计划对由生成式人工智能驱动的新高级功能收费，这将是谷歌搜索业务历史上最大的一次变革。自2000年以来，谷歌的搜索产品一直依靠广告盈利...【详细内容】

2024-04-08　　　　快科技　　Tags:谷歌搜索　点击:(8)　　评论:(0)　　加入收藏

为训练AI，OpenAI等科技巨头花式淘数据

[环球时报特约记者甄翔]《纽约时报》6日披露了科技公司训练人工智能的秘密——利用语音识别工具转录视频网站YouTube上的视频，形成对话文本数据，供其最新的AI学习...【详细内容】

2024-04-08　　　　环球网　　Tags:AI 　点击:(9)　　评论:(0)　　加入收藏

训出GPT-5短缺20万亿token！OpenAI被曝计划建「数据市场」

全网真的无数据可用了！外媒报道称，OpenAl、Anthropic等公司正在努力寻找足够的信息，来训练下一代人工智能模型。前几天，OpenAI和微软被曝出正在联手打造超算「星际之门」，解决算...【详细内容】

2024-04-08　　　　新智元　　Tags:GPT-5 　点击:(2)　　评论:(0)　　加入收藏

当“机器人”有了“AI大脑” 人形机器人时代来了吗

数智风向标当“机器人”有了“AI大脑”人形机器人时代来了吗简单明了的口令下达后，机器人便开始搬箱子、运小球，在各类不同的地形行走……这些身上布满芯片和传...【详细内容】

2024-04-08　　　　中国青年报　　Tags:机器人　点击:(5)　　评论:(0)　　加入收藏

推荐资讯

Meta推出新版自研AI芯	探访北京二手房市场：房
金价迭创新高的真正推	TikTok入驻条件
通胀风暴席卷华尔街：黄	整治“暗箱操作” 义
网易再牵暴雪的手，实际	注意！密码、验证码都没