大模型心高气傲，没有AI Agents生死难料

时间：2023-09-07 10:44:19 来源：钛媒体APP 作者：

文｜脑极体

AI Agent，正在接棒大语言模型LLM，成为AI圈最火的话题。

目前，AI创投圈的众生相，大概是这样的：

大厂俱乐部：OpenAI内部员工声称，AI Agent是OpenAI的新方向；微软尝试推动copilot，让AI以助理的角色落地，这是一种典型的AI Agent场景；英伟达推出了Voyager，这个AI Agent可以自主写代码，独霸游戏《我的世界》；国內商汤也推出了通才AI智能体；阿里推出了数字员工……

学术圈：今年四月，斯坦福创建了一个西部世界小镇，让25个AI Agents在虚拟小镇的沙盒环境中模拟人类，与其他AI Agents恋爱、派对、协作、约会等。另外，也有学者开始利用AI Agents设计复杂科学实验，包括自动上网阅读论文、研究抗癌药物……这些前沿探索让人大开脑洞。

创业圈：AI Agent并不只是顶级科学家的游戏，目前已经涌现出了Camel、AutoGPT、BabyAGI、AgentGPT等非常多的项目，并有一大批开源社区开发者和创业者，利用这些开源项目打造一些实用工具。比如aomni，就是一个帮助用户抓取网络信息并邮件发送的AI Agent应用程序。

投资圈：AI Agent被认为是“通往通用人工智能（AGI）时代的开始”，其爆发是“铁板钉钉”，有硅谷创业者表示，跟投资人聊到Generative Agents ，大家都特别期待，并希望多了解、靠的更近，在后续爆发时反应更快。

从这些判断来说，说“AI Agent开启大模型下半场”，还为时尚早，但“AI Agent是大模型的商业化标配”，应该是清晰的了。

所以，接下来我们应该会看到，更多大厂和创业公司，都在AI Agent上有更多动作。

那么，AI Agent究竟是什么？为什么说它是大模型商业化的必要条件？

大模型心高气傲，用户仍不买单

这里我们先把AI Agent放在一边，来看看大模型究竟是一个什么状况。

相信大多数读者都认可，大模型是一个高愿景、高投入、高门槛的东西，往情怀说，可能实现通用人工智能，彻底改变社会；往世俗说，可以重构业务/产品，让科技企业业绩狂飙。

但这些都有建立在，大模型能够真正商业化落地，回收研发成本，良性可持续发展的基础上。

几个月下来，大模型的两个商业模式，是比较有效的：一个是各类行业政企对大模型的私有化本地部署；一个是通过云、AI服务器等售卖大模型所需要的算力。

目前，已经有国內厂商发布了相应的业务报告，已经从行业私有化部署的需求中获得了千万级收入。

但是，仅靠ToB业务，显然不能支撑起一个大模型的商业模式。

一场技术革命，核心技术一定要流淌出去，让几十亿普通用户用起来，才能创造出经济价值。家用PC、互联网、智能手机，都是在大众普及之后，诸多科技企业的市值一飞冲天。

现在，巨头们都为训大模型投入了大量资源，尤其是基础模型，动辄千亿、万亿的参数规模，必须让大众用户用起来。

那么，实际应用体验怎么样呢？

闲聊、画图、创意之类的场景容错率高，就算AI答错了用户还觉得“萌萌哒”，这部分应用已经很卷了，比如“AI证件照”。而绝大多数场景，都是需要AI来自动帮助自己处理较为严肃的任务，与其他环境条件进行协作，应对长线条、连续性的业务，不要出现太多错误，不然人还得大量参与，并不能真的提高生产力。

这类场景，显然目前，一个庞大且复杂的通用大模型，是不能很好地解决的。

就拿我这种撰稿来说，让大模型帮我写稿子，它可能有幻觉，提到的事件/新闻/论文我都得再次复查确认一下，比我自己找资料还费事，不够精准，想一个创意还得我用提示词启发半天，都不一定有能用的，又慢又累，还不如自己写。

不能一步到位，自动化地完成任务，需要大量人类参与干预review，是目前大模型在严肃场景中应用的一大难点，也直接影响到了大模型落地和商业化的进展。

怎么办呢？大模型想要表现出色，急需一群帮手，那就是AI Agents。

真·解放生产力，AI Agent为什么神奇？

试想一下，如果大模型能自己全天7*24小时工作，还不需要人工参与，自己就能完成各种任务，人只要偶尔回到电脑前、办公室看看它做的咋样，这才是大模型的正确打开方式啊。

OpenAI在GPT-4发布会上，确实也展现了一些自动化完成任务的能力，比如让GPT4识别草图生成网页，step by step一步步修改自己代码中错误。

但是，这种能力怎么被开发者和普通用户用到呢？很多开发者都反应，直接使用GPT4写代码还是得自己debug，并不能看图生成直接用的代码，有时候不如不用。

大模型厂商也为难啊，我已经开放了API，要更专业精准精细化的能力，还得有人来进一步开发，这就把接力棒交给了AI Agent。

AI Agent（智能体），是AI在环境中的自动化实体，有四个核心特征：

1. 通过传感器感知周围的环境。这个环境，既可以是虚拟的，比如沙盒游戏、模拟训练系统、自动驾驶模拟器等，也可以是物理的，比如马路、房间、流水线等。

2. 可以自主做出决定。

3. 由执行器/效应器一起来采取行动。

4.基于绩效最大化和结果最优化来学习进步。

从这个角度看，其实人类自己也是一种“智能代理”AI Agent，我们可以通过眼睛、耳朵、皮肤等感知外界环境的变化，再通过大脑做出决策，用嘴说、用腿走来做出行动，并且根据奖励反馈来不断调整适应外界环境。

其实，Agents in AI也是一样的逻辑。就拿自动驾驶场景的AI Agent来说，就需要传感器来采集信息，感知道路车辆行人等环境因素，再由系统自动决策，驱动油门、制动器等设备做出相应的反应。

这也被称为AI Agent的PEAS模型。我们给大家简单做个表，感受一下：

那么，具体在大模型上，AI Agent可以带来什么影响了？主要有以下几个关键的作用：

第一，拆解任务。

大模型要和某个具体领域结合，面对的用户需求是比较笼统的，过程往往会涉及到多个步骤。就好比用户说“要有光”，孤立的大模型既不知道所在的环境有什么灯具，也不知道怎么控制，所以有了大模型也不能搞定这个看似简单其实复杂的任务。

而AI Agent具有任务规划能力，可以自动理解并决定，如何规划步骤、分配资源、优化决策，进而完成指令，提升了大模型处理任务的效率和精度。

谷歌大脑研究团队的一篇论文中，就让大语言模型把任务步骤分解的推理过程，也就是“内心独白”都说出来，再去做相应的动作，一下子就提高了大模型答案的准确性，在多个数据集上都取得了SOTA 效果，让大模型胡说八道的情况有所改善。

第二，自动执行。

AI Agent被设计为独立思考和行动，用户只需要给它一个任务，让它做事就可以了。AutoGPT的典型案例就是点披萨，不需要用户自己输入地址、选择口味，AI Agent将所有点餐步骤都大包大揽，自动执行，人在一边看着，发现出错及时纠正就好了。

AI Agent不止能使用互联网，还可以在物理环境中工作，控制机器人拿快递、无人车、自动驾驶等。

有了AI Agent，用户和大模型之间的交互，会更加自然、简单、快速，减少人工参与，真正提质增效。比如游戏世界中，AI Agent可以自动跟玩家展开对话，提供开放式的交互，根据玩家的反馈来设计无限故事线，真正让游戏做到千人千面；物理世界中，AI Agent自动生成指令和操作，驱动机械身体，为人类提供家政服务，在工厂里自动化作业，不依赖人类的指导就能完成。

第三，节约资源。

AI Agent像人一样，能够使用工具，也就是调用API，来处理更加复杂的任务，这就很好地扩展了大模型的能力，减少了对资源的浪费和过度消耗。

比如AutoGPT写代码，要对专有信息源数据、算力资源等进行访问，这个过程中AI Agent可以自动找到合适的API来进行调用，这样就可以避免浪费其他API token。还能够自主学习，对结果进行优化，如果不满意就重新调用 API。

一般来说，要真正完成一项不明确的用户指令，比如旅行规划，需要模型调用多个API才能解决问题，自动化强的AI Agent无疑能够很好地节省资源，进而为用户节省成本，让AI应用更有吸引力和竞争力。

第四，吸引开发者。

对大模型的商业化来说，API模式需要尽可能多的开发者群体参与，行业模式也需要ISV集成商、软件服务商等。大家都知道，和大厂卷基础模型是很难有胜算的，更希望在细分的上层应用上找到机会。而AI Agent能够解决具体问题、提高模型效果，驱动数字系统和物理实体，就非常适合来构建超级应用。

如果说AI Agent就像是一个最小单位的AI生命，那么大模型厂商就是孕育生命的工厂，而开发者、软件商等就像是技能培训班，教会它们一些实用而有差别的技能，到行业和用户身边努力工作。

所以，哪个大模型能够更好地构建AI Agent，能吸引的开发生态就会更庞大，对商业B端用户的粘性更强，形成一个AI平台级的巨大机会。

总结一下，AI Agent直接影响到大模型的模型效果、服务质量、落地成本、生态能力，将是接下来各个大模型的竞争关键。

AI Agent做得好，模型少不了

那你可能会问了，那怎么才能产生好的AI Agent呢？这对大模型提出了哪些挑战？

我们认为，AI Agent想要落地，需要大模型做好以下工作，这也是接下来的竞争焦点：

1.基础模型。

AI Agent的能力和效果，是由底层基础模型的能力决定的。基础模型有的能力，AI Agent不一定能用上，但基础模型没有的能力，AI Agent一定没有。

就拿语言任务来说，GPT-4提供了很强的自然语言理解能力，但目前真正部署到AI Agent和产品中的很少，一些游戏中的智能体NPC还是没有自主决策的行为能力的。

再比如，GPT-4虽然有多模态，但只开放了语言API，所以开发者想要用GPT4的多模态能力来构建AI Agent，还做不到，而缺失了图像、音频等其他模态的信息，AI Agent对环境的理解和效果还有待提升。

所以，无论是开源模型，还是闭源模型，想要通过API经济来商业化，基础模型的能力会直接关系到AI Agent的质量，且都还有提升的空间。

2.数据知识。

想要做好一个AI Agent，采集和使用数据是基本前提。对于开发者来说，数字任务的数据量已经不成问题，但开发物理世界的AI Agent，数据成本就非常高了。机器人的控制数据，一般只能自己采集，通过模拟器或者实体机器人现场采集。但模拟器毕竟不是真实的环境，训练的效果不一定好，而购买几百台机器人、无人机真正上路进厂去收集数据，无论是采购成本、政策限制、实际执行等，都有不小的困难。

这一点上，拥有数据优势的大模型厂商，比如谷歌、百度的自动驾驶优势，微软、谷歌、搜狗、百度等搜索业务的数据优势，或许能够为开发者的AI Agents探索减少一些门槛，也会为这些厂商的大模型建立壁垒。

3.产品支持。

必须承认，AI Agent所代表的大模型应用机会，还只是非常早期，技术上尚未完全成熟，商业化探索更是刚刚迈出了一点点步伐。对于开发者、软件服务商等来说，比起代码上怎么实现AI Agent，更关键也更早一步要考虑的，是想象一个AI Agent所应该的去向：

它应该是什么样子？叫什么名字？有性别吗？以什么性格跟用户对话？有哪些用例？会遇到哪些具体的困难？如何评价一个AI Agent的成功？

这些更多是产品层面、商业层面的“无人区”，要让开发者释放想象力，在各种环境和任务中尝试创建AI Agents，需要大模型厂商开放自身的商业生态和更丰富便捷的功能，来减少开发人员的试错风险，增加与商业用户对接的强度，去催生更多商业选择和落地案例。

总而言之，这个领域仍然很新，目前AI Agent还没有明确给大模型产业带来冲击，但AI Agent会消除人与AI系统的大量繁琐交互已经板上钉钉，正在发生。

更多AI Agents在被推向社区、推向用户，它们学习，它们改变，它们进化。或许几个月之后，我们就会看到AI Agents的成熟和爆发，这必然会引发大模型领域的又一次洗牌。

Tags：AI Agents 点击:() 评论:()

声明：本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,不构成投资建议。投资者据此操作，风险自担。如有任何标注错误或版权侵犯请与我们联系，我们将及时更正、删除。

▌相关推荐

一文搞懂 AI Agents 的不同类型

【摘要】本文将聚焦在针对不同类型的 AI Agents 技术进行解析，使得大家能够了解不同 AI Agents 实现机制以及所应用的市场领域。5 种不同类型的 AI Agents通常而言，AI Agents...【详细内容】

2023-12-05　　Search: AI Agents 点击:(148)　　评论:(0)　　加入收藏

一文读懂 AutoGPT 开源 AI Agents

Hello folks，我是 Luga，今天我们继续来聊一下人工智能(AI)生态领域相关的技术 - AutoGPT AI Agents ，本文将聚焦在针对不同类型的 AutoGPT 技术进行解析，使得大家能够了解不同 A...【详细内容】

2023-11-27　　Search: AI Agents 点击:(252)　　评论:(0)　　加入收藏

一文读懂 AI Agents 技术

想象一下：软件实体能够自主地与环境交互，根据收集的数据做出决策，并以最少的人为干预执行基于特定场景。幸好，借助 AI Agents 技术，这个现实比你想象的更接近了。这些智能代理正...【详细内容】

2023-11-21　　Search: AI Agents 点击:(148)　　评论:(0)　　加入收藏

大模型心高气傲，没有AI Agents生死难料

文｜脑极体AI Agent，正在接棒大语言模型LLM，成为AI圈最火的话题。目前，AI创投圈的众生相，大概是这样的：大厂俱乐部：OpenAI内部员工声称，AI Agent是OpenAI的新方向；微软尝试推动copilot...【详细内容】

2023-09-07　　Search: AI Agents 点击:(240)　　评论:(0)　　加入收藏

硅谷大佬都在聊的 AI Agents，是真热还是虚火？

ChatGPT 获得巨大成功后，OpenAI 已然奔向下一个目标—— AI Agents（智能体）。" 如果一篇论文提出了某种不同的训练方法，OpenAI 内部会嗤之以鼻，认为都是我们玩剩下的。...【详细内容】

2023-07-26　　Search: AI Agents 点击:(313)　　评论:(0)　　加入收藏

OpenAI大神Karpathy最新分享：为什么OpenAI内部对AI Agents最感兴趣

Andrej Karpathy这位OpenAI联合创始人最近在一个开发者活动上发表简短讲话，谈论了自己和OpenAI内部对AI Agents （人工智能代理人）的看法。Andrej Karpathy 对比了过去开发AI Ag...【详细内容】

2023-06-27　　Search: AI Agents 点击:(72)　　评论:(0)　　加入收藏

▌简易百科推荐

藏在AI背后的“吃电狂魔”

人工智能时代的能耗黑洞据估算，到2027年，人工智能行业每年将消耗85~134太瓦时的电力，相当于瑞典或荷兰一年的总用电量。马斯克判断，电力缺口最早可能会在2025年发生，“明年你会看...【详细内容】

2024-04-09　　　　雪豹财经社　　Tags:AI 　点击:(1)　　评论:(0)　　加入收藏

OpenAI和谷歌再起纷争：AI的尽头是内容

日前，纽约时报的一篇报道称，人工智能公司 OpenAI为收集高质量训练数据而开发了一个语音转录模型Whisper。该模型主要用于转录 OpenAI 获取的超过 100 万小时的 YouTube 视频，也...【详细内容】

2024-04-09　　小编也疯狂　　新浪网　　Tags:AI 　点击:(1)　　评论:(0)　　加入收藏

AI产业的灰色暗面：OpenAI、谷歌、META如何搞训练语料

财联社4月7日讯（编辑史正丞）种种迹象显示，目前站在全世界AI领域潮头浪尖的这些公司，早在几年前就已经陷入对训练语料的“绝望”追逐中——为此他们不惜修改政策条款...【详细内容】

2024-04-09　　　　财联社　　Tags:AI产业　点击:(1)　　评论:(0)　　加入收藏

和“数字人”交朋友，当心隐私被出卖......

在虚拟社交中如何在保护用户隐私和数据安全的同时提供高质量的社交体验？如何避免过度依赖虚拟社交找到虚拟与真实之间的平衡点？《中国消费者报》记者就此展开了调查APP里有个...【详细内容】

2024-04-09　　　　中国消费者报　　Tags:数字人　点击:(2)　　评论:(0)　　加入收藏

AI“复活”成产业链：成本可降至数百元

大模型应用落地，带火数字人(11.560, 0.29, 2.57%)赛道。文|《中国企业家》记者李艳艳实习生孙欣编辑|姚赟头图来源|《流浪地球2》电影画面截图清明节前，预估会有需求的庞立...【详细内容】

2024-04-09　　　　中国企业家　　Tags:AI“复活” 　点击:(2)　　评论:(0)　　加入收藏

多方热议人工智能产业新机遇

编者按&emsp;&emsp;从前沿科技展会到高层对话平台，从上海、重庆到博鳌，从线上到线下……一场场高规格、大规模的盛会中，人工智能正在成为各界热议的高频词。赋能千...【详细内容】

2024-04-08　　　　中国家电网　　Tags:人工智能　点击:(4)　　评论:(0)　　加入收藏

人形机器人时代来了吗

日前，由中国人形机器人(11.080, -0.05, -0.45%)百人会主办的人形机器人大赛在北京经济技术开发区开赛。工作人员向参观者展示一款人形机器人。参观者与一款陪护型人形机器人...【详细内容】

2024-04-08　　　　中国青年报　　Tags:人形机器人　点击:(5)　　评论:(0)　　加入收藏

AI重塑社交：腾讯与字节跳动的新赛场

文|新火种一号编辑|美美最近，腾讯和字节跳动这两大互联网巨头几乎同步推出了各自的AI社交产品，尽管腾讯和字节跳动在前段时间刚刚“破冰”，但这一举措不仅意味着这两大巨头之...【详细内容】

2024-04-07　　　　蓝鲸财经　　Tags:AI 　点击:(8)　　评论:(0)　　加入收藏

第一批用 Kimi 做内容的网红已经杀疯了

作者：王东东文章来自：斗战圣佛小组技术信仰派 VS 市场信仰派朱啸虎和月之暗面老板杨植麟在前几天有一场不算 battle 的 battle。battle 的争论点是：大模型有没有戏。技术派...【详细内容】

2024-04-04　　　　斗战圣佛小组　　Tags:Kimi 　点击:(4)　　评论:(0)　　加入收藏

昆仑万维发布面向人工智能时代的六条人才宣言

过去的一年多，是人工智能取得非凡进步的一年。在这充满突破性技术飞跃和备受争议的一年里，我们见证了人工智能的快速发展和广泛的影响，人工智能已经迅速地融入了我们的生活，深刻...【详细内容】

2024-04-03　　　　砍柴网　　Tags:昆仑万维　点击:(7)　　评论:(0)　　加入收藏

推荐资讯

AI是万灵药？Meta要把大	考研调剂第一次失败后
高职单招是什么意思？	在饭局上喝酒，要学会3
汽车不停能开多少公里	三证齐全，中国“飞的”
小米SU7被大卸八块，雷	视频号，从抖音挖来一个