硅谷大佬都在聊的 AI Agents，是真热还是虚火？

时间：2023-07-26 19:54:33 来源：甲子光年作者：

ChatGPT 获得巨大成功后，AI target=_blank class=infotextkey>OpenAI 已然奔向下一个目标—— AI Agents（智能体）。

" 如果一篇论文提出了某种不同的训练方法，OpenAI 内部会嗤之以鼻，认为都是我们玩剩下的。但是当新的 AI Agents 论文出来的时候，我们会十分认真且兴奋地讨论。普通人、创业者和极客在构建 AI Agents 方面相比 OpenAI 这样的公司更有优势。" OpenAI 联合创始人，前 TeslaAI 总监 Andrej Karpathy 说道。

Karpathy 的公开发言为 AI Agents 添了不少热度。但他的判断并非一家之言。

早在 3 月份，AutoGPT 就在 Github 上获得 7.4 万星，并快速成为史上 Star 数量增长最快的开源项目；而后发布的 BabyAGI、AgentGPT 更如雨后春笋般涌现：订购披萨、整理邮箱、创建博客，甚至举办一场情人节派对……

越来越多的 AI Agents 出现在人们生活的各个场景下，热潮迅速开始从硅谷蔓延。

自主执行、独立运作，AI Agents 被科技人士给予极高的期待，认为其是 " 变革社会的生产力工具 "。更有人将其视作 " 通往通用人工智能（AGI）时代的开始 "。

但呼声并不能掩盖现存的问题。

" 大模型是 AI Agents 的前提，有了足够好的硬件基础后，才能去发展 AI Agents。" 真格基金管理合伙人戴雨森对「甲子光年」表示。

严格来说，市面上只有 ChatGPT 一个 " 合格 " 的大模型底座。受制于模型算力，国内仍然缺乏 AI Agents 的开发土壤。

未来美好，现实残酷。技术研发与创业投资等都在摇摆中进行。AI Agents 的红利期何时真的伴随大模型浪潮而来，谁都不得而知。但可以肯定的是，改变已悄然开始。

AI Agents：帮你做事的 " 数字助理 "

与其把 AI Agents 当作 ChatGPT 升级版，不如将它视作人类的 " 数字助理 " 更为合适。

它不仅告诉你 " 如何做 "，更会 " 帮你做 "。作为一种媒介，AI Agents 代替人类与 GPT 等大语言模型（Large Language model, LLM）进行反复交互，只要给定目标，它便可以模拟智能行为，自主创建任务、重新确定任务列表优先级、完成首要任务，并循环直到目标达成。

与传统的人工智能不同，AI Agents可以在没有人类控制的情况下独立运行。通过接入 API，AI Agents 甚至可以浏览网页、使用应用程序、读写文件、使用信用卡付款等等。

简单来说，只需要给它一个目标，AI Agents就能完成剩下的全部工作。例如 HyperWrite 研发的 AI agent 通过 Chrome 浏览器的控制程序来自动帮你订购披萨。

图源：HyperWrite CEO Matt Shumer Twitter 账号

这种想象放在科幻电影里并不难，但在人工智能探索历程上，已经持续了将近半个世纪。

早在 20 世纪 80 年代，计算机科学家就开始探索如何开发一个可以像人类一样交互的智能软件。但苦于数据和算力限制，AI Agents 缺乏必要的现实条件。

斯坦福大学计算机科学博士 Joon Park 曾在访谈中表示：" 我们一直在朝着那个方向努力，但过去几十年的所有方法，甚至都没有接近我们现在借助 LLM 所实现的效果 ...... 这就是为什么我们忘记了这一愿景。但当 LLM 出现时，我们意识到机会来了。"

大语言模型是 AI Agents 的核心大脑。通过拆解复杂任务，可以将复杂的用户需求拆解为可实现的任务方式。

一方面，大模型的训练建立在互联网的基础上包含了大量的人类行为数据，弥补了构建可信 AI Agents 的关键要素。

另一方面，在可观的知识容量下，大模型涌现出优秀的上下文学习能力、推理能力。通过建立思维链来实现模型的连续思考和决策，AI Agents 可以分析复杂问题，并将其拆解成简单、细化的子任务。

与此同时，LLM 以语言作为媒介也改变了前端的交互形式。BV 百度风投 AI 应用赛道负责人，投资副总裁温永腾告诉「甲子光年」："BV 百度风投很早就开始关注 AI Agents 的发展，通过研判，我们认为原先的图形用户界面（GUI）有可能转变为语言用户界面（LanguageUI），AI Agents 的前端应用将存在于所有可能与人类交互的前端形式之中。"

只是拆解任务，还远远算不上智能。LLM 驱动下的AI Agents，离不开三个关键组件：

LLM 驱动下的 AI Agent System 概览（图源：Lilian Weng 个人博客）

三个组件配合下，AI Agents 不仅能像人一样思考，也能像人一样行动。

就像人类一样，在从事复杂任务时，每一步之间往往会有一个推理过程。AI Agents 也会借助 ReAct 组件（Reasoning and Acting），将大模型的推理能力和行为决策紧密结合起来，使语言模型可以根据知识进行有逻辑地计划安排。

Reflexition 框架则为 AI Agents 提供动态记忆与自我反思的能力。通过语言反馈而非更新权重的方式来强化 Language Agents，让它可以改进过去的行动决策、纠正过往的错误以不断提高自身表现。

在信息获取、储存、保留、检索的进程上，AI Agents 也力图模仿人类的记忆构成，构建高效的内存系统。

模拟人类记忆方式，AI Agents 会将感觉记忆、短期记忆、长期记忆，分别表示为原始输入的学习嵌入（如文本、图像等）、上下文学习、外部向量储存。任务与结果会储存在记忆模块中，当信息被调用时，储存在记忆中的信息会回到与用户的对话中，由此创造出更加紧密的上下文环境。

人类最显著的特征之一就是使用和创造工具。通过配备外部工具，使用 API 来调用各种接口，AI Agents 能够模拟人类使用工具，完成更复杂的任务。

虽然技术层面并未完全成熟，诸如数据管理、长期记忆等问题仍在解决。但 AI Agents 自主执行、迭代优化、" 解放双手 " 的能力也让走红成为必然。

接替 LLM，AI Agents 成为下一个 AI 热点

ChatGPT 的诞生，实现了 AI 与人类进行多轮对话，并提供信息和建议的功能。Copilot 的推出，使 AI 足以承担为人类完成工作初稿的能力，例如 Github Copilot、Microsoft 365 Copilot、Midjourney，分别成为人们在编程、办公、图像生成领域中的 " 智能副驾 "。

告诉 AI 完成一件任务，它就能完成一件任务——撰写文案、回答问题，或者生成一张人类肉眼难以分辨真假的照片。而与此同时，人们也往往需要为 AI 的每一步行动提供具体清晰的提示。

此时的 AI 就像是初来乍到，没有任何经验，需要手把手教导的实习生。但是，如果你想要一个听指令办事，执行中遇到困难自己解决，尽量不给人添麻烦的好员工呢？

3、4 月份，Camel、AutoGPT、BabyAGI、西部世界小镇等多个 AI Agents 集中爆发，似乎让人们看到了这样的可能。

自 3 月份，Significant Gravitas 将 AutoGPT 开源后，发布时间不到 2 个月，AutoGPT 在 GitHub 上获得的 star 数量已经达到 13 万，成为史上 star 数量增长最快的开源项目。

斯坦福大学打造的西部世界小镇（图源：论文《Generative Agents: Interactive Simulacra of Human Behavior》）

Andrej Karpathy 就曾在 Twitter 上表示：" 提示工程（prompt engineering）的下一个前沿是 AutoGPTs"。截至目前，AutoGPT 在代码托管平台 Github 上已经获得超过 14 万 star，排名历史第 25 位。

OpenAI 联合创始人兼 CEO Sam Altman 曾在多个场合表示，构建庞大 AI 模型的时代已经结束，智能体才是挑战。

在一篇介绍自主智能体的文章中，作者 Octane AI（一家数据营销平台提供商）联合创始人兼 CEO Matt Schlicht 收集了来自业界、学术界、投资界等上百余人的观点和看法，有来自 Meta、Nvidia、Stability AI 等大公司或 AI 初创公司的专家，也有斯坦福 CS 的教员和投资了包括 Hugging Face 在内的 AI 投资人，绝大多数都表达了对 AI Agents 潜能的期待和展望，甚至将其称为 " 原始 AGI"。

接替大模型，AI Agents 似乎正在成为 AI 的下一个热点。

但与此同时，反对的声音也不绝于耳。

图灵奖获得者 Yoshua Bengio 在今年 5 月发布的博文《危害人类的 AI 是如何出现的》中就提及，人类能控制 AI Agents 总任务、总目标，并不意味着人类能控制 AI Agents 凭借自己的智慧分解出来的子任务、子目标，除非 AI 对齐（alignment）的研究取得突破，否则人类就没有强有力的安全保障。

智能体的集体出现，大佬的追捧和质疑，AI Agents 的浪潮迅速且火热。

然而，AI Agents 在人工智能的圈子内并不是一个新名词。

2014 年，DeepMind 推出的围棋 AI AlphaGo，其实就是 AI Agents 的一种。与之类似的还有 2017 年 OpenAI 推出的用于玩《Dota2》的 OpenAI Five，2019 年 DeepMind 公布用于玩《星际争霸 2》的 AlphaStar。

当时的业界潮流是通过强化学习（reinforcement learning）的方法来训练和改进 AI Agents，主要应用于游戏场景，特别是一些对抗性、具有明显输赢双方的比赛中。但如果想要在真实世界中实现通用性，却是一个悬而未决的问题。

之后的几年，OpenAI 转向大语言模型，GPT 系列的相继推出，大模型成为各家科技厂商争先涌入的赛道，也正是大模型的发展，让 AI Agents 有了突破瓶颈、重新发展的契机。

相较于几年前局限在游戏场景，在大模型的基础上 AI Agents 可以实现什么？BV 百度风投 AI 应用赛道负责人，投资副总裁温永腾向「甲子光年」表示：" 我们看到的不仅仅是技术进步使得 AI 在理解用户意图、收集信息以及执行任务的能力大大增强，更重要的是，AI Agents 完全有能力重构未来的应用生态 "。

在 AutoGPT 推出后不久，已经有不少网友使用 AutoGPT 来搭建自动化的个人助理。例如 FirstSales.io 的创始人兼 CEO Udit Goenka 发帖称，他利用 AutoGPT 搭建了一个勘探引擎，可以搜索去年获得种子轮投资的公司，并能描述创建列表的详细信息。

google 软件工程师 Yew Jin Lim 表示，他用 AutoGPT 创建了一个电子邮件助手，通过电子邮件向 AI Agents 发送任务详情。

真格基金管理合伙人戴雨森告诉「甲子光年」："Agent 是一个让生产力真正能大幅提高的方向，因为如果还是人做事情，人总是有限的 "。

"AI Agents 将会成为日常生活和工作中的生产力工具。"Matt Schlicht 写道，" 从管理社交媒体账号、投资市场，到出版最好的儿童读物，AI Agents 将存在于各个行业和每一项可以被想象出的任务之中。" 例如 aomni，是一款可以在网络上查找任何主题信息的 AI Agent，会通过创建列表，一项一项完成用户的目标。

除了生产力需求之外，Inflection AI 的个人 AI Agent Pi 提供了另一个可能的应用方向。

不同于 ChatGPT、Claude 通用人工智能的定位，Pi 主打高情商、情感陪伴、提供情绪价值。Pi 还会记住和用户的历史对话，除了参与并辅助人们的工作与生活，还会学习联系朋友和家人的方式与用户建立联结。目前 Inflection AI 已获得超 15 亿美元的投资，超越了 Anthropic，仅次于 OpenAI。

AI Agents 会是下一个风口吗？

"Building a kind of JARVIS（构建类似于 JARVIS）"，这是 Andrej Karpathy 在 Twitter 上最新更新的简介，JARVIS 是漫威超级英雄钢铁侠的一位人工智能助手，具备独立思考的能力，能帮主人处理各种事务，计算各种信息。

Karpathy 的简介也意味着，AI Agents 赛道的发令枪已经打响。

外媒《The Information》指出，Sam Altman 曾在 5 月私下告诉部分开发者，OpenAI 希望将 ChatGPT 打造成个人工作助手，并有知情人士指出，OpenAI 一直在关注如何使用聊天机器人来创建自主的AI Agents，相关功能很有可能部署在 ChatGPT 助手中。

无独有偶，Meta 也看到了 AI Agents 的机会。

早在 4 月，Zuckerberg 就曾对投资者表示，Meta 看到了 " 以有用且有意义的方式向数十亿人介绍 AI Agents 的机会 "，但此时他并没有说明具体的应用。

而在 6 月一次与员工举行的全体会议上，Zuckerberg 宣布了一系列处于不同开发阶段的技术，其中一个就是将带来具有不同个性和能力的 AI Agnts 来提供帮助或娱乐，最初主要用于 Messenger 和 WhatsApp。

在国内，AI Agents相关的产品也相继诞生。

在 7 月初的 WAIC 现场，阿里云就发布了旗下第一个智能体—— ModelScopeGPT，面向开发者群体，并将在未来推出一系列智能体以应对多种应用场景。

华为在该领域也有涉及，但更侧重于具身智能（Embodied AI），即大模型与机器人的结合。

除了大厂，AI Agents 也是创业者们的机会。OpenAI 联合创始人 Karpathy 特意在此前的演讲中提到：" 普通人、创业者和极客在构建 AI Agents 方面相比 OpenAI 这样的公司更有优势。"

BV 百度风投 AI 应用赛道负责人，投资副总裁温永腾表示，BV 团队目前也对初创企业在 AI Agents 领域中的机会持乐观态度。

" 未来的应用生态将是多元化的，而非由单一巨头主导。AI Agents 的出现带来了一次范式转移的机会，许多传统应用都面临被颠覆改造的可能性。在这个过程中，初创公司有大量的机会去开垦新的领域。对于每一个特定的任务，AI Agents 都有大量的优化空间，包括特定算法与服务的构建、用户数据以及产品设计等方面，都是初创公司可以建立差异化优势的地方。"

" 此外，当前 AI Agents 的生态还不够明确，这为初创企业提供了有利的发展机会，因为它们并不需要在一个已经确定的规则下进行竞争，从这个角度上来看，初创企业与大公司是站在同一起跑线上的，并且初创企业更为灵活，可以很快进行产品的调整。"

凭借在人工智能领域布局多年所积累的认知，BV 百度风投并不认为模型公司会垄断应用层的机会。因为对于底层模型公司来说，构建生态的意义远大于垄断某一应用，如果底层模型公司采取排他性的策略来获取应用层的竞争优势，可能会对其自身的生态造成伤害。底层模型公司可能会在他们关注的一两个领域构建强大的 AI Agents，但他们没有必要在所有领域都与初创企业竞争。

尚未确定的生态，还未被制定规则的赛场，所有人又回到了同一起跑线上。

但不可否认的是，目前为止，除了许多演示之外，AI Agents 并没有真正的产品出现。

真格基金管理合伙人戴雨森将 AI 和人类协作的程度类比为自动驾驶的不同阶段，AI Agents 就好比自动驾驶的 L4 阶段。但就如同 L4 一样，AI Agents 容易想象、演示，却难以实现，AI Agents 的真正应用还在不确定的未来。

将 AI 和人类协作的程度类比自动驾驶的不同阶段（图源：戴雨森即刻账号 @yusen）

戴雨森强调，想要实现可用的 AI Agents，还需要大幅提高大模型的能力，即使是对处于顶层的 OpenAI 来说，在延迟、性能上也有很高的提升空间。

" 如果用蒸汽机来打比方的话，水烧到 100 度才能产生蒸汽，如果 AI Agents 的智力还没有达到一定的程度，水只烧到了 50 度，即使已经花费了很多能源，依然无法产生蒸汽，依然是 0。"

AI Agents 赛道的发令枪已经打响，只不过，这绝对不是短短几个月内的冲刺，而是注定要长达几年，甚至跨越十年的长跑马拉松。

来源：甲子光年

Tags：AI Agents 点击:() 评论:()

声明：本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,不构成投资建议。投资者据此操作，风险自担。如有任何标注错误或版权侵犯请与我们联系，我们将及时更正、删除。

▌相关推荐

一文搞懂 AI Agents 的不同类型

【摘要】本文将聚焦在针对不同类型的 AI Agents 技术进行解析，使得大家能够了解不同 AI Agents 实现机制以及所应用的市场领域。5 种不同类型的 AI Agents通常而言，AI Agents...【详细内容】

2023-12-05　　Search: AI Agents 点击:(148)　　评论:(0)　　加入收藏

一文读懂 AutoGPT 开源 AI Agents

Hello folks，我是 Luga，今天我们继续来聊一下人工智能(AI)生态领域相关的技术 - AutoGPT AI Agents ，本文将聚焦在针对不同类型的 AutoGPT 技术进行解析，使得大家能够了解不同 A...【详细内容】

2023-11-27　　Search: AI Agents 点击:(252)　　评论:(0)　　加入收藏

一文读懂 AI Agents 技术

想象一下：软件实体能够自主地与环境交互，根据收集的数据做出决策，并以最少的人为干预执行基于特定场景。幸好，借助 AI Agents 技术，这个现实比你想象的更接近了。这些智能代理正...【详细内容】

2023-11-21　　Search: AI Agents 点击:(148)　　评论:(0)　　加入收藏

大模型心高气傲，没有AI Agents生死难料

文｜脑极体AI Agent，正在接棒大语言模型LLM，成为AI圈最火的话题。目前，AI创投圈的众生相，大概是这样的：大厂俱乐部：OpenAI内部员工声称，AI Agent是OpenAI的新方向；微软尝试推动copilot...【详细内容】

2023-09-07　　Search: AI Agents 点击:(240)　　评论:(0)　　加入收藏

硅谷大佬都在聊的 AI Agents，是真热还是虚火？

ChatGPT 获得巨大成功后，OpenAI 已然奔向下一个目标—— AI Agents（智能体）。" 如果一篇论文提出了某种不同的训练方法，OpenAI 内部会嗤之以鼻，认为都是我们玩剩下的。...【详细内容】

2023-07-26　　Search: AI Agents 点击:(313)　　评论:(0)　　加入收藏

OpenAI大神Karpathy最新分享：为什么OpenAI内部对AI Agents最感兴趣

Andrej Karpathy这位OpenAI联合创始人最近在一个开发者活动上发表简短讲话，谈论了自己和OpenAI内部对AI Agents （人工智能代理人）的看法。Andrej Karpathy 对比了过去开发AI Ag...【详细内容】

2023-06-27　　Search: AI Agents 点击:(72)　　评论:(0)　　加入收藏

▌简易百科推荐

藏在AI背后的“吃电狂魔”

人工智能时代的能耗黑洞据估算，到2027年，人工智能行业每年将消耗85~134太瓦时的电力，相当于瑞典或荷兰一年的总用电量。马斯克判断，电力缺口最早可能会在2025年发生，“明年你会看...【详细内容】

2024-04-09　　　　雪豹财经社　　Tags:AI 　点击:(1)　　评论:(0)　　加入收藏

OpenAI和谷歌再起纷争：AI的尽头是内容

日前，纽约时报的一篇报道称，人工智能公司 OpenAI为收集高质量训练数据而开发了一个语音转录模型Whisper。该模型主要用于转录 OpenAI 获取的超过 100 万小时的 YouTube 视频，也...【详细内容】

2024-04-09　　小编也疯狂　　新浪网　　Tags:AI 　点击:(1)　　评论:(0)　　加入收藏

AI产业的灰色暗面：OpenAI、谷歌、META如何搞训练语料

财联社4月7日讯（编辑史正丞）种种迹象显示，目前站在全世界AI领域潮头浪尖的这些公司，早在几年前就已经陷入对训练语料的“绝望”追逐中——为此他们不惜修改政策条款...【详细内容】

2024-04-09　　　　财联社　　Tags:AI产业　点击:(1)　　评论:(0)　　加入收藏

和“数字人”交朋友，当心隐私被出卖......

在虚拟社交中如何在保护用户隐私和数据安全的同时提供高质量的社交体验？如何避免过度依赖虚拟社交找到虚拟与真实之间的平衡点？《中国消费者报》记者就此展开了调查APP里有个...【详细内容】

2024-04-09　　　　中国消费者报　　Tags:数字人　点击:(2)　　评论:(0)　　加入收藏

AI“复活”成产业链：成本可降至数百元

大模型应用落地，带火数字人(11.560, 0.29, 2.57%)赛道。文|《中国企业家》记者李艳艳实习生孙欣编辑|姚赟头图来源|《流浪地球2》电影画面截图清明节前，预估会有需求的庞立...【详细内容】

2024-04-09　　　　中国企业家　　Tags:AI“复活” 　点击:(2)　　评论:(0)　　加入收藏

多方热议人工智能产业新机遇

编者按&emsp;&emsp;从前沿科技展会到高层对话平台，从上海、重庆到博鳌，从线上到线下……一场场高规格、大规模的盛会中，人工智能正在成为各界热议的高频词。赋能千...【详细内容】

2024-04-08　　　　中国家电网　　Tags:人工智能　点击:(4)　　评论:(0)　　加入收藏

人形机器人时代来了吗

日前，由中国人形机器人(11.080, -0.05, -0.45%)百人会主办的人形机器人大赛在北京经济技术开发区开赛。工作人员向参观者展示一款人形机器人。参观者与一款陪护型人形机器人...【详细内容】

2024-04-08　　　　中国青年报　　Tags:人形机器人　点击:(5)　　评论:(0)　　加入收藏

AI重塑社交：腾讯与字节跳动的新赛场

文|新火种一号编辑|美美最近，腾讯和字节跳动这两大互联网巨头几乎同步推出了各自的AI社交产品，尽管腾讯和字节跳动在前段时间刚刚“破冰”，但这一举措不仅意味着这两大巨头之...【详细内容】

2024-04-07　　　　蓝鲸财经　　Tags:AI 　点击:(8)　　评论:(0)　　加入收藏

第一批用 Kimi 做内容的网红已经杀疯了

作者：王东东文章来自：斗战圣佛小组技术信仰派 VS 市场信仰派朱啸虎和月之暗面老板杨植麟在前几天有一场不算 battle 的 battle。battle 的争论点是：大模型有没有戏。技术派...【详细内容】

2024-04-04　　　　斗战圣佛小组　　Tags:Kimi 　点击:(4)　　评论:(0)　　加入收藏

昆仑万维发布面向人工智能时代的六条人才宣言

过去的一年多，是人工智能取得非凡进步的一年。在这充满突破性技术飞跃和备受争议的一年里，我们见证了人工智能的快速发展和广泛的影响，人工智能已经迅速地融入了我们的生活，深刻...【详细内容】

2024-04-03　　　　砍柴网　　Tags:昆仑万维　点击:(7)　　评论:(0)　　加入收藏

推荐资讯

AI是万灵药？Meta要把大	考研调剂第一次失败后
高职单招是什么意思？	在饭局上喝酒，要学会3
汽车不停能开多少公里	三证齐全，中国“飞的”
小米SU7被大卸八块，雷	视频号，从抖音挖来一个