在AI从业者里有位备受关注的“网红”叫Shawn Wang(他推特“swyx”更为大家熟知,同时也是Smol.ai的创始人),今年7月他在专栏“Latent Space”上首次提出了“AI engineer(AI工程师)”的概念。同名播客也是今年听过最精彩的栏目之一。
这个新“人群”介于传统机器学习工程师和为产品服务的全栈工程师之间,借助成熟的软件供应链和API生态,还有日益开放的模型和开发工具链,AI工程师能够快速搭建产品原型,利用现有公司的分发渠道或社媒等方式获得用户反馈和数据,从而进一步迭代模型本身,就如下图。
有趣的是,10月Shawn在湾区举办了第一届“AI Engineer Summit(峰会)”,大会上一位独立开发者发表了一个引起众多共鸣的事实:
“开发AI项目的过程中,我的时间80%都花在了UI设计上。”
AI似乎是最简单的部分,如何把一个花了两个小时搭好的demo变成可发布在生产环境的产品,才是最难的事情,而这部分工作量与AI无关。
在湾区的这段时间里,与正积极实践将AI融合到已有SaaS产品的AI工程师的交流中,也的确感受到从原型到内测,再到邀请种子客户测试的过程是复杂且反复,通常比预期都要长。
红杉美国在9月发表的《生成式AI进入第二阶段》新文章里,认为AI从拿着大模型找“钉子”的方式正式进入了“第二幕(Act 2)”,真正的壁垒在“客户中,而不是在数据中”。
这个观点对新进创业者来说有点残酷,如果一开始大模型就无法冲破传统的无论是面向企业场景的工作流或消费场景的网络效应的话,那么大部分创业公司现在仍面临“找钉子”的状态,而且需要快速转型。
在我看来,对初创公司甚至整个生成式AI的时代,其实大家仍在第一幕或第一阶段,并没有进入所谓的“第二幕”。
总的来说,还有三条鸿沟:
AI既可以是feature(功能),也可以是产品,目前边界是模糊的。
AI native对产品经理和设计提出前所未有和更高维度的要求。
与其死磕融入或创造”新工作流”,或许不如直接卖“新工作”。
不久前ChatGPT集成了PDF Chat功能,网上就这个功能对一系列相似产品的冲击展开了很有意思的讨论。不少人认为很多初创公司会因此死掉,所有类GPT “wrApper/套壳”类产品都会在未来由于ChatGPT本身能力的延展而受到严重挤压。
没过多久,PDF.ai的创始人Damon Chen发表了自己的看法:
“我不认为ChatGPT会把很多PDF相关的小功能但又是用户急切需要的都开发出来。当然,很多比我们规模小许多或者准备做这个方向的创业者会退场,而如果有VC投资的初创公司可能会死亡,如果他们还持续烧钱。
但是PDF.ai一直是bootstrap且盈利的。我们不是为了成为独角兽,几百万美金ARR对我们来说足够好了,我有1000%的信心可以做到。所以我甚至更乐观了,我们有能力在Chat PDF类的产品里做到最好。”
更有意思的是,在上周第一届OpenAI Dev Day当日,Chatbase的创始人Yasser和Damon同时在公开宣称当日自家网站注册量的激增,似乎这些所谓的”AI套壳“产品并没有受到重创,反而让更多用户发现通用型GPT和单点工具的差异而选择后者。
我非常赞同Damon的想法,也给创业者和独立开发者很多启发。
首先,如果要验证AI是否在假设场景的价值,不要忌讳先做成“wrapper”。要快速搭建出可用的工具型产品,验证市场。
经过大半年跟许多尝试想快速在OpenAI的API基础上搭建一个可用demo的工程师交流后,大家普遍发现要真正从一个外界看来是“套壳”的demo到变成可用的产品,还要跨越很多障碍,需要反复做许多实验。
如上图,在AI Engineer的大会上对迁移学习中的领域自适应(Domain adaptation),就有了现在集中主流方式的探讨,想必RAG(搜索增强生成)是各类需要大模型获得更多事实性信息的应用很关注的话题。
所以,即便利用了大模型的API,我们也不能笼统地认为“套壳”是一个简单的工作,至少要做到一个可用的工具,百万级用户能稳定使用的产品,比大部分没有0到1做过的人想象中要困难很多。
(那些从未真正build过产品的人总说OpenAI杀死了很多AI套壳产品,而正在做产品的人一直在挣钱)
其次,创业在海外拥有非常立体的环境。立体具体表现在:
你可以选择不拿融资或少量融资,做一款拥有几十万甚至百万用户的小巧工具,同时有几十万甚至百万美金收入。也可以选择获得巨额融资,发展成为能服务上千家企业客户,拥有千万甚至过亿美金收入的企业级产品。
前者一直保持较小团队规模,许多时候不超过10人,就能持续盈利,就像早些时候的Midjourney。后者在通常情况下,会持续扩张并保持融资和烧钱状态,目的是成为行业第一,并试图挤压第二和第三的市场份额。
结果是,大多数前者很多时候并不会因为后者的持续扩张而受到严重挤压,除非真的因为本身产品的退步。后者虽然有很大想象和飞跃可能,但要承担一旦无法取得投资人预期的成绩,就需要做出巨大改变或转型,否则就要面临因为无法自身造血而彻底退场的结局。
所以,当下无需过多纠结AI将是一个现有产品的“功能”还是有机会成为一个独立的原生产品,因为在不同类型的用户和场景来看,很可能都会存在。
但接下来,这对产品经理和设计师都提出了一个重要挑战——如何设计出下一代AI原生体验的产品。
蒙眼狂奔了大半年的AI公司的确开始吸纳产品经理了,比如今年我了解到发展最快之一的法律科技公司Harvey.ai,不仅获得了OpenAI和红杉美国的投资,最近宣布招聘了第一位产品负责人Aatish Nayak,Nayak曾是Scale.ai的产品负责人,工作长达4年时间,也见证了传统机器学习向生成式AI演进的重要里程。
同样几个月前,演示文稿生成工具Tome也吸纳了第一位AI产品经理,在湾区跟他交流的时候,他刚加入不久,跟团队高层当时讨论的核心便是,以对话为交互基础的体验到底是不是用户最能接受的方式?
或者说,作为一位AI产品经理,很重要的是如何将“传统”用户旅程和AI原生的体验(目前核心是对话引导)巧妙结合,包括如何引导用户尽快上手体验AI。
一个微妙的发现是:产品不再是AI初创公司刚开始的必要岗位,AI本身让创始人成为最重要的产品经理。
根本原因是,生成式AI给产品设计带来的机会是让所有产品实验得以实时进行,让用户无感知地反馈甚至参与后续迭代,包括产品设计和”产品模型“。
产品模型便是所有实验的核心,它是作为AI工程师或创始人,需要构建的一套完整且能自我迭代的技术栈,最终像OpenAI的联合创始人Andrej Karpathy在他的”软件3.0“理论中提出的:
让产品能够获得”理解“和”生成“的能力。
无论这套模型是否拥有自己的大模型,无论在领域自适应中使用了哪种方法获得精确的背景信息,无论是否通过自然语言对话来完成用户的交互,重要的是能否利用现有的任何技术,设计出一套能实时产生交互数据并能反馈于最终效果和体验的模型。
这里面最成功的案例莫非Github Copilot了。记得在某期播客中,产品初期的负责人曾说过,最美妙的地方在于用户是与产品本身实时在交互,交互的过程(删掉或保留代码)和结果(代码和程序)就是对模型最直接的反馈。甚至都不需要像ChatGPT一样需要用户点击”大拇指