文 | 适道
本期内容摘要
ChatGPT的横空出世,让创投界燃起对AI领域的投资热情。
但不同于互联网时代的流量模式,作为前沿科技,AI领域投入大、周期长、竞争者众多。
AI投资难免出现“雷声大雨点小”的现象。CB Insights数据显示,今年第二季度,全球AI领域投资总额环比暴减38%。
即便如此,在每个行业都将被AI革命的当下,不可否认,AI一定是未来几年最大的产业趋势。创业投资数据库Carta报告显示,和其他类别的初创公司相比,AI初创公司的估值和融资规模拥有更好的增长趋势。
投资人如何在发展早期找到AI投资的锚点,尤为关键。或许我们可以学习老牌风投公司的做法。
01 早期找到AI投资的锚点
Index Ventures(简称Index)是一家欧洲老牌的风险投资公司,成立于1996年。一直以来,Index都是AI的忠实信仰者和倡导者。
在ChatGPT发布的一年前,Index领投了Cohere的4000万美元A轮融资,目前Cohere已经是估值20亿美金的AI独角兽。(关于Cohere是谁,可以参考我们的上一篇文章最年少Transformer论文作者如何与非典型华人创业者联合打造20亿美元的AI独角兽?|独角兽真探)
此外,在ChatGPT将AI主流化的前几年,Index已经开始对旧金山的自动驾驶技术公司Aurora;纽约的机器学习平台Arthur AI等人工智能公司进行投资。
前段时间,Index的合伙人Erin Price-Wright领投了Weaviate,这是一家开源向量数据库公司。该公司在今年4月份以2亿美元的估值筹集了5000万美元的B轮融资,除了Index,NEA、Cortical Ventures、Zetta Venture Partners和ING Ventures也加入了这一轮融资。
那么,Index为何将眼光投向了向量数据库?适道(ID:survivalbiz)找到了Index合伙人Erin Price-Wright女士近期的访谈文章《Here’s How Index Ventures Is Investing In An Era Where‘Every Company Will Have AI’》,下面是文章的翻译简写和补充。
02 投资向量数据库Weaviate
首先,对于ChatGPT,Price-Wright没有给出高度评价,她认为ChatGPT只是在走捷径,毕竟这项技术已经存在了几年,不是什么新鲜事。ChatGPT之所以走红,是因为“突然之间,它被每个人看到了,每个人能真切地感受到它作为一个消费品”。
那么,真正具备价值的是什么?
从采访来看,Price-Wright给出的答案包括支撑ChatGPT的向量数据库。
目前的大语言模型主要基于深度学习技术。深度学习需要输入文本,图片,视频等语料数据。但这些语料数据需要转化为向量数据,才能被神经网络使用。而向量数据库,是用来存储和查询向量数据的数据库。
为解释向量数据库的作用,我们假设一个场景。图书馆一般按类型和作者排列书籍,例如文学类、经济类等等。但如果你想找一本小时候看过的恐怖故事,只记得里面有稻草人变成活人的情节,不记得书名和作者时,你该怎么做?
如果你没时间翻找书架,最快的方法是问图书管理员,因为他们读过很多书,更可能知道哪本书是你要找的。
那么,图书管理员就是一个向量数据库,因为向量数据库旨在存储关于对象(例如书籍)的复杂信息(例如书籍的情节)。因此,向量数据库可以帮助你根据特定的查询(例如,一本关于…的书)而不是一些预定义的属性(例如,作者)来查找对象,就像图书管理员一样。
例如,让ChatGPT用莎士比亚的语气生成一段诗句,ChatGPT先会通过向量数据库的相似搜索功能,才能增强内容输出的准确性。
因此,训练大模型时,向量数据库可以成为一个知识库,给大模型提供最新数据、每个客户企业独有的内部知识库。
Price-Wright表示,在寻找这个投资机会(投资Weaviate)前,Index花了近两年的时间研究向量数据库。“而真正让我们下定决心的事件是ChatGPT,它让我们真正理解了向量数据库在更多生成式AI工作流中的价值,以及真正理解嵌入算法的重要性。”
公司在思考中得出了两个结果。
1、当你考虑了所有这些不同类型的生成式AI用例,会发现实际市场比单独的企业搜索市场要大得多。(the market was actually way bigger than the market for enterprise search alone, if you’re thinking about all of these different types of generative AI use cases.)
2、拥有一个专用数据库的价值,它可以非常接近嵌入算法。让你成为其产品的一等公民,而不是现有数据库的附加产品。(the value of having a dedicated database that could get really close to the embedding algorithms as a first-class citizen within its product, versus a bolt-on for an existing database.)
Price-Wright认为:“在接下来的十年中,已拥有大量数据集、大量客户群和复杂运营的企业会开始将AI融入到他们的产品中,让运营更高效、流程更精简、决策更快更灵活。我们将看到AI成为企业新型搜索的一个大的推动者,将数据编码成向量,并使用AI寻找相似的信息。对于很多用例来说,这比关键词搜索更加强大。”
那么,让Index青睐有加的Weaviate又有哪些优势?
Weaviate首席执行官兼联合创始人Bob van Luijt表示:“作为一个开源产品,Weaviate向量数据库被用作AI原生生态系统的核心基础设施。它允许从初创公司到企业的用户创建新一波应用程序,范围从定制的搜索和推荐系统到ChatGPT插件。”
另外,Weaviate向量数据库简化了AI开发人员的向量数据管理,解决了生成、存储和搜索嵌入向量及其相应对象的难题,具有如下功能:
1、可扩展的内置机器学习(ML)模块:只需加载和搜索;Weaviate负责机器学习(ML)的繁重工作——任何数据类型、任何模型、任何用例。
2、更丰富的向量搜索:支持各种ML搜索,还可以搜索向量和生成向量的源对象。
3、高性能:亚秒搜索,可扩展到数十亿个对象,不间断运行。
Price-Wright也曾在另一篇采访中表示:“企业和人工智能原生初创公司使用Weaviate开发多模式搜索、推荐和生成应用程序的速度令人难以置信。这是开发人员使用人工智能构建的最佳产品,我们很高兴能与他们合作,帮助推动下一阶段的增长。”
03 垂直整合投资
除了投资向量数据库,Index还在AI投资领域做了哪些动作?
如同SaaS随着云计算的兴起而出现一样,基于AI原生的产品也正在带来新的商业模式。
Index认为:第一,在十年内,AI将成为每一个应用软件的核心组件;第二,这一波浪潮将由广泛采用的基础模型(foundation models)来推动。
“我们并不确切地知道这些新的商业模式将会是什么,但是我们对软件价值链如何变化有一些想法,并且开始看到了新模式出现的早期迹象。”
在应用层,Index认为,随着时间的推移,商业模式将转变为通过AI来解锁更多针对客户的价值。用户不再简单地为使用SaaS付费,而是根据产品内的定制或个性化程度付费,例如针对行业、组织甚至个人进行微调的模型。
基于此,Index投资了Gong、DeepScribe等公司。
2020年,Index投资了Gong,他们的产品可以记录销售电话,并允许公司管理者来以此分析业绩,发现客户反馈的趋势,帮助培训和指导销售代表。当一个组织广泛采用该产品时,Gong就会沉淀他们与客户对话产生的大量数据集。这反过来帮助Gong更好地定制产品,以高度个性化的方式服务于特定企业,从而改善用户体验。
2022年,Index领导了DeepScribe的A轮融资。DeepScribe的产品可以记录医患对话,并使用AI为电子健康记录生成结构化的医生报告。通过持续使用可以增加产品对特定用户(例如,具有特定风格的医生)或一组用户(例如,特定专业的医生或遵循一致标准的特定医院集团内的医生)的价值。
在这两种情况下,随着产品被持续使用,用户将更多自己的数据放入产品中,AI也能够以高度定制化的方式进行改进。
Index认为,这是AI原生(AI-native)公司建立护城河并随着时间推移而持续获得增长价值的一条途径。
除此之外,Index投资了Hebbia,该产品可以用AI快速准确地为金融服务行业提供信息。Index还投资了Notion,这是一家拥有强大工作流和用户体验的公司,该公司目前致力将AI无缝融入到用户使用中。
Price-Wright说:“当我谈论AI是令人兴奋的,因为它是一种新的促成技术(Enabling technology)。AI无处不在,并正成为每一款软件的心脏起搏器。”