来源:适道
图片来源:由无界 AI生成
美国硅谷著名投资人,国际知名支付工具PayPal的创始人彼得·蒂尔(Peter Thiel)曾说过:“竞争是留给输家的。如果你想创造和获取持久的价值,那就建立一个垄断企业。”
这句话是对“赢家通吃”(Winner Takes All)的极致表述。“赢家通吃”指一种产品或服务只要比竞争对手好一点点(例如1%),那么在该类别的产品或服务中,你就会获得不成比例的巨大收入(例如90-100%),将竞争对手远远抛在身后。
这个现象在很多行业都有所体现,尤其是科技行业。从全球范围看,IBM 在计算领域占据主导地位数十年;微软主导个人电脑市场;亚马逊至今仍在单枪匹马地统治电子商务领域。很显然,互联网时代的一大特征就是“赢家通吃,败者恒弱”。
搞清楚这个问题很重要,因为这将会改变我们的投资逻辑:如果传统互联网“烧钱补贴——干掉第二名——垄断市场——发挥网络效应”的做法不再行得通,那么经历过“千团大战”时代的投资人,或许也需要一套新的投资方法论。
为了得到答案,适道投研团队参考了几篇外网文章,作者包括A16Z合伙人Benedict Evans、美国光速创投(Lightspeed Venture Partners)合伙人Guru Chahal等人,试图梳理出一些相近或相悖的观点,供大家思考。
会赢家通吃:代表方吴恩达
总体来看,吴恩达 (Andrew Ng) 介绍的人工智能的良性循环模式为“赢家通吃”提供了底层逻辑。
最初,人工智能产品由有限的数据构建。随后,在与用户接触过程中,产品每天会收集越来越多的数据。而机器学习的基础是数据——大量的数据。
更多数据=更精确的模型=更好的产品=更多用户=更多数据
这个良性循环公式被认为是人工智能赢家通吃市场的一个重要因素。大数据和机器学习结合,放大了网络效应和规模回报,再次强化了科技市场领导者的主导地位,意味那些已经很大并且拥有大量数据的公司会变得更强大。
就国内情况来看,数据壁垒也是摆在新兴公司面前的一堵墙。高质量的中文语料数据对创业公司来说是个很大的挑战,而数据的积累则需要时间和经验。对于百度这样常年累月通过搜索等多个互联网、物联网应用积累起数据的公司来说,一开始就领先了至少几个身位。
不会赢家通吃:代表方A16Z
数据至关重要,但关于数据在实际工作中产生的作用,A16Z合伙人,著名分析师Benedict EvansDoes提出了不同的观点。
EvansDoes在文章《AI make strong tech companies stronger?》中指出,虽然机器学习需要大量的数据,但是你使用的数据要非常适合你试图解决的问题。
通用电气有大量来自燃气涡轮机的遥测数据,谷歌有大量搜索数据,美国运通有大量信用卡欺诈数据。但你不能用涡轮机数据来训练模型,去发现欺诈交易,也不能用网络搜索数据训练模型去发现即将失效的燃气涡轮机。
你训练的每一个模型只能做一件事。
这与之前的自动化浪潮非常相似:就像洗衣机只能洗衣服,不能洗碗做饭,象棋程序不能交税一样,机器学习翻译系统也不能识别猫。
你构建的应用程序和你需要的数据集,都与你试图解决的任务强相关。(尽管这是一个不断变化的目标,有研究试图发现如何让机器学习模型,在不同的数据集之间更容易迁移)。
这意味着谷歌会越来越擅长成为谷歌,但不意味着它在其他方面也做得越来越好。
有的行业会,有的行业不会:需要看具体的垂直领域
那么,在垂直领域,头部企业能否凭借遥遥领先的数据优势,抢占全部市场?
EvansDoes认为,情况会变得更加复杂。
比如谁拥有数据,数据有多独特,数据在什么层面上是独一无二的,以及聚合和分析数据的正确位置在哪里。这些问题对于不同的业务部门、不同的行业和不同的用例,答案会有所不同。
我们假设一个场景,如果你正在创建一家公司来用机器学习解决现实世界的问题,那么你会面临两个基本的数据问题:
1、你如何获得第一批数据来训练你的模型去获得第一个客户?
2、你需要多少数据?
第二个问题可以分解成许多问题:
你要用较少且容易获得的数据来解决问题?(但许多竞争对手可以获得) 。
还是你需要更多的、难以获得的数据去解决问题?
如果是这样的话,是否存在一种网络效应可以从中受益?由一个赢家将获得所有的数据?
产品是随着更多的数据无限期地变得更好,还是存在一个S曲线?
这些都要看情况。
有些数据,是企业或产品独有的,或具有很强的专有优势,例如通用公司的涡轮机遥测技术。但这对分析劳斯莱斯的涡轮机,可能也没有多大用处。
而一些数据,可以用于许多公司甚至许多行业中的用例。许多创业公司也由此诞生,来解决许多公司或不同行业的共性问题,并且这里的数据具有网络效应。
但也有这样的情况,即在某个时间点之后,供应商甚至不需要更多的数据了,因为产品已经能够工作了。
EvansDoes认为,这种情况已经在很多创业公司上演。例如, A16Z的投资的公司Everlaw开发了一个法律软件。该软件能够对一百万封电子邮件进行情感分析,就不需要以客户的特定诉讼数据当原料再进行训练了。
更极端的情况是,一家大型车辆制造商正在通过模型训练,开发更精确的爆胎检测器。这是基于大量轮胎的数据训练出来的模型。但很显然,这些数据的获取难度并不高。
也就是说,机器学习的普及并不意味着谷歌变得更强大,而是意味着各种各样的创业公司,能够比以前更快地利用这一前沿技术来构建一个应用,解决一个问题。
未来不会出现更多的“人工智能”创业公司,它们将是工业流程分析公司、法律平台公司或销售优化公司。
EvansDoes将机器学习与SQL(Structured Query Language)进行了类比。
在以前,如果你不使用SQL,你就会落后。例如沃尔玛成功的一大因素,就是使用SQL更有效地管理库存和物流。
但在今天,当你创办了一家零售公司,并说“……我们将使用SQL”,这不会让公司看起来更具价值,因为SQL已经成为了一切的一部分,然后它就在话语体系中消失了。
机器学习的未来也会如此。
“大模型”时代怎么投?至少互联网逻辑确实行不通了
适道投研团队认为,不管会不会“赢家通吃”,至少互联网时代的投资逻辑在人工智能时代不再行得通。
核心逻辑在于,互联网时代,“流量”是免费的,这才有“网络效应”的概念:也就是说,在总的运营成本不变的情况下,用户越多,网络的价值就越大。这就是所谓的“所有行业都适合用互联网思维重做一遍。”
但是,大模型时代不一样的点在于,算力是有成本的。那么每多增加一个用户,是要实打实地付出算力,并不会产生网络效应,这就导致补贴没有任何意义,你的新用户越多,反而越赚不到钱。
另外,目前的大模型存在使用成本高、推理延迟较大、数据泄漏、专业任务上不够准确等问题。与之相比,一些更小型、专业化(调整+精炼)的长尾模型的优点也显现了出来。
因此,即便绝大多数技术都能起到财富聚集的作用,人工智能巨头也确实能聚集大量财富,但因为算力成本,以及不能占有整个市场,财富总量也会变得有限。