2016 年,google CEO 桑达尔·皮查伊在 I/O 开发者大会上豪情满怀地向全世界宣布:
凭借在深度学习、自然语言处理等领域的深耕不辍,Google 也的确在这场 AI 竞赛的起跑线上抢得先机。然而,ChatGPT 的异军突起,让拉响“红色警报”的 Google 直接从和平时期转向了战时准备状态。
很多人乐观地预测,一夜消融的 AI 高山——Google,最晚到了来年冬天定能恢复昔日的巍峨,但迟来上演的却更多是少年屠龙的故事。
OpenAI “踩着” Google 过河
如果说 Google 在摸着 AI 的石头过河,那么 OpenAI 在“踩着” Google 过河。
在近期的 Google Cloud Next 活动中,Google 宣布最强大模型 Gemini 1.5 Pro 正式对外开放,其支持处理的最长音频约为 11 个小时,最长视频为 1 小时,让一众看客们都沸腾了起来。
有网友给 Gemini 1.5 Pro 上传了一个有史以来最具标志性的体育时刻合集,并让它识别视频中的运动,参与的团队/运动员、年份等,它都能给你安排得明明白白。
当人们还在沉浸在“把玩”Gemini 1.5 Pro 时,针尖对麦芒的 OpenAI 宣布推出 GPT-4 Turbo 的正式版本,不仅基础能力大更新,还自带读图功能,现在更是已经向所有 ChatGPT 付费用户开放。
一时间,本该是 Google 大杀器的 Gemini 1.5 Pro 又成了“明日黄花”,给人一种汪峰入职 Google 的感觉。
为什么说又呢?分不清有意还是无意,但这已经不是 OpenAI 第一次卡点狙击 Google 的新品了。
今年 2 月,Google 推出攒了许久的终极 AI 大招——Gemini 1.5 Pro,其支持高达 1M 上下文,相比之下,GPT-4 Turbo 也仅支持 128K 上下文。
这一炸裂性的头条新闻同样维持不到几个小时。因为牌桌上的 OpenAI 不需要考虑出牌节奏,随手一掏,便是 AI 视频生成领域中的王炸——Sora。
长达一分钟的视频生成、多镜头的实时转换、出色稳定的画面生成以及世界模型理解能力等特点吸引了全世界的目光,也将 Gemini 1.5 Pro 溅起的水花狠狠地压了下去。
纵观以往 OpenAI 产品的发布节奏,我们可以发现,强大的议程设置能力无疑是绕不开的关键词。每一次重大产品的推出,OpenAI 都恰如其分地抓住了市场的风向标。
此前有消息称,当 Anthropic 还在权衡 Claude 的安全性问题时,OpenAI 已经果断靠 ChatGPT 抢占市场先发优势。而在 Anthropic 拿到亚马逊高达 40 亿美元的融资后,OpenAI 再次发力语音和图像功能,用会看、听、说的 ChatGPT 反手给了 Anthropic 一巴掌。
这一切的背后,或许也与 OpenAI 创始人 Sam Altman 的影响密不可分。早在 YC 担任掌门人的时候,他就展现出对媒体影响力的深刻理解和运用。
根据 The Information 创始人 Jessica Lessin 的回忆,Altman 尤其擅长与媒体记者打交道,并用精湛的沟通技巧赢得记者的信任。即便是在 OpenAI 的宫斗大戏期间,他也能够通过几条推文掌控舆论的走向,其影响力堪比网红界的马斯克。
而成为这种带有 Altman 特色策略的牺牲品,Google 无疑是最不走运的那一个。为什么说这两次头条非常重要呢?这得从 Google 被 OpenAI 一直“压着打”的历史讲起。
回首这两年,在 OpenAI 的光环之下,Google 的 AI 征途显得有些命运多舛。
2022 年底,ChatGPT 一夜之间照亮了整个 AI 界,起了个大早的 Google 却一筹莫展,皮查伊看着自己 AI 领域的“满朝文武”,恨不得要天天上演一场康熙怒斥群臣的戏码。
让月活破亿的 ChatGPT“嚣张跋扈”许久之后,去年 2 月,Google 仓促发起反攻,但依旧出师不利。搞混太阳系外行星第一张照片作者的 Bard 让看完发布会的观众直呼退钱,也让 Google 瞬间蒸发约 2.75 个京东的市值。
倘若 GPT-3.5 还能让 Google 看到一丝追赶的希望,那么 GPT-4 则直接断崖式压制了同行整整一年。
胜在这些年积累的技术底蕴,大船调转,All In AI 的 Google 在合并 Google Brain 和 Google Deepmind 之后,还真捣鼓出 Bard“改头换脸”版的 Gemini 1.0 模型。
其中超大杯 Gemini Ultra 号称全面碾压 GPT-4 ,但发布仅仅一天后,就被扒出刷爆全球互联网的演示视频存在造假,以至于 Google 自家员工反手就来个内鬼自爆,“这是不切实际的画面”。
直到 Gemini 1.5 Pro 的出现,无论是 MoE 架构的技术思路,还是实际的亲身体验,在一众网友的好评声中,其仿佛用能与 GPT-4 “掰手腕”的实力宣告 AI 最高的山又要回来了。
此外,1M 上下文处理能力当时更是碾压同辈。Gemini 1.5 Pro 既能瞬间掌握一门只有 200 人使用的冷门语言,也能一口气看懂一部 44 分钟的巴斯特·基顿的默片。
两次“头条”的失利,也让 Google 仿佛化身大闹天宫的孙悟空,尽管蹦跶得再欢,终究也翻不出佛祖 OpenAI 的手掌心。
值得一提的是,在主流产品上,两家公司对标得也比较全面。甭管实际效用如何,主打的就是一个你有我也得有。
你有 ChatGPT,我有 Bard(Gemini)
你有 DALL·E 3,我们有 Imagen 2
你有 Sora,我有 PPT 上的 Video poet,甚至 Imagen 2 也能文生视频
就连 Google 的老本行——搜索领域,OpenAI 不光想取而代之,而且野心也更宏大。
前不久,Altman 在接受 Lex fridman 的专访时指出,世界不需要多出一个翻版 Google。
他在采访中的言外之意是,OpenAI 要像 Perplexity 一样,用 LLM+搜索重新定义搜索引擎的概念,并且还要寻找到一种不依赖广告的盈利方式。
最了解你的往往是你的敌人
近一年来,手握 ChatGPT、Sora 等先进 AI 工具的 OpenAI 成了整个 AI 行业的最强参照物。
从全球“千模大战”的大模型厂商中,随便拎几个大模型出来,什么“逼近 GPT-4”,什么“全面对标 GPT-4”之类词汇,都能引得众人哄笑起来,让整个 AI 圈充满了快活的空气。
英伟达高级科学家 Jim Fan 近日在社交平台 X 上称:“软件 AI 代理的核心优势并非其薄薄的包装层(例如 Devin, SWE-Agent),而是底层的 LLM。”
上到基准测试榜单,下到网友好评,短时间内能站稳脚跟、引领风骚的,基本就四大巨头——OpenAI、Anthropic、Google 以及 Meta。
AI 的发展绕不开三大要素:算力、算法、数据。对比 Anthropic ,有钱有人有资源的 Meta、以及 Google 显然更值得盯防。同时相较于 Meta,Google 与 OpenAI 之间的渊源其实也比想象中更深。
最了解你的人往往不是朋友,而是你的对手。
古龙在武侠小说《七种武器》中如是说道,这句话同样适用于 OpenAI 与 Google 之间的关系。
2017 年春天,一篇名为“Attention Is All You Need”的学术论文,加速了生成式 AI 浪潮的到来。在 GTC 2024 期间,论文作者与黄仁勋的对谈也成为了整个 AI 界的话题焦点。
鲜少有人知道的是,八位作者实则都有一个身份——Google 的研究员。但 Transformer 架构的问世并未激起 Google的足够重视,正如 Altman 所说:
当 Transformer 论文发表时,我想 Google 的任何人都没有意识到这意味着什么。
论文发表后不久,在时任 OpenAI 首席研究员 Ilya Sutskever 的推进下,OpenAI 成功分到生成式 AI 的第一杯羹。
如今,论文的 8 位作者都相继离开了 Google,核心作者之一 Kaiser 也加入了 OpenAI,并且还是名为“Q*”的新技术的发明者之一。这样的情况也发生在 Sora 身上,其背后的时空 Patch 技术同样被曝出是站在 Google Deepmind 的肩膀之上。
2024 年,没有哪一家科技公司愿意在 AI 赛道掉队。火药味变重的 OpenAI 与 Google 之间的拉扯较量便是这股趋势的小小侧写。
据 The Information 爆料,Google 联合创始人谢尔盖·布林亲自下场,打电话挽留即将转投 OpenAI 的员工。而 OpenAI 从 Google 挖人时,给出的承诺年薪将在 500 万美元至 1000 万美元之间。
此外,消息人士还透露,Google Deepmind 的负责人 Hassabis 就曾抱怨 Google 的薪酬政策使他难以阻止研究人员跳槽到 OpenAI。
当然,Google 也并非被动挨打,前 OpenAI 前开发者关系负责人 Logan Kilpatrick 近期便成功入职 Google。在 Gemini 1.5 Pro 正式发布时,Kilpatrick 也没少转发推文为其站台造势。
从融资背景上说,OpenAI 与 Google 的较量其实更像是背后的微软在与 Google 在博弈。
放眼国外市面上的主流大模型,似乎都难逃被科技巨头收编的命运。
苹果这一年来,就没少买买买。亚马逊也不甘落后,选择大规模入资 Anthropic,而手握 OpenAI、Mistral AI、Inflection AI 等创企的微软则暂时在这些巨头较量中处于上风。
微软与 Google 这两位在搜索时代的恩怨情仇,也绵延至今日 AI 时代的较量。
在那个以搜索为王的年代,Google 以其卓越的算法和用户体验,稳坐搜索引擎的霸主宝座,而微软的必应,却始终难以撼动 Google 的统治地位。
根据 StatCounter 公布的数据,截至 2023 年 1 月,Google 在全球搜索引擎市场的份额高达 92.9%,而必应仅有 3.03%。这种巨大的市场份额差异,使得必应长期稳居“千年老二”。
只是这一次,当 AI 的曙光乍现,曾经在搜索引擎市场遭受过挫折的微软,似乎找到了扳回一局的希望。