整理 | 朱珂欣
出品 | CSDN程序人生(ID:coder_life)
在 AI 拉锯战上,谷歌的口令一直是:「咱不能输」。
如今,谷歌带着它的“复仇者联盟”,向 OpenAI 全军出击!
据外媒报道,谷歌正在马不停蹄地赶工中,准备在今年秋天发布迄今为止可能是大模型界的阿尔法级别产品:Gemini。
蓄力多时,“复仇者联盟”集结多位干将
毋庸置疑,ChatGPT 珠玉在前,谷歌想要展开正面交锋,得有点绝杀才有说服力。
万众期待之下,几个月来,谷歌一直蓄势待发。
4 月,谷歌将深度学习人工智能研究部门 google Brain 与子公司 DeepMind 合并,成立 Google DeepMind。一切旨在提高效率,将谷歌庞大的计算资源和 DeepMind 的研究技能结合起来。
5 月,在谷歌举行的 I/O 2023 大会上,谷歌就指出,Gemini 目前正在接受训练,一旦经过微调,它就会像 PaLM 2 一样「以不同的规模和能力」面世。
6 月,谷歌的 Gemini 被爆由谷歌最强 AI 团队 Google DeepMind 倾力打造。那时,谷歌就声称:“这个 AI 系统将谷歌背后的技术与大型语言模型相结合。该系统具有新的功能,例如规划或解决问题,比 OpenAI 的 GPT-4 更强大”。
随后的日子,谷歌将数百位工程师的集结于此,只为在今年秋天用 Gemini 扳回一局。
据 The Information 报道,为了应战,谷歌联合创始人 Sergey Brin 甚至亲自参与 Gemini 项目开发,并对模型进行评估。
从“复仇者联盟”版图来看,由 Google Brain 和 DeepMind 公司的前主管共同管理监督 Gemini 的大部分小组。目前,已曝光的名单中,至少有 26 名技术大拿正参与开发。
此外,Gemini 将团队划分为约 10 个小组,分别负责预训练、数据、基础设施、模型微调、模型评估、代码库、多模态、强化学习、工具使用以及人工标注数据。
杀手锏来袭:文本能力+文生图能力
众所周知,两个月前,谷歌 DeepMind 首席执行官 Demis Hassabis 放下狠话:Gemini 将成为能「媲美」 ChatGPT 的聊天机器人!
如今,需要划重点的来了。
据知情人士透露,谷歌意图将 Gemini 模型打造成一款「文本生成功能」与「文生图功能」相结合的多模态产品。
简单来说,除了像 GPT-4 大型语言模型一样理解并生成对话文本,还能像 Midjourney 一样生成图像。
此外,还提及了 Gemini 的一些其他功能,例如如分析图表、创建带有文字描述的图形,甚至使用文字或语音指令控制软件。
YouTube 视频数据库的「锦上添花」
值得一提的是,Gemini 坐拥强大能力的背后,离不开庞大的训练数据支撑。
而恰巧谷歌拥有大量的资源,尤其是在可用于训练 AI 模型的数据上,占据绝对优势。
例如,谷歌可以访问 YouTube 视频、Google 图书、庞大的搜索索引以及 Google Scholar 的学术材料。其中,大部分数据都是谷歌「独家」。
据 The Information 早前的报道,谷歌自家的视频平台 YouTube 更是为 Gemini 的训练有素,作出了帮衬。
通过使用 YouTube 视频副本来训练 Gemini,由此将音频与视频集成到 Gemini 中,使其具备多模态能力。
例如,通过 YouTube 视频训练出的模型可以辅助工程师根据视频诊断汽车维修问题、根据用户想创建的网站或应用程序的草图来生成软件代码等。
据 Global Media Insight 估计, YouTube 上至少有 8 亿个视频。
目前,为保证自己在这场 AI 军备竞赛中占据绝对优势,谷歌公司的律师也在持续密切关注 Gemini 使用的训练数据材料,以防侵犯版权。
网友:“ChatGPT 统治的终结?”
若 Gemini 的愿景实现,这款集合了“ ChatGPT + Midjourney/Dall-E + Microsoft 365 Copilot ”的大模型,很有可能将直接带着谷歌逆风翻盘。
这场将在秋日由 Gemini 拉开的正面交锋,也引发了不少业内人士的讨论。
谷歌前高管、风险投资公司 Felicis Ventures 的创始人 Aydin Senkut 极度认可:“这是正确的方向。相信最终,谷歌会成功的!”
彭博社风投分支 Bloomberg Beta 的 AI 初创企业投资人 James Cham 表示:“这将是有模型能与 GPT-4 旗鼓相当的第一个迹象。我认为,在过去的九个月中,也许每个人都在问:什么时候才会有人能赶上 OpenAI?”
除此之外,不少网友也展开了热情讨论:
“Gemini 项目的合并过程并不容易,涉及到两个独立团队的磨合”;
“我还记得 Bard 的‘翻车’事件,希望 Gemini 能改写历史”;
“ChatGPT 统治的终结?”
“Gemini 的成败可能决定谷歌未来能否保持其在 AI 技术领域的领先地位”……
立秋已过,接下来让我们一起期待谷歌的秋季发布会吧。