您当前的位置:首页 > 电脑百科 > 人工智能

大模型111人:谷歌和OpenAI的人才战争

时间:2023-04-18 10:48:57  来源:量子位  作者:

衡宇 发自 凹非寺

量子位 | 公众号 QbitAI

当我们围观ChatGPT炸开的多场激战时,还有什么是暗流下激战的?

今天要关注的,不是违背“非盈利”初心的OpenAI,也不是商业模式面临颠覆的谷歌搜索。 把目光从公司层面挪开,看向另一场已经白热化的战争——

借着的ChatGPT燎原之势,2月中旬同一天的30分钟内,就有2位谷歌大脑大模型人才先后官宣入职OpenAI,其中之一Jason Wei是思维链 (chain-of-thought,CoT)的最早一作。

大模型交锋背后,谷歌和OpenAI的 人才战争打得正酣。和动辄上亿美元的投融资同样重要,AI人才也是兵家必争的财富。

但其实,AI人才流动、被抢夺,早开始在ChatGPT搅动漩涡之前。

GPT系列:8人联创新公司,成谷歌对战ChatGPT一步棋

势如破竹的ChatGPT,积攒了OpenAI 从GPT一路迭代至InstructGPT的技术经验与实力。

ChatGPT基于OpenAI的 GPT-3.5创造。2018年和2019年,OpenAI分别推出了1.17亿参数的GPT-1和15亿参数的GPT-2;2020年,大力出奇迹的GPT-3问世,训练参数达到1750亿,涌现出一些人脑独特的能力,引起轰动;而后又在2022年初推出全新的InstructGPT模型,只要13亿参数,效果就比GPT-3更好。

《纽约时报》披露,原本下一代GPT-4在OpenAI内部几乎准备就绪,只待发布;去年11月中旬,高层突然宣布新任务:两周后发布免费聊天机器人应用,代号 “Chat with GPT3.5”,这就是今天见到的ChatGPT。

51位作者,其中2人参与3次论文创作

GPT系列共发表了 4篇论文, 51位作者参与其中。

作者名单中出现最频繁的是Alec Radford和Ilya Sutskever两位,均参与GPT-1到3的论文创作。前者是OpenAI的ML研究员,也是indico.io的联创,谷歌学术上他被引用最多的研究是DC-GAN;后者更为人所熟知,OpenAI联创之一,也是OpenAI首席科学家,主导了GPT系列以及DALLE系列模型的研发。

另有5人在GPT系列论文中 2次贡献了自己的力量:

51人组成的人才图鉴,学历一栏中名校印记俯拾皆是。据不完全统计,出现 频次最多的是MIT和斯坦福大学,曾在耶鲁大学、UC伯克利、哈佛大学、牛津大学攻读学位的人也不在少数。也不乏在这些名校中辗转求学的人,譬如表格中提到的OpenAI前研究副总裁Dario Amodei,先后就读于普林斯顿大学和斯坦福大学;再比如InstructGPT背后论文共同作者之一Gretchen Krueger,MIT、哈佛大学、哥伦比亚大学都是他的母校。

出走团队打造ChatGPT竞品对话式AI

毫无疑问,GPT系列背后的51人引领了大语言模型的创新风潮。从GPT系列结束战斗后,不少人从OpenAI脱离。除开GPT-3共同作者、哥大博士在读的Melanie Subbiah本就不属于OpenAI,50人里共有 16位人才从OpenAI流失

其中8位的最终流向是 AI初创公司Anthropic。更准确地说,包括Dario Amodei、GPT-3论文一作Tom B. Brown在内的一批核心人才不满OpenAI成为微软附庸——因被注资,OpenAI要使用Azure超算来搞研究,要将技术授权给微软,甚至要给微软的投资活动筹集资金,这与OpenAI创立的初衷 (关注高级AI安全)相悖。

最终,包括8位GPT系列作者在内,共11名OpenAI前员工怒而离职, 于2021年创办Anthropic,要搞能控制、可解释的AI,重心放在生成式AI上。

△ 出走创办Anthropic的GPT系作者

1月底,Anthropic开始内测聊天机器人 Cladue。同为生成式对话AI,与ChatGPT的同台竞赛不可避免,二者各有千秋,最终测评结果:Claude在12项任务 中 有8项更强。

关于Anthropic的最新消息让这家“复仇者联盟”愈发走到人们熟悉台前。月初, 谷歌向它投资3亿多美元(约合人民币20.3亿元),拿下后者约10%的股份。交易条款要求,Anthropic需要从谷歌云计算部门购买计算资源。这恰好与3年前,OpenAI接受微软高达10亿美元的注资,将微软定位独家云提供商所呼应。

换句话说,Dario Amodei带着Anthropic走上了3年前所不齿的OpenAI的老路,接受金主爸爸提供的算力来进行技术开发。现如今, Anthropic最新估值50亿美元,除谷歌外,已有的投资人包括Facebook联创Dustin Moskovitz,谷歌前CEO、现技术顾问Eric Schmidt等人。

也曾有人转投谷歌门下

OpenAI GPT系作出走16人,Anthropic是他们的主要流向,剩下8人中, 有3位第一时间投入谷歌门下

其一是GPT-1的三作Tim Salimans,2018年7月他就履新谷歌大脑,base阿姆斯特丹,担任职位为高级管理科学家;其二是GPT-2的四作David Luan,2020年9月起他加入谷歌任主管,工作1年多后离职,后来和Transformer论文作者Ashish Vaswani、Niki Parmar一起,创办了一家叫Adept的公司,目标是创造让人和计算机能够协同工作的通用人工智能;第三位叫a,在2021年3月加入谷歌大脑。

时至今日,Adept和Anthropic两家AI公司的声量比不上风头正盛的OpenAI和其强劲对手DeepMind,不过各自在AI产业界颇有建树,甚至拿出Claude这种可与ChatGPT一较高下的产品。从这两家公司的今日成就不难侧面看出,GPT系作者是的确不是等闲之辈。

LaMDA:1/4成员只有本科学历

梳理完GPT系论文作者现状,镜头转向谷歌的LaMDA论文背后团队,作者共 60名。和GPT系作者团一样,LaMDA作者团队同样不乏耀眼的名校背景,斯坦福校友最多,统共有6人;其次是哥伦比亚大学,有三人曾在哥大就读;接着是浙江大学、比拉科技学院、杜克大学、上海交通大学、耶鲁大学、台湾大学,这6所大学出现了2次。

不过有一说一,相比较而言,LaMDA团队的 名校光环更少,成员的学校背景中常出现阿比林基督教大学、伊比利亚美洲大学、哈丁西蒙斯大学等类似的非顶尖名校。

15位作者只有本科学历,多数人出身计算机专业

还有三个特点在LaMDA作者履历中显现。

第一,至少有17人在某个求学阶段 主修学科为计算机工程/科学,计算机学科背景贯穿求学始终的人也不在少数,像Hongrae Lee,先是在首尔国立大学拿下计算机科学本硕学历后,又赴往哥伦比亚大学攻读计算机科学博士学位。

第二,据不完全统计, 至少有15位LaMDA论文作者只拥有本科学历,这些人中有一半就读的专业是计算机工程/科学。

第三,有 7位LaMDA论文作者在谷歌工作了10年以上,资历最老的是Igor Krivokon,截至今年2月,他在谷歌的工作年限为19年又5个月;Will Rusch也在谷歌工作了19年,从美国南加州大学电气工程系毕业后,他就成为了谷歌的一份子,直到今天。

Igor Krivokon

上文提到,有5%的GPT系作者跑到了对家谷歌干活,相比之下,LaMDA论文作者,没有一位跳槽到对家OpenAI,很稳。那么,究竟是什么样的公司,能够得到出走的LaMDA论文作者的法眼?

答案是两家AI初创公司,一家是Inflection AI,另一家是Character.AI。

出走后,成AI初创公司Inflection AI&Character.AI创始团队

先来聊聊 Inflection AI,这家机器学习初创公司是LaMDA作者中的Joe Fenton,和从OpenAI出来的Rewon Child (3位投奔谷歌的出走成员之一)共同创立,创始团队中还有LinkedIn联创Reid Hoffman和DeepMind创始成员、谷歌人工智能产品与政策副总裁Mustafa Suleyman,阵容十分豪华。LaMDA论文作者,曾担任谷歌研究工程师的Maarten Bosma在公司成立后也被挖走,现为Inflection AI技术人员。

据了解,这家公司的总体目标是利用人工智能帮助人类与计算机“对话”。去年5月,Inflection AI获得了2.25亿美元的A轮融资,资金来源尚不清楚, 公司估值超过12亿美金

以及,现有5名LaMDA论文作者进入 Character.AI就职。

Character.AI的创始人Noam Shazeer是谷歌前首席软件工程师,不仅参与了LaMDA的研究,还是Transformer论文作者之一。杜克大学本科毕业后,2000年年底,Noam Shazeer加入谷歌,是谷歌最重要的早期员工之一。虽然中途一度离职,但截至他2021年10月离职创办新公司,共在谷歌工作了17年又5个月。Character.AI的 现任总裁也是LaMDA论文作者,Daniel De Freitas,加入谷歌前,他曾在微软Bing做软件工程师。

实际上,LamDA论文发表时,Noam Shazeer和Daniel De Freitas都已经从谷歌离职,开始筹备Character.AI了。据报道,Character AI已经创建了 一个基于LaMDA的神经语言模型聊天机器人Web应用程序,能够生成类似人类的文本响应并参与上下文对话。

额外提一点,除LaMDA背后作者外,谷歌的大模型人才近期流动也都比较频繁。先不用说BERT模型四位作者之一,被称为BERT之父的 Jacob Devlin今年1月刚刚离开谷歌加入OpenAI,看看去年ChatGPT发布页面的致谢名单里,就有Barret Zoph等5个人,都是谷歌前员工,他们在ChatGPT问世前加入OpenAI,在调整和准备ChatGPT中发挥了关键作用。此外,The Information消息披露,进入今年1月,又有 至少4名谷歌大脑成员加入OpenAI。

危急存亡之秋,谷歌嗅到了人才流失的危险,相继推出了一系列举措。除却重金投资OpenAI出走团队打造的Anthropic外,其旗下专注语言大模型领域的 “蓝移团队”(Blueshift Team)宣布,正式加入DeepMind,旨在共同提升LLM能力——先进行阵列自行调整,集中内部力量,迎接OpenAI炮火。

人才大战里的华人面孔

今年年初,大模型人才的跳槽愈发频繁。从谷歌加入OpenAI的谷歌大脑4人之一中,包括华人 顾世翔(Shane Gu),谷歌大脑日本团队前成员,剑桥大学博士,本科在多伦多大学师从三巨头之一Hinton。去年5月,只要加上一句 “让我们一步一步地思考”就能让GPT-3做数学题的准确率暴涨61%这事,就是顾世翔参与的研究发现。

像他这样,在谷歌和OpenAI的人才争夺大战中出现的华人面孔还有多少?据不完全统计, 共有16人,LaMDA论文作者里就有14人,占87.5%,也就是说华人面孔占据了大模型111人中的14.4%。

这里要着重提2个人。一位是美籍华人 Ed Chi,1973年出生,现为谷歌杰出科学家,早年以应用资讯气味理论预测网站可用性而闻名。

从美国明尼苏达大学双城分校取得硕士学位后,Ed Chi于1997年至2011年期间,在帕洛阿尔托研究中心 (PARC)担任研究科学家。2011年,Ed Chi以高级研究科学家的身份从PARC离职,成为谷歌的一名研究科学家。2012年,他担任任人机交互领域最负盛名的学术会议CHI的技术项目联合主席。2017年,Ed Chi被提升为谷歌首席科学家。

另一位要提到的是 欧阳龙(Long Ouyang),他参与了与ChatGPT相关的7大技术项目中的4项研究,包括InstructGPT、webGPT、RLHF和ChatGPT,是InstructGPT论文的一作,RLHF论文的第二作者。

革命性科技浪潮背后,人才频繁流动

梳理后不难看到,谷歌和OpenAI虽为大模型重镇,但 人才流动其实是很寻常的事。仅仅在本文涉及的人员里,GPT-2论文四作和Transformer论文一作和共同创办的Adept,不到半年就亮出了新公司的首个大模型ACT-1;Anthropic更是凭借对话机器人Cluade成为谷歌和OpenAI大战中的一把利刃。

△ 大模型人才从OpenAI和谷歌出走后,创立的AI初创公司

总体而言,爆炸性的ChatGPT让大模型背后的人才更加收到世人关注,对这些人来说,ChatGPT带来的风口也是他们必须迎头面对的挑战。

由此提出一个思考:做类ChatGPT产品, 中国的优势在哪里?

很大程度上,构筑大模型堆参数、堆数据的大力出奇迹之道,其实是中国团队向来擅长的事情。但不可否认,小公司负担不起高昂的天价成本,大公司需要综合考虑整体战略,种种因素,从不同角度成为一个中国版ChatGPT诞生的外在桎梏。

如此一来,破除外在束缚需用巧力。在算法、数据等都存在差距的现实条件下, 人才,或许能成为这场轰轰烈烈全球擂台赛里的破局点。大模型背后的每一个参与者和理念、数据、技术拥有同等的重要价值。中国不缺人,更不缺人才,从GPT系论文和LaMDA论文背后的华人作者数量更可以看到AI人才的实力,人才的聚集能形成人才规模核心竞争力。

The battle of AGI never ends!埋头研究,伸手抢人的现象,已经在国内出现。想招人的,想找工作的,都可以开始准备了。



Tags:大模型   点击:()  评论:()
声明:本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,不构成投资建议。投资者据此操作,风险自担。如有任何标注错误或版权侵犯请与我们联系,我们将及时更正、删除。
▌相关推荐
华为笔记本将接入盘古大模型!全新华为MateBook X Pro即将发布
快科技4月10日消息,华为官方宣布,华为将于4月11日举办新品发布会。据了解,此次发布会将推出全新的华为MateBook X Pro,而预热海报的主题是“轻且强”。这里的“强”不仅仅是指性...【详细内容】
2024-04-10  Search: 大模型  点击:(4)  评论:(0)  加入收藏
行业大模型快速落地的一年,如何做?
生成式AI正成为时下科技企业“讲故事”的关键词之一。但从发展上看,无论是“文生文”的大语言模型,还是“文生图”的多模态模型,更多的是辅助人们进行一些简单的办公,或者提供一...【详细内容】
2024-04-10  Search: 大模型  点击:(3)  评论:(0)  加入收藏
AI是万灵药?Meta要把大模型塞进AR眼镜里
寻找下一块“屏幕”,这无疑是最近几年科技行业的一个热门赛道。随着个人计算机点燃了互联网,智能手机让移动互联网无处不在之后,这前后两次造富神话的出现,也让所有人都在期待下...【详细内容】
2024-04-09  Search: 大模型  点击:(6)  评论:(0)  加入收藏
AI程序员上岗 垂类大模型应用迎来井喷期
能自动写代码的“AI员工”、逐渐告别不够好用的智能客服,无需费时费力开发的工业AI控制器……随着人工智能大模型能力开始深入多个行业,IT、工业生产、金融、服务...【详细内容】
2024-04-07  Search: 大模型  点击:(4)  评论:(0)  加入收藏
AI干掉声优?音频大模型追逐“图灵时刻”
七十年前,“人工智能之父”图灵提出,如果人无法判断屏幕的另一侧究竟是人还是机器,就证明机器具备了人一样的智能。这一经典的图灵测试如同北斗星一般,指引着AI行业的工作者们不...【详细内容】
2024-04-03  Search: 大模型  点击:(6)  评论:(0)  加入收藏
大模型Kimi火了,长文本“卷”出新高度
近日,AI智能助手Kimi宣布支持200万字无损上下文,在长上下文窗口技术上再次取得突破,引燃人工智能领域新一轮投资热情。  摄影/宁颖OpenAI官方去年11月发布的GPT-4 Turbo,支持1...【详细内容】
2024-03-29  Search: 大模型  点击:(13)  评论:(0)  加入收藏
大模型应用的 10 种架构模式
作者 | 曹洪伟在塑造新领域的过程中,我们往往依赖于一些经过实践验证的策略、方法和模式。这种观念对于软件工程领域的专业人士来说,已经司空见惯,设计模式已成为程序员们的重...【详细内容】
2024-03-27  Search: 大模型  点击:(13)  评论:(0)  加入收藏
超长文本是AI大模型的能力突破口吗?
◎记者 刘怡鹤近日,能“一口气读完20万字小说”的AI大模型应用Kimi再次为国内AI产业添了一把火。业内认为,国产大模型能力提升或成今年国内AI领域最核心的主线。超长上下文是...【详细内容】
2024-03-26  Search: 大模型  点击:(8)  评论:(0)  加入收藏
百度AI“咬”了一口苹果 大模型商用有戏了?
百度3月25日突传利好。据知情人士透露,百度将为苹果今年发布的iPhone16、Mac系统和ios18提供AI功能。消息人士称,苹果曾与阿里以及另外一家国产大模型公司进行过洽谈,最后确定...【详细内容】
2024-03-26  Search: 大模型  点击:(19)  评论:(0)  加入收藏
Kimi引燃大模型“长文本竞赛”,阿里360百度急出手
从ChapGPT到Sora,从数千亿参数到千万长文本,大模型浪潮下,永远不缺热点。近日,“Kimi概念股暴涨”“Kimi为宕机道歉”等词条先后冲上微博热搜,让月之暗面这家刚成立一年的人工智...【详细内容】
2024-03-25  Search: 大模型  点击:(15)  评论:(0)  加入收藏
▌简易百科推荐
行业大模型快速落地的一年,如何做?
生成式AI正成为时下科技企业“讲故事”的关键词之一。但从发展上看,无论是“文生文”的大语言模型,还是“文生图”的多模态模型,更多的是辅助人们进行一些简单的办公,或者提供一...【详细内容】
2024-04-10    钛媒体APP  Tags:行业大模型   点击:(3)  评论:(0)  加入收藏
互联网充斥“针对小白的AI课”,能相信吗?普通人不学AI课程会被淘汰?
早前,一位标榜清华大学博士和多家公司AI顾问名头的百万级粉丝量博主,向用户大力推介“所有人都需要学”的AI入门课程。不过,这些课程最终因贩卖焦虑、蒙骗学员而被平台下架。然...【详细内容】
2024-04-10    九派新闻  Tags:AI课   点击:(7)  评论:(0)  加入收藏
藏在AI背后的“吃电狂魔”
人工智能时代的能耗黑洞据估算,到2027年,人工智能行业每年将消耗85~134太瓦时的电力,相当于瑞典或荷兰一年的总用电量。马斯克判断,电力缺口最早可能会在2025年发生,“明年你会看...【详细内容】
2024-04-09    雪豹财经社  Tags:AI   点击:(3)  评论:(0)  加入收藏
OpenAI和谷歌再起纷争:AI的尽头是内容
日前,纽约时报的一篇报道称,人工智能公司 OpenAI为收集高质量训练数据而开发了一个语音转录模型Whisper。该模型主要用于转录 OpenAI 获取的超过 100 万小时的 YouTube 视频,也...【详细内容】
2024-04-09  小编也疯狂  新浪网  Tags:AI   点击:(3)  评论:(0)  加入收藏
AI产业的灰色暗面:OpenAI、谷歌、META如何搞训练语料
财联社4月7日讯(编辑 史正丞)种种迹象显示,目前站在全世界AI领域潮头浪尖的这些公司,早在几年前就已经陷入对训练语料的“绝望”追逐中——为此他们不惜修改政策条款...【详细内容】
2024-04-09    财联社  Tags:AI产业   点击:(4)  评论:(0)  加入收藏
和“数字人”交朋友,当心隐私被出卖......
在虚拟社交中如何在保护用户隐私和数据安全的同时提供高质量的社交体验?如何避免过度依赖虚拟社交找到虚拟与真实之间的平衡点?《中国消费者报》记者就此展开了调查APP里有个...【详细内容】
2024-04-09    中国消费者报  Tags:数字人   点击:(6)  评论:(0)  加入收藏
AI“复活”成产业链:成本可降至数百元
大模型应用落地,带火数字人(11.560, 0.29, 2.57%)赛道。文|《中国企业家》记者李艳艳 实习生 孙欣编辑|姚赟头图来源|《流浪地球2》电影画面截图清明节前,预估会有需求的庞立...【详细内容】
2024-04-09    中国企业家  Tags:AI“复活”   点击:(3)  评论:(0)  加入收藏
多方热议人工智能产业新机遇
编者按  从前沿科技展会到高层对话平台,从上海、重庆到博鳌,从线上到线下……一场场高规格、大规模的盛会中,人工智能正在成为各界热议的高频词。赋能千...【详细内容】
2024-04-08    中国家电网  Tags:人工智能   点击:(5)  评论:(0)  加入收藏
​人形机器人时代来了吗
日前,由中国人形机器人(11.080, -0.05, -0.45%)百人会主办的人形机器人大赛在北京经济技术开发区开赛。工作人员向参观者展示一款人形机器人。参观者与一款陪护型人形机器人...【详细内容】
2024-04-08    中国青年报  Tags:​人形机器人   点击:(6)  评论:(0)  加入收藏
AI重塑社交:腾讯与字节跳动的新赛场
文|新火种 一号编辑|美美最近,腾讯和字节跳动这两大互联网巨头几乎同步推出了各自的AI社交产品,尽管腾讯和字节跳动在前段时间刚刚“破冰”,但这一举措不仅意味着这两大巨头之...【详细内容】
2024-04-07    蓝鲸财经  Tags:AI   点击:(8)  评论:(0)  加入收藏
站内最新
站内热门
站内头条