您当前的位置:首页 > 新闻资讯 > 科技

GPT-4大杀器谷歌Gemini来袭!26位研发大佬名单曝出,祭出类Midjourney生图能力

时间:2023-08-17 17:41:38  来源:新智元  作者:

新智元报道  

编辑:编辑部

【新智元导读】据The Information爆料,谷歌已集结数百工程师团队,全新大杀器Gemini结合了GPT-4、Midjourney、Stable Diffusion三大模型的能力,即将于今年秋天上线。

谷歌的全新大杀器Gemini,即将和全世界见面了!

据传,Gemini不仅能像GPT-4一样可以进行文本对话,还融合了Midjourney、Stable Diffusion的能力,能够生成图像。

为了对抗AI target=_blank class=infotextkey>OpenAI,谷歌CEO劈柴在今年4月迈出了绝非寻常的一步,将拥有完全不同文化和代码的团队——谷歌大脑和DeepMind合并。

现在,集结了数百位工程师的谷歌复仇者联盟已经全军待命,日夜赶工,只为狙击OpenAI的GPT-4,一举重夺AI领域的头把交椅。

谷歌创始人谢尔盖·布林也已重回战壕,亲自操刀Gemini的训练。

据称,今年秋天,Gemini就会面世,而谷歌的考验也即将到来。

复仇者联盟名单已被曝出

押注Gemini,打造GPT-4最强杀手

根据知情人士的爆料,Gemini将LLM的文本能力与文生图的能力相结合。

也就是说,它相当于GPT-4和Midjourney/Stable Diffusion的合体版。

这也是外界首次听说,Gemini具有如此强大的绘图能力。

另外,它还能够提供分析图表、创建带有文本描述的图形、使用文本或语音命令控制软件。

在6月底,谷歌DeepMind CEO Hassabis也曾爆料,Gemini将结合进AlphaGo和大语言模型,而谷歌DeepMind已经准备好砸进数千万美元,甚至数亿。

可以说,谷歌把重注押在了Gemini身上,Gemini会为Bard聊天机器人提供动力,推动google Docs、Slides等企业级应用。

另外,谷歌还希望通过云服务器租赁服务,向开发者收取访问Gemini的费用。

目前,谷歌云通过Vertex AI产品售卖对谷歌AI模型的访问

如果这些新功能实现,谷歌很有可能会赶上微软。

毕竟,微软在AI产品上已经领先不少,office 365应用中包含AI功能,其应用程序也会对用户出售对ChatGPT的访问权限。

彭博社风投分支Bloomberg Beta的AI初创企业投资人James Cham对彭博社表示,「过去9个月里,每个人都在问这样一个问题:什么时候才能有一家公司,看起来有赶超OpenAI的可能?」

「现在,终于似乎有一个模型,可以和GPT-4旗鼓相当了。」

谷歌,被迫走出舒适区

随着OpenAI的崛起,谷歌也不得不在保证核心搜索业务的情况下,试着推出新的技术了。

据内部人士透露,在推出Gemini之前,谷歌很可能就会在某些产品中使用它。

过去,谷歌会使比较简单的模型来改进搜索,但是像Bard以及Gemini这样的产品,需要通过分析大量图像和文本,来生成更像人类的回答。

如此海量数据所带来的潜在巨额服务器成本,也是谷歌必须要控制的。

更新之后的Bard,更强大了

手握YouTube的优势

根据The Information报道,谷歌对Gemini进行了大量YouTube视频的训练。

并且,Gemini还可以把音频和视频集成到模型自身,形成多模态能力,而后者,已经被许多研究者认为是AI的下一个前沿。

比如,根据YouTube视频训练的模型,可以帮助机械师根据视频诊断汽车的维修问题。

或者可以根据用户想要创建网站或应用程序的草图,来生成软件代码。此前,OpenAI曾展示了GPT-4的这项功能,但目前尚未推出。

OpenAI老板Greg Brockman曾演示GPT-4读图写网页代码的能力,但似乎鸽了

使用YouTube内容,还可以帮助谷歌开发更先进的文本转视频软件,根据用户想看的内容描述,自动生成详细的视频。

这类似于谷歌支持的初创公司RunwayML正在开发的技术,现在好莱坞的内容创作者们都在密切关注这项技术的发展。

Google DeepMind,发起全面反击

2011年,谷歌创立了谷歌大脑(Google Brain),旨在构建起谷歌自己的AI,来优化搜索的结果、广告精准投放,以及在Gmail中的自动填充等功能。

而位于伦敦的DeepMind则更多地致力于学术研究——2016年Alpha Go以4比1的成绩战胜了李世石,这项工作被人们视为通向通用人工智能(AGI)道路上的重要里程碑。

谷歌除了会用DeepMind开发的软件提高数据中心的运行效率外,DeepMind的工作并没有对其核心产品产生太大影响。

但在去年年底,一切都改变了。

2022年11月,OpenAI发布了ChatGPT,短短几周内用户人数飙升到了数千万,之后更是达成了用户破亿最短时间的成就。

几个月内,OpenAI的收入就达到数亿美元,并且在这期间微软新投资了100亿美元、数不清的资本热钱向着OpenA流去,OpenAI的市值、知名度都达到了一个前所未有的高度。

这时,谷歌才意识到,自己在AI领域的领导地位已经岌岌可危了。

谷歌大脑+DeepMind=?

今年4月,陷入被动的谷歌放出终极大招:谷歌大脑和DeepMind正式合并!

「王不见王」的两大部门居然合体了,这一举动也是让瓜众们惊掉了下巴。

合并后的Google DeepMind将由DeepMind首席执行官Demis Hassabis领导,而前谷歌AI负责人Jeff Dean接任首席科学家一职。

现在,至少有26名大佬正在负责Gemini的开发,这些人包括曾在谷歌大脑和DeepMind工作的研究人员。

知情人士称, DeepMind的两位高管Oriol Vinyals和Koray Kavukcuoglu,将和前谷歌大脑负责人Jeff Dean一起负责Gemini的开发。他们将监督数百名参与Gemini开发的员工。

谢尔盖·布林和拉里·佩奇

他一直在对Gemini模型进行评估,并帮助员工训练模型。

据爆料,在团队发现Gemini意外地接受了潜在攻击性内容的训练后,布林也参与到了重新训练模型的技术决策过程中。

「意外联姻」的阵痛

随着谷歌大脑和DeepMind的合并,新团队很快就遇到了非常严峻的问题——代码怎么合并,用谁家的软件开发?

毕竟,这两个部门的代码库在之前是完全独立的。

虽然双方在各让一步之后达成了妥协:

- 在模型的预训练阶段,使用谷歌大脑用于训练机器学习模型的软件Pax

- 在后期阶段,使用DeepMind用于开发模型的软件Core Model Strike

但据内部人士爆料,还是有不少员工因为不得不使用自己不熟悉的软件而愤愤不平。

除此之外,谷歌和DeepMind都针对ChatGPT开发了自己的模型。

DeepMind着手开展了一个代号为Goodall的项目,旨在使用未公开模型Chipmunk的不同变体来开发一个与ChatGPT竞争的系统。而谷歌大脑则开发立项了Gemini。

最终,DeepMind决定放弃自己原先的努力,选择基于谷歌大脑的项目合作开发Gemini。

有趣的是,在远程工作的政策上,据说谷歌大脑的态度也要比DeepMind宽松得多。

内耗、狼狈、反攻

比起OpenAI那边的形势一片大好,谷歌则陷入了一场精疲力尽的内耗中。

先是一连多个高级技术人才出走,如Liam Fedus、Barret Zoph和Luke Metz等在内的研究人员,纷纷选择加入OpenAI。

虽然谷歌找回了一些人才:比如重新招回了Jacob Devlin和Jack Rae。

Jacob Devlin批评Bard的开发后,在今年1月份去了OpenAI。而Jack Rae是前DeepMind的研究员,在2022年加入了OpenAI。

此前,Devlin向劈柴、Dean等高管表达了对Bard团队使用ChatGPT数据训练的担忧,随后辞职

接着,谷歌为了对抗一枝独秀的ChatGPT,也为了重回人工智能赛道领航者的地位,在今年2月的时候匆忙发布了聊天机器人Bard。

然而,发布会却因一个低级的事实性错误惨遭翻车,导致公司的市值在一夜之间蒸发了千亿美元。

谷歌的第一次反攻,以狼狈收尾。

同时发布的,还有将生成式AI和自己传统搜索服务结合起来的Search Generative Experience(SGE)。

简单来说,SGE是一个类似Bing Chat的AI搜索服务,但并没有直接使用新的聊天窗口,而是将AI生成的内容集合在搜索结果中展示给用户。

也就是说,在搜索的同时,谷歌会利用AI为搜索的内容提供说明,回答用户提出的问题,帮用户做旅行规划等等。

而用户不再需要货比三家般的在多个链接之间来回跳转,也不用花心力去判断哪个链接背后的信息是真的,因为所有可用的内容都被集中到了AI收集到的回复之中。

在最近的更新中,谷歌添加了让SGE在AI生成的回复内容中附加图片和视频的功能,帮助用户更加直观的了解自己搜索的知识和信息。

就像Bing Chat一样,SGE的AI响应中也会有标注了发布时间的链接,来支持由AI生成的回复内容。如果用户对于相关的信息感兴趣,点击链接就能更加全面地了解具体的内容。

在AI生成的回复中,对于很多知识性的信息和概念,用户能够直接通过鼠标的悬停,就能获取到概念准确的定义。

现在针对科学,历史,经济等知识性问题的AI回复,都已经上线这个功能。

而对于需要浏览很冗长的网页信息来学习或者了解信息的用户,SGE还更新了一个网页内的AI概括功能——SGE while browsing。

这个功能相当于给用户提供了一个随时听候差遣的「大纲生成器」。对于任何篇幅比较长的网页内容,用户都可以用它来生成大纲,快速掌握要点。

在下方的Explore the Page部分,用户还能看到和页面内容相关的问题。如果用户对于问题感兴趣,直接点击,就能看到文章中内容是如何解答这些问题的。

然而,是由于谷歌保守的市场策略,SEG目前只允许美国本土的用户采用Waiting List申请测试。

所以可能大部分用户甚至都不知道,谷歌已经推出了这样一个服务。

总之,据悉两部门合体后,至少测试了21项生成式AI工具,甚至还包含为用户提供生活建议和心理辅导的工具。

在去年紧急解雇了声称聊天AI有意识的工程师的谷歌,现在居然也开始探索这类「敏感」地带,可见真的是决定放手一搏了。

Gemini项目,目前形势大好

不过,两个团队的合并,对于一些正在负责Gemini项目的工程师来说,确实是个不小的惊喜。

曾在DeepMind工作的James Molloy和Tom Hennigan与谷歌资深研究员Paul Barham一起负责基础设施。

Timothy Lillicrap曾在DeepMind从事国际象棋和围棋方面的系统开发工作,而谷歌大脑的研究员Emily Pitler则领导一个团队,专注于使LLM具备处理数学或网络搜索等专门任务的能力。

但除了合并组织中的人员安排问题,Gemini团队在开发过程中还面临着巨大的挑战,如确定可以用于模型训练的数据等。

因此,谷歌的律师们一直在密切评估这项训练工作。

在一个案例中,由于担心版权持有者的反对意见,律师们要求研究人员删除了来自教科书的训练数据。

而这些数据本可以帮助训练模型回答有关天文学或生物学等领域的问题。

不过,谷歌前高管、VC公司Felicis Ventures的创始人Aydin Senkut评价Gemini的发布让他看到了「谷歌决心再次走在最前沿,而不是极度保守」。

Aydin Senkut也十分赞同谷歌的决定:

「这是正确的方向。最终,他们会火的。」

参考资料:

https://www.theinformation.com/articles/the-forced-marriage-at-the-heart-of-googles-ai-race



Tags:GPT-4   点击:()  评论:()
声明:本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,不构成投资建议。投资者据此操作,风险自担。如有任何标注错误或版权侵犯请与我们联系,我们将及时更正、删除。
▌相关推荐
报告称 OpenAI 采集了超一百万小时的 YouTube 视频来训练 GPT-4
IT之家 4 月 7 日消息,本周早些时候,《华尔街日报》报道称 AI 公司在收集高质量训练数据方面遇到了困难。今天,《纽约时报》详细介绍了 AI 公司处理此问题的一些方法,其中涉及到...【详细内容】
2024-04-07  Search: GPT-4  点击:(6)  评论:(0)  加入收藏
微软AI程序员登场,10倍AI工程师真来了?996自主生成代码,性能超GPT-4 30%
新智元报道编辑:桃子 润【新智元导读】全球首个AI程序员Devin诞生之后,让码农纷纷恐慌。没想到,微软同时也整出了一个AI程序员——AutoDev,能够自主生成、执行代码等...【详细内容】
2024-03-18  Search: GPT-4  点击:(15)  评论:(0)  加入收藏
前端不存在了?盲测64%的人更喜欢GPT-4V的设计,杨笛一等团队新作
3 月 9 日央视的一档节目上,百度创始人、董事长兼 CEO 李彦宏指出,以后不会存在「程序员」这种职业了,因为只要会说话,人人都会具备程序员的能力。「未来的编程语言只会剩下两种...【详细内容】
2024-03-11  Search: GPT-4  点击:(9)  评论:(0)  加入收藏
多模态大模型,阿里通义千问能和GPT-4V掰手腕了
通义千问的图像推理能力,最近有了大幅提升。2024 年,大模型领域要卷什么?如果没有思路的话,不妨看看各家大厂都在押注什么方向。最近一段时间,先是 OpenAI 推出 GPT-4V,让大模型...【详细内容】
2024-01-29  Search: GPT-4  点击:(72)  评论:(0)  加入收藏
微软Copilot Pro来了:个人用户也能在Word里用GPT-4,20美元/月
面向个人用户的微软Copilot会员版来了。一个月多交20刀(约合人民币142元),Microsoft 365个人版/家庭版用户就能在Word、Excel、PPT等Office全家桶中用上GPT-4。就像这样,不用在C...【详细内容】
2024-01-16  Search: GPT-4  点击:(89)  评论:(0)  加入收藏
“GPT-4变傻”不只是OpenAI的苦恼,所有大模型与人类交往越久就会越蠢?
 许多大模型在处理早期数据时展现出的优异表现,实际上是受到了‘任务污染’的影响,回答问题全靠记,而非纯粹基于学习理解能力。  ChatGPT发布一年多,已经在全世界...【详细内容】
2024-01-05  Search: GPT-4  点击:(48)  评论:(0)  加入收藏
GPT-4V开源平替!清华浙大领衔,LLaVA等开源视觉模型大爆发
新智元报道编辑:Aeneas【新智元导读】GPT-4V的开源替代方案来了!极低成本,性能却类似,清华、浙大等中国顶尖学府,为我们提供了性能优异的GPT-4V开源平替。如今,GPT-4 Vision在语言...【详细内容】
2024-01-03  Search: GPT-4  点击:(53)  评论:(0)  加入收藏
谷歌Gemini扳回一局!多模态能力和GPT-4V不分伯仲|港中文128页全面测评报告
量子位 | 公众号 QbitAI谷歌扳回一局!在Gemini开放API不到一周的时间,港中文等机构就完成评测,联合发布了多达128页的报告,结果显示:在37个视觉理解任务上,Gemini-Pro表现出了和GP...【详细内容】
2023-12-22  Search: GPT-4  点击:(118)  评论:(0)  加入收藏
GPT-4V 都搞不明白的未来推理有解法了!来自华科大 & 上科大
多模态大语言模型展现了强大的图像理解和推理能力。但要让它们基于当前观测来对未来事件进行预测推理仍然非常困难。即便是当前最强大的 GPT-4V(如下图所示),也无法很好地解决...【详细内容】
2023-12-18  Search: GPT-4  点击:(58)  评论:(0)  加入收藏
OpenAI 宣布修复GPT-4变懒问题,将在离线评估及AB测试后更新模型
IT之家 12 月 11 日消息,OpenAI 在上周遭到部分用户投诉,许多用户声称,他们在使用 ChatGPT 或 GPT-4 API 时,会遇到回应速度慢、敷衍回答、拒绝回答、中断会话等一系列问题,OpenA...【详细内容】
2023-12-12  Search: GPT-4  点击:(50)  评论:(0)  加入收藏
▌简易百科推荐
谷歌推出适用于安卓设备的“查找我的设备”网络
IT之家 4 月 9 日消息,谷歌今日推出了适用于安卓设备的“查找我的设备”网络,其功能类似于苹果的“查找”网络,旨在帮助用户定位丢失、被盗的安卓产品。IT之家注意到,与苹果的“...【详细内容】
2024-04-09    IT之家  Tags:安卓   点击:(2)  评论:(0)  加入收藏
你的自拍和聊天记录,正被硅谷大厂砸数十亿美元疯抢
2026年的数据荒越来越近,硅谷大厂们已经为AI训练数据抢疯了。它们纷纷豪掷十数亿美元,希望把犄角旮旯里的照片、视频、聊天记录都给挖出来。不过,如果有一天AI忽然吐出了我们的...【详细内容】
2024-04-09    新智元  Tags:硅谷   点击:(2)  评论:(0)  加入收藏
谷歌搜索史上最大变革!考虑对AI搜索收费
快科技4月7日消息,据国外媒体报道,谷歌正计划对由生成式人工智能驱动的新高级功能收费,这将是谷歌搜索业务历史上最大的一次变革。自2000年以来,谷歌的搜索产品一直依靠广告盈利...【详细内容】
2024-04-08    快科技  Tags:谷歌搜索   点击:(7)  评论:(0)  加入收藏
为训练AI,OpenAI等科技巨头花式淘数据
[环球时报特约记者 甄翔]《纽约时报》6日披露了科技公司训练人工智能的秘密——利用语音识别工具转录视频网站YouTube上的视频,形成对话文本数据,供其最新的AI学习...【详细内容】
2024-04-08    环球网  Tags:AI   点击:(7)  评论:(0)  加入收藏
训出GPT-5短缺20万亿token!OpenAI被曝计划建「数据市场」
全网真的无数据可用了!外媒报道称,OpenAl、Anthropic等公司正在努力寻找足够的信息,来训练下一代人工智能模型。前几天,OpenAI和微软被曝出正在联手打造超算「星际之门」,解决算...【详细内容】
2024-04-08    新智元  Tags:GPT-5   点击:(1)  评论:(0)  加入收藏
当“机器人”有了“AI大脑” 人形机器人时代来了吗
数智风向标当“机器人”有了“AI大脑”​人形机器人时代来了吗简单明了的口令下达后,机器人便开始搬箱子、运小球,在各类不同的地形行走……这些身上布满芯片和传...【详细内容】
2024-04-08    中国青年报  Tags:机器人   点击:(3)  评论:(0)  加入收藏
报告称 OpenAI 采集了超一百万小时的 YouTube 视频来训练 GPT-4
IT之家 4 月 7 日消息,本周早些时候,《华尔街日报》报道称 AI 公司在收集高质量训练数据方面遇到了困难。今天,《纽约时报》详细介绍了 AI 公司处理此问题的一些方法,其中涉及到...【详细内容】
2024-04-07    IT之家  Tags:OpenAI   点击:(6)  评论:(0)  加入收藏
量子计算会和经典计算一样融入人们的日常生活
作为2024中国网络媒体论坛打造的创新活动之一,“技术赋能·八点见”创新项目发布会于3月30日晚在云南昆明举行。活动现场,本源量子计算科技(合肥)股份有限公司(以下简称“...【详细内容】
2024-04-03    人民网  Tags:量子计算   点击:(8)  评论:(0)  加入收藏
ChatGPT官宣免注册,全球互联网变天!OpenAI将取代谷歌搜索?
新智元报道编辑:编辑部【新智元导读】OpenAI这份愚人节礼物,实在是太大了:今天起,ChatGPT不用注册,可以直接使用。用户狂欢,竞品颤抖,我们仿佛已经听到,谷歌搜索引擎这位巨人轰然倒...【详细内容】
2024-04-02    新智元  Tags:ChatGPT   点击:(8)  评论:(0)  加入收藏
谷歌为了结集体诉讼,同意删除 Chrome 无痕模式下收集的用户数据
IT之家 4 月 2 日消息,根据华尔街日报报道,谷歌为了结追溯到 2020 年的集体诉讼案,近日同意删除通过 Chrome 浏览器“无痕(Incognito)模式”下收集的用户数据。这起诉讼原告认为,...【详细内容】
2024-04-02    IT之家  Tags:Chrome   点击:(7)  评论:(0)  加入收藏
站内最新
栏目相关
  • · 谷歌推出适用于安卓设备的“查找我的设备”网络
  • · 你的自拍和聊天记录,正被硅谷大厂砸数十亿美元疯抢
  • · 谷歌搜索史上最大变革!考虑对AI搜索收费
  • · 为训练AI,OpenAI等科技巨头花式淘数据
  • · 训出GPT-5短缺20万亿token!OpenAI被曝计划建「数据市场」
  • · 当“机器人”有了“AI大脑” 人形机器人时代来了吗
  • · 报告称 OpenAI 采集了超一百万小时的 YouTube 视频来训练 GPT-4
  • · 量子计算会和经典计算一样融入人们的日常生活
  • · ChatGPT官宣免注册,全球互联网变天!OpenAI将取代谷歌搜索?
  • · 谷歌为了结集体诉讼,同意删除 Chrome 无痕模式下收集的用户数据
  • · 哥伦比亚大学华人开发「人脸机器人」,照镜子自主模仿人类表情超逼真
  • · 谷歌服务现已支持使用 Windows Hello 人脸和指纹解锁登录
  • · GPT商店热度不尽人意 仅用在写论文和炒股票上较受欢迎
  • · 距实现全球安全量子通信更近一步:量子点源产生近乎完美纠缠光子对
  • · 中国三大运营商共同发布通过GSMA Open Gateway认证的一次性密码 API
  • · 马斯克脑机接口再造奇迹:瘫痪小伙意念玩赛车击败正常人
  • · 国家数据局局长刘烈宏:充分发挥数据要素价值 培育新质生产力
  • · 谷歌Chrome巨变:第三方Cookie的终结将重塑互联网格局
  • · 百度+苹果,“AI手机元年”真的来了?
  • · 百度AI“咬”了一口苹果 大模型商用有戏了?
  • 站内热门
    相关头条
  • · 谷歌搜索史上最大变革!考虑对AI搜索收费
  • · ChatGPT官宣免注册,全球互联网变天!OpenAI将取代谷歌搜索?
  • · 马斯克脑机接口再造奇迹:瘫痪小伙意念玩赛车击败正常人
  • · Kimi引燃大模型“长文本竞赛”,阿里360百度急出手
  • · 瘫痪8年小哥植入马斯克脑机接口,狂打8小时「文明6」!Neuralink首个人类植入者直播来了
  • · 英伟达“算力核弹”强在哪里?
  • · AI大模型之争远未落幕
  • · 世界首款!英伟达重磅发布人形机器人模型
  • · 全程回顾黄仁勋GTC演讲:Blackwell架构B200芯片登场
  • · 真“Open ” AI?马斯克旗下大模型Grok宣布开源:参数量全球最大
  • · 全球首位AI程序员诞生 人类程序员会失业吗?
  • · 谷歌宣布更新搜索算法:打击AI生成内容,提高搜索结果质量
  • · 英伟达、微软等巨头“抱团”,AI有望助推6G时代到来 国内产业如何接招?
  • · OpenAI Sora已开放对外申请 网友爆料:可能还有其它重磅产品发布
  • · 周鸿祎再谈Sora:真正给人工智能补上了“眼睛”
  • · Sora爆火超100小时:美国狂“卷”算力,国内则卖 AI 课程“捞金”一年5000万|钛媒体AGI
  • · 爆火Sora参数规模仅30亿?谢赛宁等大佬技术分析来了
  • · “AI女友”霸占GPT商店,OpenAI苦不堪言:开发者也难出头!
  • · 从居家到工作,CES 2024上演 AI硬件大秀
  • · OpenAI新年头号重磅!GPT Store上线,企业客户新品也来了
  • 站内头条