您当前的位置:首页 > 新闻资讯 > 科技

“有眼睛、有耳朵、有嘴巴”的AI?OpenAI最新发布!

时间:2024-05-15 09:30:41  来源:中国新闻网  作者:

中新网5月14日电(中新财经 吴家驹)不是GPT-5,而是GPT-4o。

北京时间5月14日,研发ChatGPTAI target=_blank class=infotextkey>OpenAI公司,推出了具备“听、看、说”能力的GPT-4o。

OpenAI网站称,GPT-4o的“o”代表“omni”。在英语中“omni”常被用作词根,用来表示“全部”或“所有”的概念。

该公司首席执行官山姆·奥特曼(Sam Altman)此前已预告,最新发布的产品“不是GPT-5,不是搜索引擎,但我们一直在努力开发一些我们认为人们会喜欢的新东西”。

据介绍,GPT-4o可以实时对音频、视觉和文本进行推理,接受文本、音频和图像的任意组合输入,并生成文本、音频和图像的任意组合输出。

OpenAI称,GPT-4o可以在短至232毫秒的时间内对音频输入做出反应,平均反应时间为320毫秒,这与人类在对话中的反应时间相近。此外,它在英语和代码文本方面的性能与GPT-4 Turbo相当,在非英语语言文本方面也有显著提高。同时在API(应用程序接口)方面,速度更快,成本也降低了50%。

现场,OpenAI展示了GPT-4o的多个应用场景。

例如,在一个演示中,OpenAI前沿研究负责人马克·陈(Mark Chen)通过手机与ChatGPT进行对话。Chen和ChatGPT说,他正在进行演示有些紧张,于是ChatGPT就“像朋友一样”,对他进行了安慰。同时,ChatGPT还能从Chen急促的喘气声中,听出他的紧张,然后对他说“慢一点。Mark,你不是吸尘器。吸气,然后数到四。”

GPT-4o检测人的表情。图自X平台

在另一个演示中,OpenAI后训练团队负责人巴雷特·佐夫(Barret Zoph)把自己的脸对着镜头,让GPT-4o看看自己的情绪如何。在演示的过程中,Zoph先打开了手机的后置摄像头,拍到了木质桌面,于是ChatGPT说,“我看到的好像是木质表面。”而让ChatGPT再试一次后,ChatGPT对Zoph说,“你看起来很开心,笑容灿烂,也许还有一丝兴奋。”

同时,OpenAI还在官网发布了一系列演示视频:GPT-4o可以帮助学习数学、学习西班牙语、准备面试,可以通过画面判断出你正在过生日,然后给你唱生日快乐歌,可以根据要求唱不同风格的催眠曲,甚至还可以当“石头剪刀布”的裁判。而在这些视频中,GPT-4o与演示者的对话流畅,说话语气就“像真人一样”。

有网友表示,根据目前展示的视频来看,GPT-4o在语音交互体验上提升了不少。有网友认为,GPT-4o对算力的需求更大了。也有网友提出,既然GPT-4o具备了“视觉”,它是否可以代替盲人看世界。

OpenAI称,通过GPT-4o,公司跨文本、视觉和音频端到端地训练了一个新模型,这意味着所有的输入和输出都由同一个神经网络处理。由于GPT-4o是OpenAI第一个结合了所有这些模式的模型,因此公司在探索该模型的功能及其局限性方面仍处于起步阶段。

对此,山姆·奥特曼在社交媒体表示,最初的ChatGPT展示了语言界面的雏形,而新的ChatGPT则给人截然不同的感觉。它快速、智能、有趣、自然,而且“乐于助人”。“随着我们增加(可选的)个性化功能、访问信息的功能、代表你采取行动的功能等,我真的看到了一个令人兴奋的未来,我们可以用电脑做比以往更多的事情。”



Tags:OpenAI   点击:()  评论:()
声明:本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,不构成投资建议。投资者据此操作,风险自担。如有任何标注错误或版权侵犯请与我们联系,我们将及时更正、删除。
▌相关推荐
“有眼睛、有耳朵、有嘴巴”的AI?OpenAI最新发布!
中新网5月14日电(中新财经 吴家驹)不是GPT-5,而是GPT-4o。北京时间5月14日,研发ChatGPT的OpenAI公司,推出了具备“听、看、说”能力的GPT-4o。OpenAI网站称,GPT-4o的“o”代表“...【详细内容】
2024-05-15  Search: OpenAI  点击:(0)  评论:(0)  加入收藏
OpenAI用26分钟再次震撼世界!新模型GPT-4o语音水平接近人类,科幻正在成真
出品 | 搜狐科技作者 | 梁昌均北京时间5月14日凌晨,OpenAI再迎重磅更新,虽然不是AI搜索,也不是GPT-5,而是发布了新旗舰模型GPT-4o,但也足以让业内震撼。在此次OpenAI 仅有26分钟...【详细内容】
2024-05-14  Search: OpenAI  点击:(6)  评论:(0)  加入收藏
类人速度超快语音响应!OpenAI推出新旗舰模型GPT-4o,图文音频手机AI搞定
虽然没有带来备受期待的人工智能(AI)搜索引擎,但OpenAI在主打产品AI模型上花了更多心思,拓展多模态功能,让用户可以免费玩转文字、图片和语音输入。美东时间5月13日周一,OpenAI首...【详细内容】
2024-05-14  Search: OpenAI  点击:(3)  评论:(0)  加入收藏
科技界的“AI月”开启!OpenAI、谷歌、微软等巨头将带来哪些颠覆性体验?
  每经记者 蔡鼎 每经编辑 兰素英  全球市场迎来“AI月”。从当地时间5月13日到6月10日,AI领域的开发者和投资者们将迎来一个接一个的重要事件。  从OpenAI直播演示Ch...【详细内容】
2024-05-14  Search: OpenAI  点击:(6)  评论:(0)  加入收藏
ChatGPT-4o,OpenAI的一小步,人类「AI助理」的一大步
科幻电影‘Her’的剧情正在成为现实。作者 | 黎诗韵5 月 13 日,OpenAI 用一场春季发布会,再次搅动了整个 AI 行业。在 Sam Altman 缺席的情况下,OpenAI CTO Mira Mur...【详细内容】
2024-05-14  Search: OpenAI  点击:(15)  评论:(0)  加入收藏
OpenAI发布会回顾:最新旗舰模型免费用 ChatGPT进入实时互动纪元
财联社5月14日讯(编辑 史正丞)北京时间周二凌晨1点,自年初“文生视频模型” Sora后许久未给市场带来惊喜的OpenAI举行春季发布会。公司首席技术官Mira Murati向外界展现了多项...【详细内容】
2024-05-14  Search: OpenAI  点击:(6)  评论:(0)  加入收藏
OpenAI宣布下周一直播演示ChatGPT和GPT-4更新 但不会有搜索引擎
【TechWeb】5月11日消息,据外媒报道,在人工智能领域走在行业前列的OpenAI,已在官网宣布,他们将在太平洋时间5月13日上午10点,也就是北京时间5月14日凌晨1点,进行网络直播,演示部分C...【详细内容】
2024-05-13  Search: OpenAI  点击:(8)  评论:(0)  加入收藏
OpenAI“尝鲜”:收到英伟达全球首部DGX H200 AI超算
作者:李丹来源:硬AI英伟达号称开创先河的人工智能(AI)超级计算机DGX H200正式交付,OpenAI喝到了“头啖汤”。美东时间4月24日周三,OpenAI总裁兼联合创始人Greg Brockman在社交媒体...【详细内容】
2024-04-25  Search: OpenAI  点击:(15)  评论:(0)  加入收藏
Google成了“AI界汪峰”,全都怪OpenAI?
  2016 年,Google CEO 桑达尔·皮查伊在 I/O 开发者大会上豪情满怀地向全世界宣布:Google 已经成为了搜索的代名词,Alphabet 未来将成为一家 AI 优先的公司。  凭借...【详细内容】
2024-04-15  Search: OpenAI  点击:(27)  评论:(0)  加入收藏
OpenAI 宣布向 ChatGPT 付费用户开放新 GPT-4 Turbo 模型
IT之家 4 月 12 日消息,OpenAI 今日宣布,新 GPT-4 Turbo 现已向付费 ChatGPT 用户开放。与 1 月份相比,新版本提高了写作、数学、逻辑推理和编码的能力。GPT-4 Turbo 可在 Chat...【详细内容】
2024-04-12  Search: OpenAI  点击:(27)  评论:(0)  加入收藏
▌简易百科推荐
“有眼睛、有耳朵、有嘴巴”的AI?OpenAI最新发布!
中新网5月14日电(中新财经 吴家驹)不是GPT-5,而是GPT-4o。北京时间5月14日,研发ChatGPT的OpenAI公司,推出了具备“听、看、说”能力的GPT-4o。OpenAI网站称,GPT-4o的“o”代表“...【详细内容】
2024-05-15    中国新闻网  Tags:OpenAI   点击:(0)  评论:(0)  加入收藏
OpenAI用26分钟再次震撼世界!新模型GPT-4o语音水平接近人类,科幻正在成真
出品 | 搜狐科技作者 | 梁昌均北京时间5月14日凌晨,OpenAI再迎重磅更新,虽然不是AI搜索,也不是GPT-5,而是发布了新旗舰模型GPT-4o,但也足以让业内震撼。在此次OpenAI 仅有26分钟...【详细内容】
2024-05-14    搜狐科技  Tags:OpenAI   点击:(6)  评论:(0)  加入收藏
科技界的“AI月”开启!OpenAI、谷歌、微软等巨头将带来哪些颠覆性体验?
  每经记者 蔡鼎 每经编辑 兰素英  全球市场迎来“AI月”。从当地时间5月13日到6月10日,AI领域的开发者和投资者们将迎来一个接一个的重要事件。  从OpenAI直播演示Ch...【详细内容】
2024-05-14    每日经济新闻  Tags:AI   点击:(6)  评论:(0)  加入收藏
OpenAI发布会回顾:最新旗舰模型免费用 ChatGPT进入实时互动纪元
财联社5月14日讯(编辑 史正丞)北京时间周二凌晨1点,自年初“文生视频模型” Sora后许久未给市场带来惊喜的OpenAI举行春季发布会。公司首席技术官Mira Murati向外界展现了多项...【详细内容】
2024-05-14    财联社  Tags:OpenAI   点击:(6)  评论:(0)  加入收藏
OpenAI宣布下周一直播演示ChatGPT和GPT-4更新 但不会有搜索引擎
【TechWeb】5月11日消息,据外媒报道,在人工智能领域走在行业前列的OpenAI,已在官网宣布,他们将在太平洋时间5月13日上午10点,也就是北京时间5月14日凌晨1点,进行网络直播,演示部分C...【详细内容】
2024-05-13    TechWeb  Tags:OpenAI   点击:(8)  评论:(0)  加入收藏
通义千问APP更名为通义APP 免费开放通义全栈能力
5月9日消息,通义大模型品牌升级,“通义千问APP”更名为“通义APP”,集成通义大模型全栈能力,免费为所有用户提供服务。据悉,通义APP以性能媲美GPT-4 Turbo的基模为底座,并把通义实...【详细内容】
2024-05-10    PChome  Tags:通义千问   点击:(6)  评论:(0)  加入收藏
从商汤看大模型的商业转机
对商汤科技的关注,笔者从未停止过,商汤的产品设计与商业思维是四小龙中最出色的,去年4月商汤日日新大模型发布时笔者也曾聊过这个话题《商汤日日新大模型》,这次因为港股爆涨再...【详细内容】
2024-05-07    雪球  Tags:商汤   点击:(7)  评论:(0)  加入收藏
AI学会隐藏思维暗中推理!不依赖人类经验解决复杂任务 更黑箱了
AI做数学题,真正的思考居然是暗中“心算”的?纽约大学团队新研究发现,即使不让AI写步骤,全用无意义的“……”代替,在一些复杂任务上的表现也能大幅提升!一作Jacab Pf...【详细内容】
2024-05-07    快科技  Tags:AI   点击:(10)  评论:(0)  加入收藏
Kimi、通义千问、Claude“变身”马斯克,它们这样评价雷军
长文本对大模型而言为何重要?文|孙欣编辑|姚赟头图来源|视觉中国(13.740, 0.00, 0.00%)200万字,意味着什么?《埃隆·马斯克传》30万字,《红楼梦》70万字,《后宫甄嬛传》100...【详细内容】
2024-05-07    中国企业家  Tags:雷军   点击:(9)  评论:(0)  加入收藏
谷歌裁掉整个Python团队!PyTorch 创始人急得直骂人:“WTF!核心语言团队无可替换”
来源:InfoQ编辑 | Tina、褚杏娟、冬梅我们长期人手不足,但是我 20 年来最好的工作。 谷歌 Python 工程师、Python 指导委员会成员 Thomas Wouters 昨天在社交媒体上发布了一...【详细内容】
2024-04-29    InfoQ  Tags:Python   点击:(18)  评论:(0)  加入收藏
站内最新
栏目相关
  • · “有眼睛、有耳朵、有嘴巴”的AI?OpenAI最新发布!
  • · OpenAI用26分钟再次震撼世界!新模型GPT-4o语音水平接近人类,科幻正在成真
  • · 科技界的“AI月”开启!OpenAI、谷歌、微软等巨头将带来哪些颠覆性体验?
  • · OpenAI发布会回顾:最新旗舰模型免费用 ChatGPT进入实时互动纪元
  • · OpenAI宣布下周一直播演示ChatGPT和GPT-4更新 但不会有搜索引擎
  • · 通义千问APP更名为通义APP 免费开放通义全栈能力
  • · 从商汤看大模型的商业转机
  • · AI学会隐藏思维暗中推理!不依赖人类经验解决复杂任务 更黑箱了
  • · Kimi、通义千问、Claude“变身”马斯克,它们这样评价雷军
  • · 谷歌裁掉整个Python团队!PyTorch 创始人急得直骂人:“WTF!核心语言团队无可替换”
  • · 黄仁勋最新访谈:AI不会完全取代人类工作
  • · 第一批喂养AI的「妈妈工人」,正在被抛弃
  • · OpenAI“尝鲜”:收到英伟达全球首部DGX H200 AI超算
  • · 开源VS闭源,李彦宏、周鸿祎等大佬各持己见
  • · 半个AI圈,向李彦宏“开炮”
  • · 黄仁勋最新研判:三大行业将迎来颠覆性变革
  • · 美国参议院通过涉“字节剥离TikTok”新法案
  • · 移动版谷歌 Chrome 浏览器开始引入“短暂模式”:用户无需下载,即可体验应用
  • · 马斯克:可能在明年年底前出售特斯拉人形机器人 Optimus
  • · 微软推出iPhone能跑的ChatGPT级模型,性能超Llama-3
  • 站内热门
    相关头条
  • · OpenAI用26分钟再次震撼世界!新模型GPT-4o语音水平接近人类,科幻正在成真
  • · 斯坦福发布2024 AI报告:中国AI专利全球第一,顶级AI模型主要来自美国
  • · 谷歌搜索史上最大变革!考虑对AI搜索收费
  • · ChatGPT官宣免注册,全球互联网变天!OpenAI将取代谷歌搜索?
  • · 马斯克脑机接口再造奇迹:瘫痪小伙意念玩赛车击败正常人
  • · Kimi引燃大模型“长文本竞赛”,阿里360百度急出手
  • · 瘫痪8年小哥植入马斯克脑机接口,狂打8小时「文明6」!Neuralink首个人类植入者直播来了
  • · 英伟达“算力核弹”强在哪里?
  • · AI大模型之争远未落幕
  • · 世界首款!英伟达重磅发布人形机器人模型
  • · 全程回顾黄仁勋GTC演讲:Blackwell架构B200芯片登场
  • · 真“Open ” AI?马斯克旗下大模型Grok宣布开源:参数量全球最大
  • · 全球首位AI程序员诞生 人类程序员会失业吗?
  • · 谷歌宣布更新搜索算法:打击AI生成内容,提高搜索结果质量
  • · 英伟达、微软等巨头“抱团”,AI有望助推6G时代到来 国内产业如何接招?
  • · OpenAI Sora已开放对外申请 网友爆料:可能还有其它重磅产品发布
  • · 周鸿祎再谈Sora:真正给人工智能补上了“眼睛”
  • · Sora爆火超100小时:美国狂“卷”算力,国内则卖 AI 课程“捞金”一年5000万|钛媒体AGI
  • · 爆火Sora参数规模仅30亿?谢赛宁等大佬技术分析来了
  • · “AI女友”霸占GPT商店,OpenAI苦不堪言:开发者也难出头!
  • 站内头条