您当前的位置:首页 > 电脑百科 > 人工智能

吊打Midjourney!OpenAI秘密内测新平台

时间:2023-08-04 11:53:01  来源:51CTO  作者:

作者 | 徐杰承

“当使用过它之后,我对Midjourney已经再也提不起一点兴趣了。”这句“虎狼之词”出自一位AI target=_blank class=infotextkey>OpenAI新图像生成平台的内测用户之口。显然,OpenAI已经再一次做好了掀桌子的准备,而这次他们所瞄准的,正是AI图像生成领域。

根据YouTube博主MattVidPro透露,他的一位粉丝在不久前获得了OpenAI新图像生成平台的内测资格,并向他悄悄透露了大量利用新平台生成的作品。MattVidPro也将这些内容制作成了一期视频节目,而他开场词的第一句话是,“今天,让我们一睹AI生成图的未来!”

图源:Youtube

1、两大优势完胜Mj

MattVidPro在视频中表示,据这位粉丝透露,OpenAI正在秘密测试一个全新的图像生成平台,该平台很可能是此前OpenAI所发布的文生图工具Dell-E 2的升级版。并且这次测试非常隐蔽——用户需要在一个仅能容纳400人的OpenAI独家测试服务器中访问该平台。

在进行了一段时间的尝试后,这位粉丝发现,新平台不仅能够创建具有头发、灯光、广告副本等细节特征的逼真图像,而且在生成连贯细节和遵循提示词方面具有极强的能力。在许多任务的执行效果上甚至可以吊打如今AI生成图领域名气最盛的Midjourney。

首先是连贯细节方面,了解AI图像生成模型的人可能会知道,当前绝大多数模型都无法准确处理生成图中的文字内容。Midjourney也同样拥有这项缺陷。一个来自互联网的例子是:“生成红色铅笔,上面印有‘welcome’的文字。”Midjourney虽然完成了红色铅笔的生成,但文字呈现方面可以说一塌糊涂。

图源:网络

但显然,OpenAI已经找到了解决这一问题的方法,在MattVidPro所展示的图片中,新平台在处理相似任务时的表现可以说非常炸裂。无论是生成写有博主ID的海报,还是生成《GTA5》的游戏盒子全都不在话下,并且图像中的主体文字内容完全没有出错。

图源:Youtube

除此之外,在面对较为复杂的提示词时,相比于Midjourney,OpenAI新平台所生成的图像内容显然更接近提示词的描述。这里一个典型的例子是根据以下提示生成图像:“在一场自行车比赛中,一名粉色小丑正在与一只熊猫击掌。自行车是由奶酪制成的,地面非常泥泞。他们在一个多雾的森林里骑车,熊猫很生气。”

在Midjourney所给出的四张作品中,一只熊猫没有骑车,而其余三只的座驾都是没有出现奶酪元素的摩托而非自行车,并且四张图片中均没有出现小丑角色,熊猫的表情看起来也与生气毫不沾边。

图源:Youtube

而OpenAI平台在相同任务上的表现则无需多言,所生成作品包含了提示中的几乎全部细节。

图源:Youtube

看完以上案例,有人可能会说OpenAI新平台生成的图像似乎在真实度和画面细节方面并不出彩,甚至有些依靠“Q版”图耍小聪明的嫌疑。但这其实只是由于在提示中未规定画面风格的缘故。在生成写实图像方面,新平台的能力也完全不亚于目前的主流文生图工具。

图源:Youtube

图源:Youtube

在以上的两个案例中,我们不难看出,无论是油画风格图像“公牛”的画面质感和笔触细节,亦或是写实风格图像“水中少女”的光效、少女面部的水渍呈现等,两幅图像的逼真度和细节处理也均达到了业内顶尖水准。

2、或采用全新生成模型

除了图像以外,关于OpenAI正在测试的这个新图像生成平台,网上几乎没有出现其余的任何消息。但根据OpenAI于3月所发表的论文,不少专业人士推测,该平台很可能利用了全新的“一致性模型”而非目前业内主流的“扩散模型”。

图源:OpenAI

在这篇名为《Consistency Models》的论文中,OpenAI提到,一致性模型在训练速度上覆盖了扩散模型,能够“一步生成”,能够比扩散模型更快实现简单任务,且所用计算量要少10-2000倍。此外,一致性模型也允许“多步采样”,以计算换取样本质量。因此即使没有迭代过程,一致性模型也可以产生高质量结果,并能快速适用于实时任务。

图源:OpenAI

与扩散模型相同,一致性模型也支持零样本数据编辑。例如在修补、着色或超分辨率任务中,一致性模型可以从预先训练的扩散模型中提取数据,也可以单独进行训练。根据OpenAI的说法,一致性模型能在所有非对抗性单步生成任务中胜过扩散模型。

图源:OpenAI

并且以上所提到的两种训练方式都将“对抗训练”从中删除了。这是由于对抗训练过程较为复杂,虽然这更易于产生强大的神经网络,但对抗训练的方式也会导致模型预测的准确率下降。部分业内人士认为,这便是OpenAI新平台能够在处理连贯任务和遵循提示方面表现得更好的主要原因。

除此之外,一个没有太多依据的猜测是,在Dall-E 2发布的几个月前,OpenAI发表了几篇关于扩散模型的论文。如果从时间维度推测,新平台则很可能利用了全新的一致性模型。当然,以上这些也只是目前业内的普遍猜测,在OpenAI官方发声之前,估计我们也很难了解到更多关于该平台的技术细节。

3、还没有完全准备好

而对于OpenAI为何要如此隐蔽的对该平台进行测试,根据博主MattVidPro的说法以及几个相关的图片案例来看,目前该平台似乎仍未完成全部的开发工作,一些细节方面的问题依然有待进一步完善。

首先便是一直以来都困扰着生成模型的“画手”问题,虽然在大部分情况下表现还算不错,但新平台偶尔也会在生成人物手部细节时犯错误。例如在这张“打喷嚏的粉发少女”中,我们可以清晰地看到人物的手指被描绘成了六根。

图源:Youtube

除此之外,根据粉丝的透露,目前该平台还没有设置任何安全限制,能够生成包含血腥暴力、色情等敏感元素的图像,甚至有时一些敏感图像会在没有提示的情况下弹出。视频中,MattVidPro分享了一张相对委婉的生成图像,并表示一些“有点出格的作品”并不方便公开展示。

图源:Youtube

对于向来以追求极致而著称的OpenAI来说,显然目前该平台的部分能力以及安全性还没有达到他们最终所希望的水平。这也就可以解释为什么OpenAI会选择进行相对隐蔽的测试行为且没有进行对外的公开发声了。

4、赢者通吃:OpenAI的下一步

对于OpenAI的下一步计划,不少网友也在Youtube上留下了自己的观点。部分人认为,由于GPT4目前已具有了多模态信息处理能力,OpenAI很可能会基于新平台在下一版ChatGPT中集成强大的AI生成图功能。

另一部分人则认为,OpenAI也可能会基于新平台开发全新的AI生成图产品(或是Dall E-3),与Midjourney、Stable Diffusion等产品竞争并瓜分剩余市场,以进一步提升公司的盈利能力。毕竟目前ChatGPT的用户增长速率已达到了一个阶段性的瓶颈。

总之,虽然就目前看来,OpenAI的这个全新AI生成图平台仍需要进行一些微调以及安全功能的引入,但平台所流露出的信息已经在业内引起了一些积极的反响,并收获了比现阶段主流文生图产品更高的评价。有专家预测该平台或将在今年年底正式对用户开放。

图源:Youtube

不难看出,如今的科技巨头们在人工智能方面的追求已不再满足于单纯的语言模型,而是将攫取的枝杈伸展到了更广阔的领域。无论是OpenAI正在测试的全新AI生成图平台,亦或是Meta刚刚开源的文生音乐模型Audiocraft,都表明着人工智能的未来将在更丰富的模态上开花结果。



Tags:OpenAI   点击:()  评论:()
声明:本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,不构成投资建议。投资者据此操作,风险自担。如有任何标注错误或版权侵犯请与我们联系,我们将及时更正、删除。
▌相关推荐
OpenAI和谷歌再起纷争:AI的尽头是内容
日前,纽约时报的一篇报道称,人工智能公司 OpenAI为收集高质量训练数据而开发了一个语音转录模型Whisper。该模型主要用于转录 OpenAI 获取的超过 100 万小时的 YouTube 视频,也...【详细内容】
2024-04-09  Search: OpenAI  点击:(1)  评论:(0)  加入收藏
AI产业的灰色暗面:OpenAI、谷歌、META如何搞训练语料
财联社4月7日讯(编辑 史正丞)种种迹象显示,目前站在全世界AI领域潮头浪尖的这些公司,早在几年前就已经陷入对训练语料的“绝望”追逐中——为此他们不惜修改政策条款...【详细内容】
2024-04-09  Search: OpenAI  点击:(1)  评论:(0)  加入收藏
为训练AI,OpenAI等科技巨头花式淘数据
[环球时报特约记者 甄翔]《纽约时报》6日披露了科技公司训练人工智能的秘密——利用语音识别工具转录视频网站YouTube上的视频,形成对话文本数据,供其最新的AI学习...【详细内容】
2024-04-08  Search: OpenAI  点击:(7)  评论:(0)  加入收藏
训出GPT-5短缺20万亿token!OpenAI被曝计划建「数据市场」
全网真的无数据可用了!外媒报道称,OpenAl、Anthropic等公司正在努力寻找足够的信息,来训练下一代人工智能模型。前几天,OpenAI和微软被曝出正在联手打造超算「星际之门」,解决算...【详细内容】
2024-04-08  Search: OpenAI  点击:(1)  评论:(0)  加入收藏
报告称 OpenAI 采集了超一百万小时的 YouTube 视频来训练 GPT-4
IT之家 4 月 7 日消息,本周早些时候,《华尔街日报》报道称 AI 公司在收集高质量训练数据方面遇到了困难。今天,《纽约时报》详细介绍了 AI 公司处理此问题的一些方法,其中涉及到...【详细内容】
2024-04-07  Search: OpenAI  点击:(6)  评论:(0)  加入收藏
ChatGPT官宣免注册,全球互联网变天!OpenAI将取代谷歌搜索?
新智元报道编辑:编辑部【新智元导读】OpenAI这份愚人节礼物,实在是太大了:今天起,ChatGPT不用注册,可以直接使用。用户狂欢,竞品颤抖,我们仿佛已经听到,谷歌搜索引擎这位巨人轰然倒...【详细内容】
2024-04-02  Search: OpenAI  点击:(8)  评论:(0)  加入收藏
无需注册!OpenAI宣布放开ChatGPT使用限制
工智能初创公司OpenAI宣布,即日起用户无须注册即可开始使用ChatGPT的功能。OpenAI在最新公告中写道:“让ChatGPT等工具广泛可用,让人们能够体验到人工智能的好处,这是我们使命的...【详细内容】
2024-04-02  Search: OpenAI  点击:(6)  评论:(0)  加入收藏
开发者再分享 OpenAI Sora 生成的短视频:树叶大象、彩虹瀑布等
IT之家 3 月 19 日消息,OpenAI 今年 2 月推出 Sora 模型之后,迅速成为 AI 圈内头条,能够基于用户的一句话,生成最长 1 分钟的视频,效果接近实拍。OpenAI 目前并未向公众发布 Sora...【详细内容】
2024-03-19  Search: OpenAI  点击:(12)  评论:(0)  加入收藏
奥特曼承认OpenAI名不符实:我们需要大量资金
OpenAI首席执行官萨姆·奥特曼最近在一次网络直播中表示,OpenAI可能不是这家人工智能公司最理想的名字,至少事后看来是这样。他在与莱克斯·弗里德曼的一次播客访...【详细内容】
2024-03-19  Search: OpenAI  点击:(8)  评论:(0)  加入收藏
别等OpenAI了,全球首个类Sora抢先开源!所有训练细节/模型权重全公开,成本仅1万美元
【导读】OpenAI Sora还没用上,国产Sora刚刚正式宣布全面开源!「Open-Sora 1.0」所有的训练细节模型权重全面开源,1万美元64块GPU复现,训练成本直降46%。图片来源:由无界AI生成不...【详细内容】
2024-03-18  Search: OpenAI  点击:(18)  评论:(0)  加入收藏
▌简易百科推荐
藏在AI背后的“吃电狂魔”
人工智能时代的能耗黑洞据估算,到2027年,人工智能行业每年将消耗85~134太瓦时的电力,相当于瑞典或荷兰一年的总用电量。马斯克判断,电力缺口最早可能会在2025年发生,“明年你会看...【详细内容】
2024-04-09    雪豹财经社  Tags:AI   点击:(1)  评论:(0)  加入收藏
OpenAI和谷歌再起纷争:AI的尽头是内容
日前,纽约时报的一篇报道称,人工智能公司 OpenAI为收集高质量训练数据而开发了一个语音转录模型Whisper。该模型主要用于转录 OpenAI 获取的超过 100 万小时的 YouTube 视频,也...【详细内容】
2024-04-09  小编也疯狂  新浪网  Tags:AI   点击:(1)  评论:(0)  加入收藏
AI产业的灰色暗面:OpenAI、谷歌、META如何搞训练语料
财联社4月7日讯(编辑 史正丞)种种迹象显示,目前站在全世界AI领域潮头浪尖的这些公司,早在几年前就已经陷入对训练语料的“绝望”追逐中——为此他们不惜修改政策条款...【详细内容】
2024-04-09    财联社  Tags:AI产业   点击:(1)  评论:(0)  加入收藏
和“数字人”交朋友,当心隐私被出卖......
在虚拟社交中如何在保护用户隐私和数据安全的同时提供高质量的社交体验?如何避免过度依赖虚拟社交找到虚拟与真实之间的平衡点?《中国消费者报》记者就此展开了调查APP里有个...【详细内容】
2024-04-09    中国消费者报  Tags:数字人   点击:(2)  评论:(0)  加入收藏
AI“复活”成产业链:成本可降至数百元
大模型应用落地,带火数字人(11.560, 0.29, 2.57%)赛道。文|《中国企业家》记者李艳艳 实习生 孙欣编辑|姚赟头图来源|《流浪地球2》电影画面截图清明节前,预估会有需求的庞立...【详细内容】
2024-04-09    中国企业家  Tags:AI“复活”   点击:(2)  评论:(0)  加入收藏
多方热议人工智能产业新机遇
编者按  从前沿科技展会到高层对话平台,从上海、重庆到博鳌,从线上到线下……一场场高规格、大规模的盛会中,人工智能正在成为各界热议的高频词。赋能千...【详细内容】
2024-04-08    中国家电网  Tags:人工智能   点击:(4)  评论:(0)  加入收藏
​人形机器人时代来了吗
日前,由中国人形机器人(11.080, -0.05, -0.45%)百人会主办的人形机器人大赛在北京经济技术开发区开赛。工作人员向参观者展示一款人形机器人。参观者与一款陪护型人形机器人...【详细内容】
2024-04-08    中国青年报  Tags:​人形机器人   点击:(5)  评论:(0)  加入收藏
AI重塑社交:腾讯与字节跳动的新赛场
文|新火种 一号编辑|美美最近,腾讯和字节跳动这两大互联网巨头几乎同步推出了各自的AI社交产品,尽管腾讯和字节跳动在前段时间刚刚“破冰”,但这一举措不仅意味着这两大巨头之...【详细内容】
2024-04-07    蓝鲸财经  Tags:AI   点击:(8)  评论:(0)  加入收藏
第一批用 Kimi 做内容的网红已经杀疯了
作者:王东东 文章来自:斗战圣佛小组技术信仰派 VS 市场信仰派 朱啸虎和月之暗面老板杨植麟在前几天有一场不算 battle 的 battle。battle 的争论点是:大模型有没有戏。技术派...【详细内容】
2024-04-04    斗战圣佛小组  Tags:Kimi   点击:(4)  评论:(0)  加入收藏
昆仑万维发布面向人工智能时代的六条人才宣言
过去的一年多,是人工智能取得非凡进步的一年。在这充满突破性技术飞跃和备受争议的一年里,我们见证了人工智能的快速发展和广泛的影响,人工智能已经迅速地融入了我们的生活,深刻...【详细内容】
2024-04-03    砍柴网  Tags:昆仑万维   点击:(7)  评论:(0)  加入收藏
站内最新
站内热门
站内头条