您当前的位置:首页 > 互联网百科 > 元宇宙

Meta最新图像生成工具火了,竟能把梦境画成现实

时间:2022-07-22 16:39:32  来源:  作者:新智元

AI在画画这块儿,已经拿捏的死死的。

近日,Meta也整了一个AI「画家」——Make-A-Scene。

Meta最新图像生成工具火了,竟能把梦境画成现实

 

还以为只是用文字生成画作就这么简单吗?

 

要知道,仅是靠文字描述还有时候会「翻车」,就比如谷歌前段时间推出的「艺术家」Parti。

 

「一个没有香蕉的盘子,旁边有一个没有橙汁的玻璃杯。」

Meta最新图像生成工具火了,竟能把梦境画成现实

 

这次,Make-A-Scene可以通过文本描述,再加上一张草图,就能生成你想要的样子。

 

构图上下、左右、大小、形状等各种元素都由你说了算。

Meta最新图像生成工具火了,竟能把梦境画成现实

 

就连LeCun也出来力推自家的产品了,创意就不用说了,关键还「可控」!

Meta最新图像生成工具火了,竟能把梦境画成现实

 

Make-A-Scene有多厉害,不如一起来看看。

 

Meta的神笔马良

 

光说不练,假把式!

 

我们这就看看,人们究竟会怎么用Make-A-Scene,来实现他们的想象力。

 

研究团队将和知名的人工智能艺术家一起来进行Make-A-Scene的演示环节。

Meta最新图像生成工具火了,竟能把梦境画成现实

 

艺术家团队可谓阵容强大,包括Sofia Crespo、Scott Eaton、Alexander Reben和Refik Anadol等等,这些大师都有第一手的应用生成性人工智能的使用经验。

 

研发团队让这些艺术家们用Make-A-Scene作为创作过程的一部分,边使用边反馈。

 

接下来,我们就来欣赏一下大师们用Make-A-Scene创作出的作品吧。

 

例如,Sofia Crespo是一位专注于自然和技术交融的艺术家。她很爱想象从来没存在过的人造生命形式感,所以她使用Make-A-Scene的素描和文本提示功能,创造了全新的「混合生物」。

Meta最新图像生成工具火了,竟能把梦境画成现实

 

比如,花形的水母。

 

Crespo利用它的自由绘画功能,可以快速迭代新的想法。她表示,Make-A-Scene将有助于艺术家更好地发挥创造力,能让艺术家使用更直观的界面作画。

Meta最新图像生成工具火了,竟能把梦境画成现实

 

(花型的水母)

 

Scott Eaton是一位艺术家、教育家和创意技术专家,他的工作是调研究当代现状和技术之间的关系。

 

他用Make-A-Scene作为一种构成场景的方式,通过不同的提示来探索场景的变化,比如用类似「沙漠中沉没和腐烂的摩天大楼」这种主题来强调气候危机。

Meta最新图像生成工具火了,竟能把梦境画成现实

 

(沙漠中的摩天大楼)

 

Alexander Reben是一位艺术家、研究人员和机器人专家。

 

他认为,如果能对输出有更多的掌控,确实有助于表达自己的艺术意图。他将这些工具融入了他正在进行的系列作品之中。

Meta最新图像生成工具火了,竟能把梦境画成现实

 

而对于媒体艺术家和导演Refik Anadol来说,这个工具是一种促进想象力发展、更好地探索未知领域的方式。

Meta最新图像生成工具火了,竟能把梦境画成现实

 

其实,这个原型工具不仅仅是为对艺术有兴趣的人准备的。

 

研究团队相信,Make-A-Scene可以帮助任何人更好地表达自己,包括那些没什么艺术细胞的人。

 

作为开始,研究团队向美达公司的员工提供了一部分使用权。他们正在测试并提供关于他们使用Make-A-Scene经验的反馈。

 

美达公司的项目经理Andy Boyatzis使用Make-A-Scene与他两岁和四岁的孩子一起创造艺术。他们用俏皮的图画把他们的想法和想象力变成了现实。

 

以下就是他们的作品~

Meta最新图像生成工具火了,竟能把梦境画成现实

 

一只五彩斑斓的雕塑猫~是不是很可爱。但是这个色调其实有点不忍直视,像小孩把一大坨橡皮泥瞎揉到一起。

Meta最新图像生成工具火了,竟能把梦境画成现实

 

一只乘坐火车的怪兽熊。说真的,密恐患者抓紧绕行。小编看完这张图密恐直接窜到顶了。看看这诡异的胳膊,像脸一样的身子,像眼珠子一样的轮子...

Meta最新图像生成工具火了,竟能把梦境画成现实

 

一座山峰。讲道理,这张图蛮有意境的。但有没有感觉,远处的山和近处的小火车压根不是一个画风?

Meta最新图像生成工具火了,竟能把梦境画成现实

 

背后技术

 

虽然目前的方法提供了文本和图像域之间还算不错的转换,但它们仍然有几个关键问题没有很好地解决:可控性、人类感知、图像质量。

 

该模型的方法一定程度提高了结构一致性和图像质量。

 

整个场景由三个互补的语义分割组(全景、人类和人脸)组成。

 

通过组合三个提取的语义分割组,网络学习生成语义的布局和条件,生成最终图像。

 

为了创建场景的token空间,作者们采用了「VQ-SEG」,这是一项对「VQ-VAE」的改进。

 

在该实现中,「VQ-SEG」的输入和输出都是m个通道。附加通道是分隔不同类和实例的边的映射。边缘通道为同一类的相邻实例提供分离,并强调具有高度重要性的稀缺类。

 

在训练「VQ-SEG」网络时,由于每个人脸部分在场景空间中所占的像素数量相对较少,因此导致了重建场景中代表人脸部分(如眼睛、鼻子、嘴唇、眉毛)的语义分割频繁减少。

 

对此,作者们尝试在分割人脸部分类的基础上采用加权二元交叉熵人脸损失,更加突出人脸部分的重要性。此外,还将人脸部分的边缘作为上述语义分割边缘图的一部分。

 

作者们采用了在Imag.NET数据集上训练的预训练VGG网络,而不是专门的人脸嵌入网络,并引入了表示重建图像和真实图像之间感知差异的特征匹配损失。

 

通过使用特征匹配,给VQ-IMG中的encoder和decoder分别添加额外的上采样层和下采样层,便可以将输出图像的分辨率从256×256进行提高。

 

想必大家对Transformer并不陌生,那么基于场景的Transformer又是什么呢?

 

它依赖于一个具有三个独立连续的token空间的自回归Transformer,即文本、场景和图像。

Meta最新图像生成工具火了,竟能把梦境画成现实

 

token序列由BPE编码器编码的文本token、VQ-SEG编码的场景token以及VQ-IMG编码或者解码的图像token组成。

 

在训练基于场景的Transformer之前,每个编码好的token序列都对应一个[文本,场景,图像]元组,使用相应的encoder提取。

 

此外,作者们还采用了无分类器引导,即将无条件样本引导到条件样本的过程。

 

该模型实现了SOTA结果。具体看一下和之前方法的效果对比

Meta最新图像生成工具火了,竟能把梦境画成现实

 


Meta最新图像生成工具火了,竟能把梦境画成现实

 

现在,研究人员还将Make-A-Scene整合了一个超分辨率网络,就可以生成2048x2048、4倍分辨率的图像。

 

如下:

Meta最新图像生成工具火了,竟能把梦境画成现实

 

其实,与其他生成AI模型一样,Make-A-Scene通过对数百万个示例图像进行训练来学习视觉和文本之间的关系。

 

不可否认的是,训练数据中反映的偏差会影响这些模型的输出。

 

正如研究者所指出的那样,Make-A-Scene还有很多地方有待提高。

 

参考资料:

https://ai.facebook.com/blog/greater-creative-control-for-ai-image-generation/



Tags:图像生成   点击:()  评论:()
声明:本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,不构成投资建议。投资者据此操作,风险自担。如有任何标注错误或版权侵犯请与我们联系,我们将及时更正、删除。
▌相关推荐
谷歌聊天机器人Bard新增图像生成能力:可生成图片、ai画作
谷歌聊天机器人Bard能力提升 除语言处理外还可生成图片谷歌近日宣布,其聊天机器人Bard的能力又向前迈进了一大步。除了先前的技能之外,Bard现在还具备了生成图片的能力。新增...【详细内容】
2024-02-02  Search: 图像生成  点击:(65)  评论:(0)  加入收藏
基于深度学习的虚拟现实图像生成技术研究与应用
随着虚拟现实(VirtualReality,简称VR)技术的快速发展,人们对于逼真、沉浸式的虚拟体验需求不断增加。而虚拟现实图像生成是VR技术中的重要环节之一,它通过模拟和生成逼真的虚拟场...【详细内容】
2024-01-04  Search: 图像生成  点击:(152)  评论:(0)  加入收藏
深度学习中的图像生成对抗攻击与防御方法综述
随着深度学习技术的快速发展,图像生成对抗攻击成为了一个备受关注的研究领域。图像生成对抗攻击是指通过对抗样本的生成,欺骗深度学习模型,使其产生错误的分类结果。为了应对这...【详细内容】
2023-11-28  Search: 图像生成  点击:(258)  评论:(0)  加入收藏
OpenAI推出新版人工智能图像生成器DALL-E 3
9月21日消息,据外媒报道,当地时间周三,OpenAI推出了新版人工智能(AI)图像生成器DALL-E 3。DALL-E 3是一个文本转图像生成器,可根据书面提示生成图像。OpenAI称,它可以处理比Dall-E...【详细内容】
2023-09-22  Search: 图像生成  点击:(205)  评论:(0)  加入收藏
SnapFusion技术大幅提升AI图像生成速度
近日,社交媒体公司旗下的研究部门宣布研发出一项名为SnapFusion的新技术,能使AI生成图像的速度大幅提升,从原来的几分钟甚至几小时缩短到不到两秒。SnapFusion可以根据用户输入...【详细内容】
2023-06-28  Search: 图像生成  点击:(229)  评论:(0)  加入收藏
Meta最新图像生成工具火了,竟能把梦境画成现实
AI在画画这块儿,已经拿捏的死死的。近日,Meta也整了一个AI「画家」——Make-A-Scene。 还以为只是用文字生成画作就这么简单吗? 要知道,仅是靠文字描述还有时候会「翻...【详细内容】
2022-07-22  Search: 图像生成  点击:(339)  评论:(0)  加入收藏
使用神经网络为图像生成标题
我们都知道,神经网络可以在执行某些任务时复制人脑的功能。神经网络在计算机视觉和自然语言生成方面的应用已经非常引人注目。本文将介绍神经网络的一个这样的应用,并让读者了...【详细内容】
2020-07-29  Search: 图像生成  点击:(411)  评论:(0)  加入收藏
▌简易百科推荐
解读数字藏品与元宇宙有何关联?
数字藏品与元宇宙的关联主要体现在以下几个方面: 数字藏品是元宇宙的重要组成部分:在元宇宙中,数字藏品是一种重要的数字资产,它们可以作为元宇宙中的虚拟物品、艺术品、文物、...【详细内容】
2024-03-06  小磊爱交友    Tags:元宇宙   点击:(20)  评论:(0)  加入收藏
元宇宙怎样从概念到产业?
南京市元宇宙产业大厦。(受访者供图)游戏玩家利用小程序参与任务。医学生可在元宇宙教学医院模拟练习。□ 本报记者 何钰 徐冠英1月29日,工信部、教育部等7部门联合出台的《关...【详细内容】
2024-02-02    新华日报  Tags:元宇宙   点击:(30)  评论:(0)  加入收藏
扎克伯格谈愿景:元宇宙AI 两手抓,预估年底有35万片英伟达 H100
IT之家 1 月 19 日消息,Meta 公司首席执行官马克・扎克伯格(Mark Zuckerberg)近日在 Threads 上发布视频,表示正扩大 AI 团队阵容,推动元宇宙和人工智能发展。IT之家附上视频如下...【详细内容】
2024-01-19    IT之家  Tags:扎克伯格   点击:(47)  评论:(0)  加入收藏
2024 年,谁是元宇宙的救命稻草?
“元宇宙元年”开启时,科技的触角企图在0与1构成的世界里、安放可以数字化的一切,绘制出时间与空间的虚拟延长线。尼尔·斯蒂芬森笔下的虚拟城市沿着一条100米宽的道路...【详细内容】
2024-01-03  AI新智界    Tags:元宇宙   点击:(46)  评论:(0)  加入收藏
全新虚拟人技术发布,苹果原来还握着这么多元宇宙大招
随着年末的到来,半年前苹果在头显领域的大招Vision Pro距离正式发售也越来越近。虽然半年来,大家的目光都聚焦在Vision Pro可能带来的全新沉浸式体验上,但潜藏在其中关于虚拟人...【详细内容】
2023-12-27  元宇宙新声    Tags:元宇宙   点击:(42)  评论:(0)  加入收藏
图像渲染和元宇宙的关系,你知道吗?
图像渲染是计算机图形学中的一个重要概念,它指的是通过计算机程序生成和处理数字图像的过程从定义上来说,渲染就是将抽象的几何模型转换成可视化的图像。它涉及光照、材质、阴...【详细内容】
2023-11-21  时空元宇宙    Tags:元宇宙   点击:(54)  评论:(0)  加入收藏
元宇宙的虚拟与现实
元宇宙的概念最早可以追溯到上个世纪的科幻小说作品。进入到二十一世纪二十年代,随着虚拟现实技术的发展,元宇宙的概念再一次被业界追捧。简单地说,元宇宙就是利用虚拟现实技术...【详细内容】
2023-11-20  JerryZang    Tags:元宇宙   点击:(86)  评论:(0)  加入收藏
教育元宇宙须与现实无缝融合
编者按当今世界,科技进步日新月异,互联网、云计算等现代信息技术深刻改变着人类的思维与学习方式。如何因应信息技术的发展,推动教育变革和创新,建设“人人皆学、处处能学、时时...【详细内容】
2023-10-31    光明日报  Tags:元宇宙   点击:(102)  评论:(0)  加入收藏
TOD与科幻相遇 会怎样“对话”?
智慧化、数字化、未来感……TOD与科幻相遇 会怎样“对话”?“元宇宙”TOD概念方案 受访者供图前日,备受瞩目的2023成都世界科幻大会在蓉落幕。当科幻与TOD相遇会...【详细内容】
2023-10-24    锦观新闻  Tags:TOD   点击:(73)  评论:(0)  加入收藏
元宇宙开始从科幻走向现实
近些年,元宇宙的概念吸引了全球公司的关注和投资,尤其是在 Facebook 宣布更名为 META 之后。元宇宙可以被描述为一个三维虚拟空间,通过可视化界面增强在线活动。虽然对元宇宙的...【详细内容】
2023-10-11    新浪VR  Tags:元宇宙   点击:(65)  评论:(0)  加入收藏
站内最新
站内热门
站内头条