您当前的位置：首页 > 电脑百科 > 人工智能

爱因斯坦霉霉同框只需15秒，最新可控AI一玩停不下来，在线试玩已出

时间：2023-03-24 11:11:57 来源：量子位作者：

+ 加入收藏

本文经AI新媒体量子位（公众号ID:QbitAI）授权转载，转载请联系出处。

现在，AI绘画完全可以做到指哪打哪了！

这边哈士奇，那边牧羊犬，背景在下雪天。

啪叽！一幅画就这么完成了。

这个最新MultiDiffusion模型，不管选的区域位置有多离谱，它都能给你画出指定的东西来。

比如，你能看到大象和奶牛同时握草？？

而且在线可试，亲测大概15秒就能出，你甚至可以看到泰勒与爱因斯坦跨时空同框。

要知道以前AI绘画最大的一个bug就是不可控，但现在人类拥有了更多的控制权。

总之就是，想画什么就画什么，想往哪画就往哪画！

有网友赶紧上手试了试：Not Bad！

想往哪画就往哪画

从效果来看，主要有三个方面的应用。

文本到高分辨率全景生成；
精确区域生成；
任意长宽比粗略区域生成。

首先，只需要一句话，就可以生成512*4609分辨率的全景图。

一张有滑雪者的雪山顶峰的照片。

摄影师也不用爬楼了，直接获得城市夜景图。

当然更为主体功能，那就是给特定区域单独提示，然后AI绘画就来指哪画哪。

比如在黑色部分是一个明亮的盥洗室，红色区域是一面镜子、蓝色部分是花瓶、黄色部分是白色的水槽。

就这么随手一个拼图画，结果就生成了真实场景。

不过也有一些bug，像一些超现实的，他就有点太天马行空了。

比如三体人在宇宙中大战人类。

当然也可以无需那么精确，只需标个大致位置，还支持任意长宽比的图像。

蓝色部分是埃菲尔铁塔、红色是粉色的云、绿色是热气球。

关键是各种构图都十分地合理、场景效果以及实际物体相对大小也都十分精准。

图像生成可控

背后的这个模型叫做MultiDiffusion，这是一个统一的框架，能实现多功能和可控的图像生成。

以往即便Diffusion模型给图像生成带来变革性影响，但用户对生成图像的可控性、以对新任务的快速适应仍是不小的挑战。

研究人员主要是通过重新训练、微调，或者另外开发工具等方式来解决。前不久爆火插件Contro.NET正是解决了图像生成的可控性，

而MultiDiffusion无需进一步训练或微调，就可一次实现对生成内容的多种灵活控制，包括期望的长宽比、空间引导信号等。

简单来说，MultiDiffusion的关键在于，在预先训练好的扩散模型上定义一个全新的生成过程。从噪声图像开始，在每个生成步骤中，解决一个优化任务。

然后再将多个扩散生成过程与一组共享的参数或约束结合起来，目标是将每个部分都尽可能去接近去噪版本。

即便有时候每个步骤都可能会将图像拉向不同的方向，但最终融合到一个全局去噪步骤当中，得到一个无缝图像。

来自魏茨曼科学研究所

这篇论文主要来自位于以色列雷霍沃特的魏茨曼科学研究所。

两位共同一作Omer Bar-Tal、Lior Yariv分别是魏兹曼科学研究院计算机科学和应用数学系的研究生和博士生，后两位分别是他们的导师。

△左：Omer Bar-Tal；右：Lior Yariv

好了，感兴趣的旁友可戳下方试一试哦！

https://huggingface.co/spaces/weizmannscience/MultiDiffusion
主页链接：
https://multidiffusion.Github.io/
论文链接：https://arxiv.org/abs/2302.08113

Tags：AI 点击:() 评论:()

声明：本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,不构成投资建议。投资者据此操作，风险自担。如有任何标注错误或版权侵犯请与我们联系，我们将及时更正、删除。

▌相关推荐

Meta推出新版自研AI芯片：性能较上代提高三倍，降低对英伟达依赖

AI（人工智能）芯片紧缺之际，越来越多科技巨头选择自行研发。当地时间4月10日，社交巨头Meta公布了自主研发芯片MTIA的最新版本。MTIA是Meta专门为AI训练和推理工作设计的定制芯片...【详细内容】

2024-04-11　　Search: AI 点击:(1)　　评论:(0)　　加入收藏

英特尔发布新一代AI芯片并首推AI芯片代工 “单挑”英伟达和台积电

新华财经上海4月11日电当地时间4月9日，英特尔在Vision 2024客户和合作伙伴大会上宣布推出最新AI芯片产品Gaudi 3加速器。英特尔称，相比英伟达的H100 GPU，Gaudi3 AI芯片的模型...【详细内容】

2024-04-11　　Search: AI 点击:(2)　　评论:(0)　　加入收藏

AI“复活”亲人成生意，哪些红线待划定？

提供一张照片、一段10多秒的音频，即可让逝者在视频中“活”过来——AI“复活”亲人成生意，哪些红线待划定？本报记者陶稳《工人日报》(2024年04月11日 06版)阅读提示...【详细内容】

2024-04-11　　Search: AI 点击:(2)　　评论:(0)　　加入收藏

全球十大独角兽发布：字节稳坐第一，SpaceX第二，OpenAI第三

鞭牛士报道，4月10日消息，根据胡润《2024 年全球独角兽指数》，TikTok 所有者字节跳动以 1.56 万亿元人民币（1.72 万亿港元）连续第三年成为全球最大的独角兽公司。SpaceX 以 1.28...【详细内容】

2024-04-10　　Search: AI 点击:(0)　　评论:(0)　　加入收藏

科技巨头狂撒千亿美元 “买照片”，只为训练AI模型？

高质量的数据，越来越值钱。你能想象，那些被遗忘在网盘的陈年老图，有朝一日能价值千金？就在最近，路透社报道称，苹果公司正与图像托管网站Photobucket协商，希望得到这家公司近130亿张...【详细内容】

2024-04-10　　Search: AI 点击:(0)　　评论:(0)　　加入收藏

数字水印国标将出，AI生成内容标识成新焦点

日前，全国网络安全标准化技术委员会就国家标准《信息安全技术数字水印技术实现指南》公开征求意见，这是数字水印技术方面的首份国家标准，旨在解决由于缺乏统一实施流程、服务接...【详细内容】

2024-04-10　　Search: AI 点击:(2)　　评论:(0)　　加入收藏

互联网充斥“针对小白的AI课”，能相信吗？普通人不学AI课程会被淘汰？

早前，一位标榜清华大学博士和多家公司AI顾问名头的百万级粉丝量博主，向用户大力推介“所有人都需要学”的AI入门课程。不过，这些课程最终因贩卖焦虑、蒙骗学员而被平台下架。然...【详细内容】

2024-04-10　　Search: AI 点击:(7)　　评论:(0)　　加入收藏

AI是万灵药？Meta要把大模型塞进AR眼镜里

寻找下一块“屏幕”，这无疑是最近几年科技行业的一个热门赛道。随着个人计算机点燃了互联网，智能手机让移动互联网无处不在之后，这前后两次造富神话的出现，也让所有人都在期待下...【详细内容】

2024-04-09　　Search: AI 点击:(6)　　评论:(0)　　加入收藏

藏在AI背后的“吃电狂魔”

人工智能时代的能耗黑洞据估算，到2027年，人工智能行业每年将消耗85~134太瓦时的电力，相当于瑞典或荷兰一年的总用电量。马斯克判断，电力缺口最早可能会在2025年发生，“明年你会看...【详细内容】

2024-04-09　　Search: AI 点击:(3)　　评论:(0)　　加入收藏

AI+数字人成为市场关注焦点，大屏AI数字人助力展厅设计创意升级

随着各行业产业的数字化转型加速，人工智能时代的到来，展馆展厅行业也步入数字时代，各式的展馆展厅设计在融合了全息投影、虚拟现实、数字沙盘、互动投影、互动桌面等多种技术后...【详细内容】

2024-04-09　　Search: AI 点击:(4)　　评论:(0)　　加入收藏

▌简易百科推荐

行业大模型快速落地的一年，如何做？

生成式AI正成为时下科技企业“讲故事”的关键词之一。但从发展上看，无论是“文生文”的大语言模型，还是“文生图”的多模态模型，更多的是辅助人们进行一些简单的办公，或者提供一...【详细内容】

2024-04-10　　　　钛媒体APP　　Tags:行业大模型　点击:(3)　　评论:(0)　　加入收藏

互联网充斥“针对小白的AI课”，能相信吗？普通人不学AI课程会被淘汰？

2024-04-10　　　　九派新闻　　Tags:AI课　点击:(7)　　评论:(0)　　加入收藏

藏在AI背后的“吃电狂魔”

2024-04-09　　　　雪豹财经社　　Tags:AI 　点击:(3)　　评论:(0)　　加入收藏

OpenAI和谷歌再起纷争：AI的尽头是内容

日前，纽约时报的一篇报道称，人工智能公司 OpenAI为收集高质量训练数据而开发了一个语音转录模型Whisper。该模型主要用于转录 OpenAI 获取的超过 100 万小时的 YouTube 视频，也...【详细内容】

2024-04-09　　小编也疯狂　　新浪网　　Tags:AI 　点击:(3)　　评论:(0)　　加入收藏

AI产业的灰色暗面：OpenAI、谷歌、META如何搞训练语料

财联社4月7日讯（编辑史正丞）种种迹象显示，目前站在全世界AI领域潮头浪尖的这些公司，早在几年前就已经陷入对训练语料的“绝望”追逐中——为此他们不惜修改政策条款...【详细内容】

2024-04-09　　　　财联社　　Tags:AI产业　点击:(4)　　评论:(0)　　加入收藏

和“数字人”交朋友，当心隐私被出卖......

在虚拟社交中如何在保护用户隐私和数据安全的同时提供高质量的社交体验？如何避免过度依赖虚拟社交找到虚拟与真实之间的平衡点？《中国消费者报》记者就此展开了调查APP里有个...【详细内容】

2024-04-09　　　　中国消费者报　　Tags:数字人　点击:(6)　　评论:(0)　　加入收藏

AI“复活”成产业链：成本可降至数百元

大模型应用落地，带火数字人(11.560, 0.29, 2.57%)赛道。文|《中国企业家》记者李艳艳实习生孙欣编辑|姚赟头图来源|《流浪地球2》电影画面截图清明节前，预估会有需求的庞立...【详细内容】

2024-04-09　　　　中国企业家　　Tags:AI“复活” 　点击:(3)　　评论:(0)　　加入收藏

多方热议人工智能产业新机遇

编者按&emsp;&emsp;从前沿科技展会到高层对话平台，从上海、重庆到博鳌，从线上到线下……一场场高规格、大规模的盛会中，人工智能正在成为各界热议的高频词。赋能千...【详细内容】

2024-04-08　　　　中国家电网　　Tags:人工智能　点击:(5)　　评论:(0)　　加入收藏

人形机器人时代来了吗

日前，由中国人形机器人(11.080, -0.05, -0.45%)百人会主办的人形机器人大赛在北京经济技术开发区开赛。工作人员向参观者展示一款人形机器人。参观者与一款陪护型人形机器人...【详细内容】

2024-04-08　　　　中国青年报　　Tags:人形机器人　点击:(6)　　评论:(0)　　加入收藏

AI重塑社交：腾讯与字节跳动的新赛场

文|新火种一号编辑|美美最近，腾讯和字节跳动这两大互联网巨头几乎同步推出了各自的AI社交产品，尽管腾讯和字节跳动在前段时间刚刚“破冰”，但这一举措不仅意味着这两大巨头之...【详细内容】

2024-04-07　　　　蓝鲸财经　　Tags:AI 　点击:(8)　　评论:(0)　　加入收藏

推荐资讯

16个Redis常见使用场	一篇文章教会你使用Py
聊聊Rust里面的数据类	C++中的外部模板及其
一篇文章带你了解Pyth	网络安全行业的春天何
Linux获取Redis 性能	Redis与缓存一致性问

站内最新

栏目相关

· 行业大模型快速落地的一年，如何做？

· 互联网充斥“针对小白的AI课”，能相信吗？普通人不学AI课程会被淘汰？

· 藏在AI背后的“吃电狂魔”

· OpenAI和谷歌再起纷争：AI的尽头是内容

· AI产业的灰色暗面：OpenAI、谷歌、META如何搞训练语料

· 和“数字人”交朋友，当心隐私被出卖......

· AI“复活”成产业链：成本可降至数百元

· 多方热议人工智能产业新机遇

· 人形机器人时代来了吗

· AI重塑社交：腾讯与字节跳动的新赛场

· 第一批用 Kimi 做内容的网红已经杀疯了

· 昆仑万维发布面向人工智能时代的六条人才宣言

· AI干掉声优？音频大模型追逐“图灵时刻”

· 生成式人工智能有哪些新趋势？

· AI世界的新难题：互联网的信息不够用了！

· 今天起，ChatGPT无需注册就能用了！

· AI时代，面对死亡有了第二种选择？

· 影视业AI应用如何超乎想象？

· 当AI会作词作曲唱歌，音乐人何去何从

· 大模型Kimi火了，长文本“卷”出新高度

站内热门