您当前的位置:首页 > 电脑百科 > 人工智能

新版Midjourney太炸裂:AI绘画再无Bug,“有图有真相”时代彻底过去

时间:2023-03-31 10:06:12  来源:新浪网  作者:硅星人

  进化版的AI绘图工具创造出了一个平行世界。

  文| 硅星人 Juny  编辑| VickyXiao

  过去几个月,以ChatGPT为首的聊天机器人搅得科技界满城风雨,大家都忙着去跟各家的AI聊天,让它们来写邮件、写代码、写诗。而当语言模型在大跨步向前进化时候,AIGC的另一个重要分支——绘图,最近其实也完全没闲着。

  去年曾因拿下艺术比赛大奖而名噪一时的Midjourney,近期在AI生成图片领域热度可以说堪比OpenAI。MidjourneyV4版本去年年底几乎跟ChatGPT同期上线,而就在上周GPT-4推出的时候,Midjourney也飞速推出了第五代版本,而这一次的更新堪称“炸裂”。

  一周以来,各种用Midjourney生成的神图层出不穷,国足夺冠、特朗普插秧、教皇打碟、异形下乡……只要你敢想AI就敢画,而且随便拿出一张都能做到以假乱真的程度。但可能有创作的伪照片过于真实,引起了太多争议,太多新用户涌入导致服务器不堪重负,本周二,Midjourney宣布关闭了其免费账户的使用通道。

  不过,另外一方面,在人们疯狂娱乐的同时,一些人也尝试着把ChatGPT和Midjourney结合起来使用,一些由人类构思、AI主导和操作的“人机合作”作品也逐渐显现出了商业化应用的轮廓。

  |当图片向照片进化:一个由AI创造的平行世界诞生

  你有没有想象过这样的画面:

  在不久前落幕的卡塔尔世界杯上,整个绿茵球场变成了一片红色的海洋。大家欢呼雀跃,全场掌声雷动。

  图片来自小红书博主,账号:Ai船长

  爱因斯坦没有出现在实验室里,而是梳着标志性的发型,在音乐节上狂欢。


  图片来自推特

  马斯克没有在21世纪造火箭和电动汽车,而是穿越到了苏联工厂,真正当起了一名“钢铁侠”(工人)。

  图片来自推特

  这样的世界,你觉得怎么样?

  以上这些无比真实的照片,并不是由谁花了大量时间PS制作的,而是很多普通人通过动一动手指头,打几个关键字,就让人工智能在十几秒内所自动生成的。

  造就这以假乱真世界的幕后推手是一个名为Midjourney的AI生成图片工具。可以说, 目前在AIGC绘图领域,MidJourney是一个比OpenAI还神奇的存在。Midjourney没有任何巨头的重金支持,是一个自筹资金的独立研究实验室,它的发起人为曾两次拒绝苹果收购的Leap Motion公司的创始人David Holz,目前全职员工仅有11人。

  但就是这么一个超小型团队,却是当前AI绘图领域最炙手可热的明星,甚至将OpenAI的DALL-E、Stable Diffusion、英伟达的GauGAN2等同类工具都甩在了身后。

  |比肩GPT的更新速度,惊叹和争议相继到来

  Midjourney的迭代速度相较于OpenAI可以说是有过之而无不及。去年3月份第一版本首次上线,4月份便火速更新第二版本,接着7月份上线Open Beta V3版本首次向公众开放,之后以其独特的艺术性风格吸引了一些用户。其中,最出圈的就是这张由普通人给出提示词、AI负责创作,跟人类艺术家同台比赛之后斩获金奖的油画。

  之后Midjourney并没有停下更新的脚步,11月又推出第四代版本添加了更多图片风格,紧接着今年3月份,Midjourney V5版本登场。此次V5版本的更新之所以能引发大量关注,主要是因为它解决了一个技术难题和完成了一次跨越性的突破。

  其中,技术难题指的是——画手。

  让AI画出逼真的人类手部特征是一个看起来简单但却出奇复杂的任务。首先,在 AI的训练图集中,手往往都不是图片的重点,同时人们握手、牵手、鼓掌等不同状态下手部形态各异,很难形成标准化的模版,这也就造成了AI学习难度的激增。

  此外,即便对于传统人类画师来说,画手也是最困难的地方之一。手的几何形状复杂,并没有一套标准的线条或形状,指关节上的皱纹和褶皱、手掌上的阴影等细节非常多,并且每个人的手都不一样,是独一无二的存在,并不能套用。

  因此正确并精细化地画手对于所有的AI工具来说都是一项困难的挑战,在Midjourney的V5之前,行业内的AI绘画工具都无法很好地完成。

  Midjourney(左)、Stable Diffusion(右上)和DALL-E 2(右下)此前生成的奇怪人手,图片来自buzzfeednews

  但现在,Midjourney V5版本的已经完美解决了这个问题。

  图片来自推特

  不仅告别了六指或畸形,还能结合人物特点画出不同状态和年龄画出不同的手部细节,就连在光影中的手指纹路也能被完美呈现。

  图片来自于mpost

  而除了攻克了画手这个技术难题之外,Midjourney V5此次另一跨越性的突破在于——能够生成照片级的图片,并且还是摄影大师拍的那种。

  在V5之前,Midjourney生成的图片总体以卡通或超现实风格为主,但V5版本能够支援包括真实、抽象、油画等更广泛的风格,图像解像度比上个版本提高2 倍。而此次写实风格的上线,可以说直接到了让很多摄影师都要感叹“摄影学不存在了”的地步。

  比如,以“90年代大街上的模特”为主题,完美创造出真假难辨的照片。

  图片来自推特,账号Nick St. Pierre

  以“你好小朋友”为主题,用胶片质感完成童年重现。

  图片来自小红书博主,账号:逗比

  以“发生飓风的新闻报道”为主题,无中生有地去还原一个灾难现场等等。

  图片来自推特

  从以上这些照片示例中可以看出,Midjourney的写实图片生成并不局限于一种固定的风格,而是会根据你描述场景和想要的风格来智能化的调整色调、像素、镜头语言等。最近Midjourney产出的很多图片,甚至已经达到人的肉眼无法判别真伪的程度。

  如果从技术的角度,Midjourney的进步无疑是让人惊艳和赞叹的。但可能也因为这些照片太过于真实和太多新用户的涌入,本周二,Midjourney宣布关闭了其免费账户的使用通道。分析认为,此举也是为了防止更多离谱的“照片”出现,从而扰乱现实世界和散布有害信息。

  比如,此前真的就有媒体以把特朗普被捕的生成图片当成了真实现场照片,从而造成了虚假新闻的出现和发酵。此外,Midjourney目前的关键词审核机制并不严格,因此也存在产生大量有害照片的风险。Midjourney表示他们正在进一步加强对于AI生成内容的监管和审核。

  图片来自于The Verge

  | ChatGPT+Midjourney强强联合,AI作品走向商业化应用

  目前,MidJourney仍然需要结合Discord使用,使用方法依然很简单,通过输入文字和一些参数要求描述即可。目前还支持用户上传自己的图片,再根据图片进行AI生成。

  目前,一段完整Midjourney的“咒语”示例大概如下:

  A man in futuristic armor with cyberpunk details(对想要呈现图片的文字描述,可以添加更多细节),shot on Canon R6 with 50mm f1.2(风格描述,可以提出是什么设备拍摄的、或者是以哪位知名艺术家或摄影师的风格),--v 5(使用第五代版本技术)--ar 4:6 (画幅比例,V5 版本中你可以自定义任何比例)--iw 1(输入的参考图片的权重占比)

  虽然咒语的构成并不算复杂,但对于很多只有一个模糊想法的普通用户来说,如何让Midjourney来画出自己脑中图像仍然比较困难。于是,ChatGPT也登场了。

  ChatGPT能发挥什么作用呢?首先你可以模糊地描述你的构想,让ChatGPT拓展成一个充满细节的画面描述,接着让它从这段文字描述中提取关键词。然后,你可以将Midjourney的提示句的语法构成告诉ChatGPT,再通过几次训练让Midjounery记住如何通过你输入的关键词来创建Midjourney的命令语法。

  之后你只需要复制粘贴ChatGPT给你的指令粘贴到Midjourney的命令框里即可生成图片,如果你不满意还可以让ChatGPT来继续帮你修改完善关键词。

  目前,已经有很多人已经在尝试将ChatGPT和Midjourney结合产出的结果,应用于自己的工作中。比如,做电商的不再需要去花大价钱去找摄影师、设计师,而是只需要把产品图片和关键词提供给AI工具,就能直接生成商业大片。

  图片来自小红书博主,账号:阿汤娇娇啊、阿泰ATAI动态视觉

  未来甚至也不用找真人模特了,直接用AI生成就行。

  还有人将其用于室内家居设计领域,帮助自己来做网站、生成宣传图片等。

  可以预见的是,ChatGPT和Midjourney的合作可能仅仅只是AI商业化应用的一个开端。随着AI技术的快速发展,各种工具的出现让AI的应用范围也会指数级的扩大。目前,在设计、电商、广告、游戏、影视等各个领域都涌现出了更多的用例,在娱乐性大大增强的同时,全新的机遇赛道也在被开启。

  最后,让我们来做一个无奖竞猜。以下两张烤鸡的图片中,你认为到底哪一张才是由真的相机拍摄的呢?




Tags:Midjourney   点击:()  评论:()
声明:本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,不构成投资建议。投资者据此操作,风险自担。如有任何标注错误或版权侵犯请与我们联系,我们将及时更正、删除。
▌相关推荐
GPT-4大杀器谷歌Gemini来袭!26位研发大佬名单曝出,祭出类Midjourney生图能力
新智元报道 编辑:编辑部【新智元导读】据The Information爆料,谷歌已集结数百工程师团队,全新大杀器Gemini结合了GPT-4、Midjourney、Stable Diffusion三大模型的能力,即将于今...【详细内容】
2023-08-17  Search: Midjourney  点击:(60)  评论:(0)  加入收藏
你每天用来打卡的钉钉,居然藏着「ChatGPT」「Midjourney」和「Notion」
虽然你可能每天都在用钉钉,但我想你应该没有完全用过钉钉上的所有功能。钉钉目前的用户数量已经超过 6 亿,服务的企业组织数超过 2300 万,从大公司到小店铺,每个组织都能在钉钉...【详细内容】
2023-08-17  Search: Midjourney  点击:(231)  评论:(0)  加入收藏
Midjourney API怎么接入、调用、申请,4步快速解决
Midjourney API 申请和接入详细步骤,带你了解如何接入、调用、申请midjourney的API接口开发文档,为你的站点提供更多功能和便利性。调用midjourney的API接口步骤:第一步,打开触...【详细内容】
2023-08-08  Search: Midjourney  点击:(399)  评论:(0)  加入收藏
教你快速申请调用AI作画API fast(midjourney )
AI绘画技术已经成为很多企业关注的焦点。通过调用AI绘画API接口,企业可以快速搭建AI绘画网站,为用户提供便捷的绘画服务。图源:调用触站AI的API开发接口生成(解释权归触站AI所有...【详细内容】
2023-08-07  Search: Midjourney  点击:(341)  评论:(0)  加入收藏
如何接入midjourney的api接口
在进行midjourney的API开发之前,首先需要了解如何接入、调用和申请midjourney的API接口。✨midjourney的API无法直接调用,需要通过触站AI来调用midjourney的API接口。...【详细内容】
2023-08-06  Search: Midjourney  点击:(248)  评论:(0)  加入收藏
吊打Midjourney!OpenAI秘密内测新平台
作者 | 徐杰承“当使用过它之后,我对Midjourney已经再也提不起一点兴趣了。”这句“虎狼之词”出自一位OpenAI新图像生成平台的内测用户之口。显然,OpenAI已经再一次做好了掀...【详细内容】
2023-08-04  Search: Midjourney  点击:(190)  评论:(0)  加入收藏
堪比Midjourney!妙鸭相机为什么突然火爆?
“家人们,终于出片了...”近日,某妙鸭相机的用户兴奋地在朋友圈炫耀,并附上一系列美照,“这下我也会AIGC了”。继Midjourney之后,又一款AI图片生成应用火出圈了,它就是“妙鸭相机...【详细内容】
2023-07-27  Search: Midjourney  点击:(267)  评论:(0)  加入收藏
AI 作画工具 Midjourney 推出“pan”功能,可平移扩展图片外场景
IT之家 7 月 5 日消息,AI 作画工具 Midjourney 日前推出了“pan”功能,能够生成图片外的场景,用户可以通过在输入框中点击“上下左右”来控制“平移”图片。▲ 图源 Midjourney...【详细内容】
2023-07-05  Search: Midjourney  点击:(174)  评论:(0)  加入收藏
教你使用ai绘画工具Midjourney
大家好,最近AI绘画在设计圈引起了热议。今天,我将介绍Midjourney的基本用法和有效的关键词描述技巧,让您轻松创作属于自己的AI杰作。1.什么是Midjourney?Midjourney是托管在Disc...【详细内容】
2023-06-30  Search: Midjourney  点击:(121)  评论:(0)  加入收藏
Midjourney最新“扩图”玩法:1小时直接出高清大片!
金磊 发自 凹非寺 量子位 | 公众号 QbitAI Midjourney搞“扩图”,简直把想象力拉满。我们先来看下这两个画面: 你能想象它们是出自同一张图片吗?是时候展示真正的技术了:这就是...【详细内容】
2023-06-26  Search: Midjourney  点击:(267)  评论:(0)  加入收藏
▌简易百科推荐
行业大模型快速落地的一年,如何做?
生成式AI正成为时下科技企业“讲故事”的关键词之一。但从发展上看,无论是“文生文”的大语言模型,还是“文生图”的多模态模型,更多的是辅助人们进行一些简单的办公,或者提供一...【详细内容】
2024-04-10    钛媒体APP  Tags:行业大模型   点击:(3)  评论:(0)  加入收藏
互联网充斥“针对小白的AI课”,能相信吗?普通人不学AI课程会被淘汰?
早前,一位标榜清华大学博士和多家公司AI顾问名头的百万级粉丝量博主,向用户大力推介“所有人都需要学”的AI入门课程。不过,这些课程最终因贩卖焦虑、蒙骗学员而被平台下架。然...【详细内容】
2024-04-10    九派新闻  Tags:AI课   点击:(7)  评论:(0)  加入收藏
藏在AI背后的“吃电狂魔”
人工智能时代的能耗黑洞据估算,到2027年,人工智能行业每年将消耗85~134太瓦时的电力,相当于瑞典或荷兰一年的总用电量。马斯克判断,电力缺口最早可能会在2025年发生,“明年你会看...【详细内容】
2024-04-09    雪豹财经社  Tags:AI   点击:(3)  评论:(0)  加入收藏
OpenAI和谷歌再起纷争:AI的尽头是内容
日前,纽约时报的一篇报道称,人工智能公司 OpenAI为收集高质量训练数据而开发了一个语音转录模型Whisper。该模型主要用于转录 OpenAI 获取的超过 100 万小时的 YouTube 视频,也...【详细内容】
2024-04-09  小编也疯狂  新浪网  Tags:AI   点击:(3)  评论:(0)  加入收藏
AI产业的灰色暗面:OpenAI、谷歌、META如何搞训练语料
财联社4月7日讯(编辑 史正丞)种种迹象显示,目前站在全世界AI领域潮头浪尖的这些公司,早在几年前就已经陷入对训练语料的“绝望”追逐中——为此他们不惜修改政策条款...【详细内容】
2024-04-09    财联社  Tags:AI产业   点击:(4)  评论:(0)  加入收藏
和“数字人”交朋友,当心隐私被出卖......
在虚拟社交中如何在保护用户隐私和数据安全的同时提供高质量的社交体验?如何避免过度依赖虚拟社交找到虚拟与真实之间的平衡点?《中国消费者报》记者就此展开了调查APP里有个...【详细内容】
2024-04-09    中国消费者报  Tags:数字人   点击:(6)  评论:(0)  加入收藏
AI“复活”成产业链:成本可降至数百元
大模型应用落地,带火数字人(11.560, 0.29, 2.57%)赛道。文|《中国企业家》记者李艳艳 实习生 孙欣编辑|姚赟头图来源|《流浪地球2》电影画面截图清明节前,预估会有需求的庞立...【详细内容】
2024-04-09    中国企业家  Tags:AI“复活”   点击:(3)  评论:(0)  加入收藏
多方热议人工智能产业新机遇
编者按  从前沿科技展会到高层对话平台,从上海、重庆到博鳌,从线上到线下……一场场高规格、大规模的盛会中,人工智能正在成为各界热议的高频词。赋能千...【详细内容】
2024-04-08    中国家电网  Tags:人工智能   点击:(5)  评论:(0)  加入收藏
​人形机器人时代来了吗
日前,由中国人形机器人(11.080, -0.05, -0.45%)百人会主办的人形机器人大赛在北京经济技术开发区开赛。工作人员向参观者展示一款人形机器人。参观者与一款陪护型人形机器人...【详细内容】
2024-04-08    中国青年报  Tags:​人形机器人   点击:(6)  评论:(0)  加入收藏
AI重塑社交:腾讯与字节跳动的新赛场
文|新火种 一号编辑|美美最近,腾讯和字节跳动这两大互联网巨头几乎同步推出了各自的AI社交产品,尽管腾讯和字节跳动在前段时间刚刚“破冰”,但这一举措不仅意味着这两大巨头之...【详细内容】
2024-04-07    蓝鲸财经  Tags:AI   点击:(8)  评论:(0)  加入收藏
相关文章
    无相关信息
站内最新
站内热门
站内头条