来了来了，多模态ChatGPT它来了

时间：2023-09-22 11:21:13 来源：作者：元宇宙与碳中和研究院

21日，周四凌晨，AI target=_blank class=infotextkey>OpenAI在官网宣布将在今年十月份通过API向ChatGPT Plus和企业版用户提供全新文生图大模型DALL-E 3，ChatGPT也将集成在其中，彼此加持下将开启久违的多模态输出模式，用户通过文本就能直接在ChatGPT中生成各种类型图片。官网链接：https://openai.com/dall-e-3

根据OpenAI官方的说法，DALL-E 3“比以往系统更能理解细微差别和细节，让用户更加轻松地将自己的想法转化为非常准确的图像”。这里举个网友分享的例子，提示词（prompt）都是“一幅描绘篮球运动员扣篮的油画，并伴以爆炸的星云”，来对比下前代的DALL-E 2（左）和现在DALL-E 3（右）的绘图效果。

很明显的能看出来，DALL-E 3在细节、亮度、清晰度等方都进步明显，甚至人物的侧脸还颇有NBA乔帮主--迈克尔·乔丹年轻时的感觉。除了炸裂的绘图效果之外，此次 DALL-E 3 的最大看点莫过于和ChatGPT的集成，它原生构建在ChatGPT之上，用ChatGPT来创建、拓展和优化提示词。这样一来，用户无需在提示词上花费太多时间即可完成绘图。具体说来，因为与ChatGPT的集成，用户不必绞尽脑汁地想出详细的提示词来引导和完成绘图了。只要输入一个想法，ChatGPT会自动为DALL-E 3生成详细的prompt，匹配程度之高宛如量身定制，同时用户也可以使用自己的提示词。

通过这几个实例，可以发现DALL-E 3在绘制写实、二次元、平面、创意、朋克、3D等多种类型的图片时的表现还是可圈可点的。

2021年1月5日，OpenAI公布了第一代DALL-E，通过120亿参数的GPT-3来理解自然语言输入并生成相应的图片，既可以生成现实的对象也能生成现实中不存在的对象，这也是它保留至今的特点。它的名字源于Pixar（皮克斯）2008年的动画电影，《机器人总动员》中的主角WALL-E（瓦力），以及20世纪西班牙加泰罗尼亚著名画家Salvador Dalí（萨尔瓦多·达利），是二者的混成词。两个月后，DALL-E的论文和代码正式公开。

在DALL-E之前已有其他许多人工神经网络可以生成逼真图像，而DALL-E的特点在于它能够通过纯文本描述生成类似的图像。2021年与DALL-E同时公布的还有CLIP（Contrastive Language-Image Pre-training，对比式图文预训练）大模型，这是一个独立于DALL-E之外的并行大模型，主要用于理解输出图像并为其打分。DALL-E生成图像后还有要由CLIP模型进行筛选，以保证绘制图像的质量。

2022年4月，OpenAI宣布了新一代产品DALL-E 2，表示它可以从文本描述中生成照片级的图像，是一个“可以从文本描述中生成原创、逼真的图像和艺术”的产品，另外还有一个配套的编辑器，允许对绘图进行简单修改。虽然DALL-E 2是新产品，但有时仍会犯一些人类不常犯的错误，比如“一本黄色的书与一个红色的花瓶”和“一本红色的书与一个黄色的花瓶”，面对这种绕口令似的提示词时DALL-E 2就非常容易混淆。

时隔一年半左右，DALL-E 3即将面世，虽然目前仍处于研究预览版本。OpenAI的想法是在十月首先向ChatGPT Plus会员和ChatGPT企业版用户发布，随后再向研究实验机构及其API服务发布。不过，OpenAI并未透露何时或者是否计划发布免费的公开版本，DALL-E 3背后的技术细节和相关论文可能也不会公开。

自消息公布以来，关于DALL-E 3与Midjourney孰优孰劣的话题迅速就引起了各界的争论。X（之前的推特）用户@MattGarciaEth已经将二者生成的图片进行了很多比较。具体结果也是见仁见智，此处不予置评。

提示词“一个鳄梨坐在治疗师的椅子上，说‘我只是觉得内心很空虚’，中间有一个坑大小的洞。”

提示词“一颗由半透明玻璃制成的人心，矗立在惊涛骇浪中的基座上。”

OpenAI称在DALL-E 3的开发上投入了大量精力，包括强力的安全措施以防止生成有害内容。OpenAI表示通过与外部的“红队”成员（一个系统测试团队，用故意试图破坏的办法测试系统的安全性）合作，同时加入了输入分类器的协作，这是一种训练大模型忽略某些单词以避免显式或暴力提示词的方法。此外，DALL-E 3也无法生成公众人物的图像，以及在世艺术家风格的图像，这一点是相比前代很大的不同。

过去曾介绍过，有艺术家社区曾起诉Stability AI和Midjourney，以及艺术网站DeviantArt，指控使用他们拥有版权的作品来训练文生图大模型。前不久OpenAI也差点面临类似的麻烦，此次将允许艺术家将其作品从未来版本的文生图大模型中删除，不用于训练。创作者可以提交一张他们拥有版权的图片，并在网站上填写表格要求将其移除。这样，未来的DALL-E 3上线时就可以屏蔽与艺术家的图像和风格相似的结果。

Tags：ChatGPT 点击:() 评论:()

声明：本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,不构成投资建议。投资者据此操作，风险自担。如有任何标注错误或版权侵犯请与我们联系，我们将及时更正、删除。

▌相关推荐

ChatGPT官宣免注册，全球互联网变天！OpenAI将取代谷歌搜索？

新智元报道编辑：编辑部【新智元导读】OpenAI这份愚人节礼物，实在是太大了：今天起，ChatGPT不用注册，可以直接使用。用户狂欢，竞品颤抖，我们仿佛已经听到，谷歌搜索引擎这位巨人轰然倒...【详细内容】

2024-04-02　　Search: ChatGPT 点击:(8)　　评论:(0)　　加入收藏

无需注册！OpenAI宣布放开ChatGPT使用限制

工智能初创公司OpenAI宣布，即日起用户无须注册即可开始使用ChatGPT的功能。OpenAI在最新公告中写道：“让ChatGPT等工具广泛可用，让人们能够体验到人工智能的好处，这是我们使命的...【详细内容】

2024-04-02　　Search: ChatGPT 点击:(6)　　评论:(0)　　加入收藏

ChatGPT 突然放开了账户限制，面向所有人开放

大门终于打开。奥特曼 OpenAI 的旗舰产品 ChatGPT 突然宣布：将面向所有人开放，无论你有没有注册账户。从今天开始，访问 Chat.openai.com 将不再要求用户登录，用户将直接进入与 C...【详细内容】

2024-04-02　　Search: ChatGPT 点击:(3)　　评论:(0)　　加入收藏

今天起，ChatGPT无需注册就能用了！

　来源：量子位　　　　金磊克雷西发自凹非寺　　就在刚刚，OpenAI狠狠地open了一把：从今天起，ChatGPT打开即用，无需再注册帐号和登录了！　　像这样，直接登录网站，然后就可以开启对...【详细内容】

2024-04-02　　Search: ChatGPT 点击:(7)　　评论:(0)　　加入收藏

ChatGPT之父Altman两小时对谈，首聊GPT-5何时发布、llya去哪里了、Q*究竟是什么

Altman做客油管博主Lex Fridman科技博客，被追问了一个又一个辛辣的问题。长达两个小时的对谈，奥特曼从OpenAI宫斗、马斯克诉讼、Sora，一直聊到AGI与外星文明！本文重点梳理了长...【详细内容】

2024-03-20　　Search: ChatGPT 点击:(8)　　评论:(0)　　加入收藏

ChatGPT主管最新访谈：未来AI和人类如何共处？

Peter Deng在最新访谈中表示：AI不会取代生产力，人类和AI只有合作才能释放真正潜力，ChatGPT比已知的更强大、最大的挑战在于理解用户需求。当地时间3月13日，OpenAI 消费产品副总...【详细内容】

2024-03-19　　Search: ChatGPT 点击:(11)　　评论:(0)　　加入收藏

ChatGPT日耗电超50万度，大模型或带来“电荒”

未来两年内将由“缺硅”变为“缺电”，马斯克的预言可能正在变成现实。据《纽约客》杂志报道，OpenAI的热门聊天机器人ChatGPT每天可能要消耗超过50万千瓦时的电力，以响应用户的...【详细内容】

2024-03-11　　Search: ChatGPT 点击:(31)　　评论:(0)　　加入收藏

OpenAI新功能：ChatGPT可调用自定义机器人，对话更高效！

近日，知名科技公司OpenAI推出了一项新的功能——“对话中调用（@）自定义聊天机器人”，让用户在对话中无缝切换不同领域的机器人。这一功能的出现，为用户带来了极大的便...【详细内容】

2024-02-02　　Search: ChatGPT 点击:(53)　　评论:(0)　　加入收藏

ChatGPT元年之后，AI重塑世界，人类如何与其“智慧共生”？

过去一年，人工智能（AI）凭借大语言模型的爆火迅速进入大众视野。它比以往任何时候都更强大，也更具亲和力。这不仅给未来生活带来了新希望，也在人们心中蒙上了一层担忧—&mdas...【详细内容】

2024-01-26　　Search: ChatGPT 点击:(77)　　评论:(0)　　加入收藏

年度最热AI应用TOP 50，除了ChatGPT还有这么多宝藏

量子位 | 公众号 QbitAI百模齐发、AI工具乱杀的一年里，谁是真正赢家？ChatGPT访问量遥遥领先位居第一，但单次使用时长没超过平均线。Midjourney访问量年度第四，但下滑量位居第二...【详细内容】

2024-01-02　　Search: ChatGPT 点击:(51)　　评论:(0)　　加入收藏

▌简易百科推荐

藏在AI背后的“吃电狂魔”

人工智能时代的能耗黑洞据估算，到2027年，人工智能行业每年将消耗85~134太瓦时的电力，相当于瑞典或荷兰一年的总用电量。马斯克判断，电力缺口最早可能会在2025年发生，“明年你会看...【详细内容】

2024-04-09　　　　雪豹财经社　　Tags:AI 　点击:(1)　　评论:(0)　　加入收藏

OpenAI和谷歌再起纷争：AI的尽头是内容

日前，纽约时报的一篇报道称，人工智能公司 OpenAI为收集高质量训练数据而开发了一个语音转录模型Whisper。该模型主要用于转录 OpenAI 获取的超过 100 万小时的 YouTube 视频，也...【详细内容】

2024-04-09　　小编也疯狂　　新浪网　　Tags:AI 　点击:(1)　　评论:(0)　　加入收藏

AI产业的灰色暗面：OpenAI、谷歌、META如何搞训练语料

财联社4月7日讯（编辑史正丞）种种迹象显示，目前站在全世界AI领域潮头浪尖的这些公司，早在几年前就已经陷入对训练语料的“绝望”追逐中——为此他们不惜修改政策条款...【详细内容】

2024-04-09　　　　财联社　　Tags:AI产业　点击:(1)　　评论:(0)　　加入收藏

和“数字人”交朋友，当心隐私被出卖......

在虚拟社交中如何在保护用户隐私和数据安全的同时提供高质量的社交体验？如何避免过度依赖虚拟社交找到虚拟与真实之间的平衡点？《中国消费者报》记者就此展开了调查APP里有个...【详细内容】

2024-04-09　　　　中国消费者报　　Tags:数字人　点击:(2)　　评论:(0)　　加入收藏

AI“复活”成产业链：成本可降至数百元

大模型应用落地，带火数字人(11.560, 0.29, 2.57%)赛道。文|《中国企业家》记者李艳艳实习生孙欣编辑|姚赟头图来源|《流浪地球2》电影画面截图清明节前，预估会有需求的庞立...【详细内容】

2024-04-09　　　　中国企业家　　Tags:AI“复活” 　点击:(2)　　评论:(0)　　加入收藏

多方热议人工智能产业新机遇

编者按&emsp;&emsp;从前沿科技展会到高层对话平台，从上海、重庆到博鳌，从线上到线下……一场场高规格、大规模的盛会中，人工智能正在成为各界热议的高频词。赋能千...【详细内容】

2024-04-08　　　　中国家电网　　Tags:人工智能　点击:(4)　　评论:(0)　　加入收藏

人形机器人时代来了吗

日前，由中国人形机器人(11.080, -0.05, -0.45%)百人会主办的人形机器人大赛在北京经济技术开发区开赛。工作人员向参观者展示一款人形机器人。参观者与一款陪护型人形机器人...【详细内容】

2024-04-08　　　　中国青年报　　Tags:人形机器人　点击:(5)　　评论:(0)　　加入收藏

AI重塑社交：腾讯与字节跳动的新赛场

文|新火种一号编辑|美美最近，腾讯和字节跳动这两大互联网巨头几乎同步推出了各自的AI社交产品，尽管腾讯和字节跳动在前段时间刚刚“破冰”，但这一举措不仅意味着这两大巨头之...【详细内容】

2024-04-07　　　　蓝鲸财经　　Tags:AI 　点击:(8)　　评论:(0)　　加入收藏

第一批用 Kimi 做内容的网红已经杀疯了

作者：王东东文章来自：斗战圣佛小组技术信仰派 VS 市场信仰派朱啸虎和月之暗面老板杨植麟在前几天有一场不算 battle 的 battle。battle 的争论点是：大模型有没有戏。技术派...【详细内容】

2024-04-04　　　　斗战圣佛小组　　Tags:Kimi 　点击:(4)　　评论:(0)　　加入收藏

昆仑万维发布面向人工智能时代的六条人才宣言

过去的一年多，是人工智能取得非凡进步的一年。在这充满突破性技术飞跃和备受争议的一年里，我们见证了人工智能的快速发展和广泛的影响，人工智能已经迅速地融入了我们的生活，深刻...【详细内容】

2024-04-03　　　　砍柴网　　Tags:昆仑万维　点击:(7)　　评论:(0)　　加入收藏

推荐资讯

“龙年龙月龙日龙时”	20元引发的官司：“仅退
网约车抽成“套路”多	A股分拆上市密集改道：
探访“中国黄金第一家	藏在AI背后的“吃电狂
看1280份年报：大消费复	美联储年内可能不降息