您当前的位置:首页 > 电脑百科 > 人工智能

AI绘图模型不会写字的难题,被阿里破解了

时间:2024-01-01 11:07:42  来源:量子位  作者:

量子位 | 公众号 QbitAI

能准确写汉字的AI绘图工具,终于登场了!

包括中文在内一共支持四种语言,而且还能文字的位置还能任意指定。

从此,人们终于可以和AI绘图模型的“鬼画符”说再见了。

AI绘图模型不会写字的难题,被阿里破解了

这款名为AnyText的绘图工具来自阿里巴巴,可以按照指定位置精准地向图中加入文字。

此前的绘图模型普遍无法准确地向图中添加文字,即便有也很难支持像中文这样结构复杂的文字。

而目前Anytext支持中英日韩四种语言,不仅字形准确,风格也可以与图片完美融合。

AI绘图模型不会写字的难题,被阿里破解了

除了可以在绘制时加入文字,修改图片中已有的文字,甚至向其中加字也都不是问题。

AI绘图模型不会写字的难题,被阿里破解了

究竟AnyText效果如何,我们也实际体验了一番。

各种风格轻松驾驭

官方在Github文档中提供了AnyText的部署教程,也可以在魔搭社区中体验。

此外还有网友制作了PyTorch笔记,可以在本地或Colab中一键部署,我们采用的也是这种方式。

AI绘图模型不会写字的难题,被阿里破解了

AnyText支持中英文Prompt,不过从程序日志来看,中文提示词会被自动翻译成英文。

比如我们想让AnyText给马斯克换上一件白色T恤,让他来给量子位(QbitAI)打个call。

只需要输入提示词,然后设定文本的位置,然后直接运行就可以了。

AI绘图模型不会写字的难题,被阿里破解了

如果需要调整尺寸等参数,可以将上方的菜单展开;如果不会操作,页面中还附有中英双语教程。

AI绘图模型不会写字的难题,被阿里破解了

最终,在搭载V100的Colab上,AnyText用了10多秒绘制出了四张图片。

效果还是不错的,不论是图本身还是文字,看上去都没有什么破绽。

AI绘图模型不会写字的难题,被阿里破解了

而且各种文字材质AnyText都能准确模仿,比如黑板上的粉笔字,甚至是传统书法……

AI绘图模型不会写字的难题,被阿里破解了

街景中的文字,甚至是电商促销海报,都难不倒AnyText。

AI绘图模型不会写字的难题,被阿里破解了

而且不仅是平面上各式各样的文字,立体风格同样也不在话下。

AI绘图模型不会写字的难题,被阿里破解了

而其中的文本编辑功能,还可以修改已有图片中的文字,几乎不会留下破绽。

AI绘图模型不会写字的难题,被阿里破解了

在测试当中,AnyText也是取得了不错的成绩——无论是中英文,准确度都显著高于Contro.NET,FID误差也大幅减少。

此外,如果自行部署,还可以对字体进行自定义,只需准备好字体文件并对代码简单修改就可以了。

AI绘图模型不会写字的难题,被阿里破解了

那么,研究人员是怎样让AnyText学会写字的呢?

文本渲染独立完成

AnyText是基于扩散模型开发的,主要分为两个模块,文字生成的过程是相对独立的。

这两个模块分别是隐空间辅助模块文本嵌入模块

AI绘图模型不会写字的难题,被阿里破解了

其中,辅助模块对字形、文字位置和掩码这三种信息进行编码并构建隐空间特征图像,用来辅助视觉文字的生成;

文本嵌入模块则将描述词中的语义部分与待生成文本部分解耦,使用图像编码模块单独提取字形信息后,再与语义信息做融合。

在实际工作过程中,嵌入的文本输送给绘图模块时被用星号代替,在嵌入空间预留位置并用符号填充。

然后文本嵌入模块得到的字形图像被输入预训练OCR模型,提取出字形特征,然后调整其维度并替换预留位置中的符号,得到新的序列。

最后,这个序列表示被输入到CLIP的文本编码器中,形成最终指导图像生成的指令。

这种“分而治之”的方式,既有助于文字的书写精度,也有利于提升文字与背景的一致性。

此外,AnyText还支持嵌入其他扩散模型,为之提供文本生成支持。

论文地址:

https://arxiv.org/abs/2311.03054



Tags:AI绘图   点击:()  评论:()
声明:本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,不构成投资建议。投资者据此操作,风险自担。如有任何标注错误或版权侵犯请与我们联系,我们将及时更正、删除。
▌相关推荐
AI绘图模型不会写字的难题,被阿里破解了
量子位 | 公众号 QbitAI能准确写汉字的AI绘图工具,终于登场了!包括中文在内一共支持四种语言,而且还能文字的位置还能任意指定。从此,人们终于可以和AI绘图模型的“鬼画符”说再...【详细内容】
2024-01-01  Search: AI绘图  点击:(124)  评论:(0)  加入收藏
AMD显卡也能“炼丹”?实战DirectML加速AI绘图
众所周知,随着AIGC相关技术最近这一两年快速成熟,也使得AI绘图早已经不再仅仅是部分PC发烧友或AI爱好者的“玩具”。例如在一些游戏里,现在已经可以看到AI绘制的角色或是AI设计...【详细内容】
2023-11-20  Search: AI绘图  点击:(173)  评论:(0)  加入收藏
AI绘图,全面封杀!
ChatGPT很久没有大消息了。仿佛人们对人工智能的一切幻想,都归于平静。但实际上,它也许正在某个不起眼的角落,迅速改变互联网、乃至现实社会的生态。最近,一场突如其来的神秘事...【详细内容】
2023-09-18  Search: AI绘图  点击:(249)  评论:(0)  加入收藏
AI绘图的“领头羊”,Midjourney创始人霍尔茨谈人工智能
[环球时报特约记者 甄翔]在今年取得突破性进展的人工智能模型,不仅有能与人聊天的自然语言处理工具,还有能接收文字指令产出对应图片的人工智能绘画软件。其中,最具影响力的是...【详细内容】
2023-05-06  Search: AI绘图  点击:(295)  评论:(0)  加入收藏
AI绘图之HYPERNETWORK模型
HYPERNETWORK是一种可以生成神经网络架构的模型,它可以用来生成各种类型的神经网络。在AI绘画中,HYPERNETWORK可以用来生成一些高分辨率、高质量的图像。具体来说,HYPERNETWORK...【详细内容】
2023-03-10  Search: AI绘图  点击:(390)  评论:(0)  加入收藏
Stable Diffusion AI绘图,如何画出高质量的图
如何才能让AI绘制出高质量的图,这里有两个重要地方:选取合适的描述词参数。 选用适当的模型,这里的模型指Checkpoint模型和LoRA模型。下面首先就描述词参数加以说明,描述词参数...【详细内容】
2023-03-09  Search: AI绘图  点击:(430)  评论:(0)  加入收藏
几天不见,AI绘图已经比真人还逼真了?
文/风寒前些日子和朋友谈起隔壁漫展的事情,不知怎么话题就转到了AI绘图。一说起这个他就来劲了:“你发没发现,最近这些擦边博主发的图大多都是AI绘图了?”说来也不奇怪,最近AI出...【详细内容】
2023-02-16  Search: AI绘图  点击:(241)  评论:(0)  加入收藏
▌简易百科推荐
多方热议人工智能产业新机遇
编者按  从前沿科技展会到高层对话平台,从上海、重庆到博鳌,从线上到线下……一场场高规格、大规模的盛会中,人工智能正在成为各界热议的高频词。赋能千...【详细内容】
2024-04-08    中国家电网  Tags:人工智能   点击:(4)  评论:(0)  加入收藏
​人形机器人时代来了吗
日前,由中国人形机器人(11.080, -0.05, -0.45%)百人会主办的人形机器人大赛在北京经济技术开发区开赛。工作人员向参观者展示一款人形机器人。参观者与一款陪护型人形机器人...【详细内容】
2024-04-08    中国青年报  Tags:​人形机器人   点击:(4)  评论:(0)  加入收藏
AI重塑社交:腾讯与字节跳动的新赛场
文|新火种 一号编辑|美美最近,腾讯和字节跳动这两大互联网巨头几乎同步推出了各自的AI社交产品,尽管腾讯和字节跳动在前段时间刚刚“破冰”,但这一举措不仅意味着这两大巨头之...【详细内容】
2024-04-07    蓝鲸财经  Tags:AI   点击:(7)  评论:(0)  加入收藏
第一批用 Kimi 做内容的网红已经杀疯了
作者:王东东 文章来自:斗战圣佛小组技术信仰派 VS 市场信仰派 朱啸虎和月之暗面老板杨植麟在前几天有一场不算 battle 的 battle。battle 的争论点是:大模型有没有戏。技术派...【详细内容】
2024-04-04    斗战圣佛小组  Tags:Kimi   点击:(4)  评论:(0)  加入收藏
昆仑万维发布面向人工智能时代的六条人才宣言
过去的一年多,是人工智能取得非凡进步的一年。在这充满突破性技术飞跃和备受争议的一年里,我们见证了人工智能的快速发展和广泛的影响,人工智能已经迅速地融入了我们的生活,深刻...【详细内容】
2024-04-03    砍柴网  Tags:昆仑万维   点击:(7)  评论:(0)  加入收藏
AI干掉声优?音频大模型追逐“图灵时刻”
七十年前,“人工智能之父”图灵提出,如果人无法判断屏幕的另一侧究竟是人还是机器,就证明机器具备了人一样的智能。这一经典的图灵测试如同北斗星一般,指引着AI行业的工作者们不...【详细内容】
2024-04-03    第一财经网  Tags:AI   点击:(5)  评论:(0)  加入收藏
生成式人工智能有哪些新趋势?
相较于去年,当下我们所能体验的人工智能技术的范围已经大幅提升。从搜索引擎、电商平台再到社媒平台,只要是以搜索结果为导向的内容,都会出现它的身影。但其实,人工智能的应用场...【详细内容】
2024-04-03  品谈教师帮    Tags:人工智能   点击:(6)  评论:(0)  加入收藏
AI世界的新难题:互联网的信息不够用了!
高质量数据的紧缺正成为AI发展的重要障碍。4月1日,据媒体报道,随着OpenAI、Google等企业不断深入发展AI技术,科技巨头们遇到了一个新问题:现有的互联网信息量可能不足以支撑他们...【详细内容】
2024-04-02  硬AI    Tags:AI   点击:(6)  评论:(0)  加入收藏
今天起,ChatGPT无需注册就能用了!
 来源:量子位    金磊 克雷西 发自 凹非寺  就在刚刚,OpenAI狠狠地open了一把:从今天起,ChatGPT打开即用,无需再注册帐号和登录了!  像这样,直接登录网站,然后就可以开启对...【详细内容】
2024-04-02    量子位   Tags:ChatGPT   点击:(7)  评论:(0)  加入收藏
AI时代,面对死亡有了第二种选择?
今年春节期间,罗佩玺瞒着妈妈用AI技术“复活”了外婆,她将妈妈现在的模样和外婆留下的老照片合成在一起。时隔60多年,妈妈和外婆终于又“见面”了,这是她送给妈妈的生日礼物。收...【详细内容】
2024-04-02    中国青年报  Tags:AI时代   点击:(7)  评论:(0)  加入收藏
站内最新
站内热门
站内头条