伴随着AI大模型的迅速发展,除了AI聊天机器人ChatGPT的用户量暴增之外,现象级AI绘画工具Midjourney也引起巨大关注。该软件不仅可以生成现代风格的图像,还可以模拟不同年代和地域的场景。比如“一个穿着汉服、手持扇子、坐在亭子里看书的女子”,或者“一个穿着牛仔裤、背着吉他、走在纽约街头的男孩”。它还可以根据用户指定的风格参数来调整图像效果。
然而,掀起这一现象级AI浪潮的公司,并不是财大气粗的互联网大厂,而是一家仅有十余名员工的微小初创企业。
简单的盈利模式赚取上亿收入
根据Midjourney公司网站的介绍,该公司是一个小型的自筹资金团队,只有11名全职员工。其创始人大卫·霍尔茨(David Holz)曾创办了Leap Motion公司,还曾担任NASA以及马克斯普朗克研究所的研究员。
Transformer架构的出现让多模态深度学习整合自然语言处理(NLP)和计算机视觉成为图像合成的艺术方法,Midjourney公司由此诞生。
Midjourney的网站显示,该公司多目标之一是建造新的人类基础设施。霍尔茨坚信:AI不是现实世界的复刻,而是人类想象力的延伸。
霍尔茨从Leap Motion的创业经验中学到很多,尤其是在设计产品时。他表示,永远不要试图去凭空设计一个完整的产品体验,你只需要找到十个看似无关的体验,选择其中最酷的三个,把它们放在一起,然后在细节上进行完善,让人们觉得它有深度并喜欢上它,好的产品就是这样一步步做起来的。
Midjourney的盈利模式十分简单,通过付费订阅的商业模式,按月向用户收取费用,其标准有3种套餐,分别是10/30/60美元/月。在霍尔茨看来,付费订阅是最诚实的商业模式。而这也为公司赚取了每年上亿美元的营收。
“我想把它做成付费业务的原因之一是,我觉得这是最诚实的商业模式。这就像我在编写基础设施,你在为基础设施付费,用利润来支付一个团队。”霍尔茨表示。
起初,Midjourney的大部分客户都是高级客户,然而这也限制了公司的营收。“事实上你不需要那么高的利润率,后来我们就把利润率降低了,这样也使得我们赢得了更多客户。”霍尔茨说道。
一位投资人告诉第一财经记者,从Midjourney看似不可思议的创业经历中可以发现,每一次科技变革的浪潮中,真正能够脱颖而出的企业、团队,未必是财大气粗的头部大厂。他认为,原创的思维是最重要的,同时团队还需要很强的执行力。
成功并非凭借“一己之力”
霍尔茨曾在采访中说道:“我不需要风险投资,因为人们知道我是谁。我不需要去找任何人,向他们解释我的业务是什么,这是一个巨大的优势,是一个已知的技术因素。”
他举例称,当公司需要找一个云供应商提供10000块GPU的算力支撑时,他给供应商负责人发电子邮件表明自己正在做一件“大事”,他就获得了所有希望得到的资源。
第一财经记者发现,与Midjourney同样重要的是Stable Diffusion开源项目,这两种算法可以用来处理同一幅图片。而Midjourney的算法通常会在图像处理的后期阶段应用。
Stable Diffusion背后还有两家技术顶尖的AI初创公司的支撑,Stability AI和Runaway。其中Stability AI公司过去一年购买的英伟达A100芯片数量增加至5400个,训练总时长达20万个小时。
训练大型语言模型需要大量GPU,这些GPU还能进行“推理”。拥有热门AI产品的公司通常需要购买更多GPU来处理峰值期间的数据或用于模型的改进。谷歌公司也表示,Midjourney使用谷歌的AI系统训练其模型。
Midjourney的成长过程中,另一个不得不提的是游戏社交平台Discord。Midjourney将其整个交互都搭载在Discord中,目前已经积累了1000多万用户。但Midjourney直到今天也没有自己的App。
根据官方数据,Discord的新增用户中有10%是为了体验AI功能,每月在Discord使用AI功能App的用户数超过3000万,Discord中包含AIGC相关功能的服务器数量已经超过了300万个。
Midjourney在Discord上的这种“寄生”关系也引起了行业的诟病,甚至有人视其为“AI浪潮中的投机分子”。对此,霍尔茨已经表示,从长远来看,Midjourney将拥有自己的网站,自己的用户界面,虽然现在公司不需要花费时间来构建整个用户界面。
一位AIGC领域创业者对第一财经记者表示:“Midjourney整个应用都是架设在Discord之上,可以看作是Discord的一个插件,或者Bot。由于Midjourney驱动得早,现在又赶上好时机,基于Discord的用户基础,积累了大量用户偏好数据来让模型生成的更好看。”
上述人士还称,目前大部分生成式图像技术都不是自研的,都是基于开源方案。他推测Midjourney V5使用了大量私有数据集和算法改良了模型。“从Disco Diffusion到Stable Diffusion,这些开源项目帮助了一些企业及时抓住这一波生成式AI离C端最近的应用点,再依赖Discord平台,以最快的速度传播、更新,收集反馈,数据飞轮就转起来了。”他说道。
他还认为,Midjourney这类现象级应用虽然在商业上已经取得成功,但是由于缺乏底层的自研技术,因此很难成为下一个微软或者Adobe,Stability AI或者Runway这样的公司更有机会。
不过,Midjourney的航程也许刚刚启航。公司把自己的logo设计成一艘船在水上航行。霍尔茨把人工智能比作水,他表示:“水虽然有危险,但你也可以在水里游泳,你可以制造船只,可以用水发电。”在他看来,水是文明的驱动力,因为“当你发现一个新的水源时,这真的是一件好事”。