记者/佘晓晨
2022年的最后一个月,聊天机器人模型ChatGPT的横空出世再次搅热了AI行业。
在和ChatGPT对话的过程中,这个AI模型不仅“上知天文,下知地理”,还可以模拟人类说话的方式和人类交互,告诉你怎么用“鲁迅体”描述当下的心情。
而在惊叹于ChatGPT强大的对话能力之前,多数行业外的人鲜少关注过其背后的公司OpenAI。
公开资料显示,OpenAI是一个人工智能研究实验室,总部位于旧金山。2015年,马斯克(SpaceX创始人)、山姆·奥特曼等人联合创办了OpenAI,该实验室也在2019年3月成立了用于营利的子公司。除了马斯克,微软也在2019年7月投资了10亿美元给OpenAI。
回顾AI发展史,上一次AI机器人带来的轰动还是来自于AlphaGo和人类之间的博弈。
2016年,由谷歌旗下DeepMind研发的人工智能程序AlphaGo以4:1击败韩国围棋冠军李世石,成为第一个战胜围棋世界冠军的人工智能机器人,引发全球范围内的关注。
当ChatGPT出现在大众视野后,很多人将其视为DeepMind的新对手,甚至有观点认为,其威胁到了谷歌的搜索引擎业务。这不禁让人思考,国内外的大公司们为什么没有做出这样的产品?在上一波AI浪潮里,从国外的谷歌、Meta到国内的阿里、腾讯、百度,没有一家公司不曾涉足AI研究。
GPT全称为Generative Pre-trained Transformer,是一种基于互联网可用数据训练的文本生成深度学习模型,用于问答、文本摘要生成、机器翻译、分类、代码生成和对话AI。而在OpenAI的ChatGPT模型中,其首次采用了RLHF(从人类反馈中强化学习)方式,能够记住与用户之前的对话和给它的提示。
在已经做出类似成果的大公司中,谷歌、Meta和百度都在生成式AI上做出了一些产品。就在前不久,DeepMind发布了新的人工智能聊天机器人Sparrow。开发团队表示,他们设计这款聊天机器人的目的是“与用户交谈,回答问题,并在必要的时候使用谷歌来查找证据,解释其回复”。
不仅是谷歌,Meta也推出了人工智能聊天机器人BlenderBot。在国内,百度持续在大模型研发上投入,基于大规模知识和海量无结构数据融合学习、深度学习,其研发的文心大模型主要致力于实现视频、歌词、艺术画等作品的自动生成。
但作为一家成立仅7年的公司,OpenAI在模型能力上已经处于领先地位,并持续将此作为主业发展。2018年起,OpenAI开始发布生成式预训练语言模型GPT。2020年6月,OpenAI发布GPT-3,参数量达到了1750亿,直接推动了行业内预训练大模型的发展。
在OpenAI获得微软的投资后,这家公司还通过对外两家投资巩固自身的研发能力。OpenAI的论文指出,相对GPT-3,此次公布的ChatGPT增加了“监督微调”和“奖励模型”,回答更加智能。
相比之下,即使是以上提到的大厂,也并未把生成式AI作为核心业务发展,更不用说其他抢占赛道却尚未公布成果的公司。
实际上,国外的大模型开源生态建设领先于国内,而业内人士指出,大公司在大模型上的开源开放至关重要。但现阶段,摆在大公司面前的难题或许是成本和商业落地的矛盾。
OpenAI CEO山姆·奥特曼近日在社交媒体称,ChatGPT每回答一个问题的平均费用可能只有几美分,未来还会继续降低。但他也表示,ChatGPT背后的算力成本极高,每次训练AI的成本高昂,因此免费测试只是暂时,未来某个时刻一定会转为付费服务。据他透露,目前ChatGPT的用户量已经超过百万。
在ChatGPT引发热潮后,多位行业人士也在近期指出,从GPT到GPT3,模型的优化主要依赖于算力的增加,不可避免地带来成本的上升。事实上,OpenAI可能也在投入巨大成本时有过迟疑。早期,这家实验室是AI研究方面的非营利机构,直到2019年才开始有盈利目标,成立营利性子公司。
更重要的是,在模型演进的过程中,生成式AI的商业化落地并没有同步发展。东吴证券在研报中指出,ChatGPT无法取代搜索引擎,其本质仍偏向AIGC内容生产工具,原因是该模型仍无法很好解决提供虚假信息的问题,甚至过度猜测用户意图导致回答偏差较大,但其或将对搜索引擎产生一定冲击。
以百度为例,尽管近年来文心大模型的能力不断增强,其主要应用场景仍为AIGC业务,例如AI写诗、AI作画等,商业化场景仍然有待探索。
需要不断烧钱才能到达的技术高度,加上长时间不明朗的商业前景,成为影响大厂投入并获得产出的重要原因。他们更倾向于投资OpenAI这样的公司而非全情投入,以保证自己承受一定范围内的冒险。不过,ChatGPT在C端用户中的火爆的确提振了行业的信心,在AIGC风靡全球的背景下,或许我们可以期待它打开一扇新的AI大门。