作者 | 云昭、王瑞平
中国版ChatGPT的厮杀时刻终于来了!现在,但凡听到有新的大模型发布,不管是实景演示,还是录制Demo,无一例外都带有ChatGPT的味道。
其实,前几年,大模型已经在国内名声大躁。只不过,今年尤其不一般!今年大模型的发布,更像是类ChatGPT产品的入围战!
前有黄仁勋的“iphone时刻”,后有昨天王小川“恍如隔世”,围绕ChatGPT的国产大模型,终于开始四处井喷式地爆发了!两天内,商汤科技、昆仑万维、阿里巴巴,正式推出自己版本的ChatGPT。宣称要打造中国AI target=_blank class=infotextkey>OpenAI的“王慧文”们,也如雨后春笋般涌现。
都知道做ChatGPT很难,但更难的好像是如何拥有不同特色的ChatGPT。今天就带领大家一起,看看这家公司对于打造自己的ChatGPT,是如何思考这个问题的。
被大厂盯上的“ChatGPT”在最近火出圈了,也可以说是火爆全网。当下,受关注度最高的要数算力储备最足阿里的“通义千问”模型。
就在今天上午,刚宣布“拆分”阿里大动作之后的阿里董事会主席兼CEO张勇,现身“2023阿里云峰会”的主题演讲,宣布:阿里所有产品未来将接入大模型全面升级。
这也就意味着,天猫、钉钉、高德地图、淘宝、优酷、盒马等这些为大家所熟知的应用,都将开启“ChatGPT”时刻。
“通义千问”是超大规模的语言模型,功能包括:多轮对话、文案创作、逻辑推理、多模态理解、多语言支持。
值得注意的是,该模型能够跟人类进行多轮交互,也融入了多模态的知识理解,且有非常强的文案创作能力,能够续写小说、编写邮件等,可以极大程度的增加工作效率。
不同于此前的模型发布会,阿里云峰会上公布了企业专属大模型的生成案例,只需要通过外部系统接口提供一些文档,就可以生成企业专属的模型。
总之,就语言模型本身而言它具有“三个轴”,即,语言大模型、多模态、外部系统接口。
如达摩院智能计算实验室大模型负责人周畅所说,外部系统接口的加入,可以让大模型不止是被动调用的工具,而是能主动“使用”的工具。
可以看出,对待大模型,阿里的设想十分恢弘:不止面向C端“重写应用”,面向B端,“外部系统接口”成为阿里的一张向合作伙伴和客户展示的AI名片。
作为AI四小龙中首家上市的商汤科技而言,大模型远远不够。4月10日,在商汤科技举办的技术交流日中,发布了商汤以“大模型+大算力”推进AGI(通用人工智能)发展的战略布局,并公布了商汤在该战略下的“日日新SenseNova”大模型体系,推出自然语言处理、内容生成、自动化数据标注、自定义模型训练等多种大模型及能力。
也就是说:AGI基础设施布局以及大模型体系,才是商汤对于这场大模型角逐赛中选择的方向。
值得一提的是,活动现场,商汤版ChatGPT“商量 SenseChat”展示了多轮对话和超长文本的理解能力。此外,还展示了语言大模型支持的几项创新应用,包括:AI代码助手,可帮助开发者更高效地编写和调试代码;健康咨询助手,为用户提供个性化的医疗建议;PDF 文件阅读助手,能轻松从复杂文档中提取和概括信息。
其中的“AI代码助手”在公司内部实测中,它将代码编写效率提高了62%,在测试集上的一遍通过率达40.2%。
同时,商汤科技CEO徐立还提出了“新的软件开发范式”,即未来80%的代码将由AI生成,实现“AI for AI”。
此外,商汤科技负责人提出了类似的“二八定律”,即未来80%的基础代码将由人工智能自动生成,仅有20%需要人工手动调试。
此外,“日日新”为政企客户提供了多种灵活的API接口和服务,包括:图片生成,自然语言生成,视觉感知通用任务与标注服务。
客户可根据实际应用需求,调用“日日新SenseNova”大模型的各项AI技术能力,低门槛、低成本、高效率地实现各类AI应用。
用大模型改造产品,已经成为当前圈内炙手可热的话题,昆仑万维公司也不甘示弱,这不,“天工”大模型也即将启动邀测。
4月10日,昆仑万维宣布,由昆仑万维和奇点智源合作自研、中国第一个真正实现智能涌现的国产大语言模型——“天工”3.5发布在即,并将于4月17日启动邀请测试。
昆仑万维相关负责人表示:“模型已经非常接近ChatGPT的智能水平。它的实际表现如何,敬请期待4月17日。”
据官微介绍,昆仑万维从2020年开始布局AIGC领域,致力于AIGC模型算法上的技术创新。
昆仑万维对于大模型之战中,剑走偏锋,采用开源的战略躬身入局。开源是个大杀器,是商业模式的有益补充。Github上的昆仑天工模型意味着一种理念:大模型不止需要巨头的投入,同样需要更多的开发者和AI机构参与进来,才能保持大模型的持续演进。
https://github.com/SkyWorkAIGC
4月10日真是个“吉日”,这一天有关AI的消息属实多。这天,搜狗公司创始人王小川正式宣布开始“大模型”创业,与前搜狗COO茹立云联合创立人工智能公司——百川智能,致力于打造出一家研发并提供通用人工智能服务的中国公司,旨在打造出中国版的OpenAI基础大模型及颠覆性上层应用。
先前,公司已获得5000万美元启动资金,来自王小川与其业内好友的个人支持。团队拥有包括前搜狗、百度、华为、微软、字节、腾讯等知名科技公司以及其他创业公司核心成员在内的数十位顶尖AI人才。
王小川认为ChatGPT其实与搜狗输入法、搜索的产品形态接近,都是互联网数据清洗压缩成数据库并构建成产品,并表示ChatGPT是把全网数据转化成语言服务的超级产品。
“ChatGPT发布到今天,仅仅131天,每天都有扑面而来的新进展、新突破。131天恍如隔世!”
关于百川智能的定位和使命,王小川在公开信中如是说:百川智能将借助语言AI的突破,构建中国最好的大模型底座,并在搜索、多模态、教育、医疗等方面增强,帮助大众轻松、普惠的获取世界知识和专业服务。
其实,大模型的暴力美学并不是一朝就得到认可的,狂堆算力,猛堆模型参数的做法也并不是一开始就得到业内人士的广泛认可。
直到在ChatGPT的到来之后,人们才发现大模型涌现的理解推动能力,是多么的不可思议。
这个阳春时节,AI之花开满堂,大有“满堂花醉三千客”的盛景。继百度“文心一言”发布不到一月的时间,包括互联网巨头、AI企业、AI研究机构、初创企业等在内都纷纷发布自己的类ChatGPT产品。各个玩家的大模型相继涌现,争芳斗艳。
李开复曾不吝于表达对于当下AI2.0时代的赞许,并表示在ChatGPT的叙事中,任何行业、任何产品都即将重写。
当然,有踩油门的语境,就会有慢刹车的篇章。就在发稿前的6小时前,大洋彼岸传来消息:OpenAI、微软、谷歌、苹果等多家科技巨头已经马不停蹄地开始研究负责任的AI使用标准了,就在明天,各家将派出代表进行研讨!
那么,对于中国版ChatGPT的未来,诸君有何期待?