作者:范剑磊
界面新闻记者 | 徐诗琪
4月10日,AI圈依旧热闹非凡,多家公司宣布将推出自有大语言模型,包括昆仑万维、商汤以及王小川的百川智能。
今日下午,A股上市公司昆仑万维(300418)发布公告称,公司和奇点智源合作自研的“天工”3.5发布在即,将于4月17日启动邀请测试。公司自称这将是“中国第一个真正实现智能涌现的国产大语言模型”,并且已经非常接近OpenAI ChatGPT的智能水平。2月,公司曾表示这款中国版类ChatGPT产品会将代码开源。
昆仑万维还提及了友商百度的文心一言产品,推断称,“其模型的逻辑推理是靠定向优化来覆盖特定题库,不是靠大模型的智能涌现来解答较为复杂的问题,而靠人工打补丁、定向优化的方式是不能真正实现人工智能的。”
公司称研发团队2020年起从一亿级模型做起,现已做到百亿级模型。所谓百亿级,是指大模型的参数规模,GPT-3的参数规模为1750亿。
昆仑万维成立于2008年,拥有浏览器Opera、海外社交娱乐平台StarX、游戏平台Ark Games及自研游戏。公司此前已在AIGC和元宇宙领域有所布局,并且Opera浏览器此前宣布与OpenAI达成合作。
值得注意的是,昆仑万维此前在投资者互动平台回复“将在今年内发布类ChatGPT产品”后,股价自3月以来涨幅超过80%,因而收到了深交所关注函。当时公司回应称,截至目前,公司AIGC、人工智能等业务产品尚未产生实际收入,预计对公司2023年财务状况不会产生较大影响,并且大模型知识产权由奇点智源所有,若产生收益,公司将分享产品利润的50%。
深交所判定此行为违反创业板相关规定,下发监管函,称公司在回应投资者时“未能客观、完整地介绍和反映公司相关业务的实际情况、对公司业绩的影响及充分提示相关风险。”
除昆仑万维外,商汤也于今日下午举行了技术交流会。其董事长兼CEO徐立宣布,将推出大模型体系“商汤日日新大模型”,包括自然语言生成、文生图、感知模型标注以及模型研发功能,“商量(中文语言模型)”、“秒画(文生图)”、“如影(数字人视频生成)”、“琼宇(场景生成)”,“格物(物体生成)”。
徐立介绍称,“商量”是一个1800亿参数的中文大语言模型,可实现多轮对话、逻辑推理、语言纠错、内容创作、情感分析等,并在现场演示了创作广告语、续写儿童故事、编程等功能。不过,商汤没有公布该大语言模型具体的发布时间。
有趣的是,此前已离开搜狗的王小川也在今日正式宣布加入中文大语言模型竞争。据悉,王小川的“百川智能”早前已经获得了5000万美元启动资金,初步搭建起来自搜狗、百度等技术骨干在内的团队,并在一个月前员工尚未正式入职、完全远程协作的情形下开始了500亿级大模型的训练。
王小川称,年底要做出对标GPT-3.5的大模型,“至少我们能够训练出一个好的千亿模型,钱是够的,到今年年底是够用的,且算力不会有太大问题。”他表示,四月底团队将有50人,原搜狗团队占比不到一半。
不过,与上述大模型圈的热闹不同,今日ChatGPT概念股却迎来普遍下跌。三六零、科大讯飞、云从科技跌停,汉王科技跌9.03%,choice数据“chatGPT板块”指数跌去103.56个点,跌幅达到6.36%。昆仑万维则跌17.25%,商汤(00020.HK)涨2.15%。
有分析人士表示,截至上周TMT板块成交占比突破50%,创下历史新高,市场已有估值泡沫化迹象,今日核心股集体大跌背景下,人工智能板块可能进入阶段性调整。