4月10日下午,商汤科技举办技术交流日活动,分享了以“大模型+大算力”推进AGI(通用人工智能)发展的战略布局,并公布了商汤在该战略下的“日日新SenseNova”大模型体系,推出自然语言处理、内容生成、自动化数据标注、自定义模型训练等多种大模型及能力。
活动现场和直播平台上,有观众表示:“超出预期”“程序员要失业了”。
但也有专业人士发表不同看法。对于商汤科技此次发布的新产品,知名科技作家陈根表示:“商汤从人工智能技术研发与理论研究层面来讲,是有一定的优势,因为有比较庞大的人工智能方面的科研人员。对于商汤而言,有建大模型的能力,但能不能训练出真正的类ChatGPT产品是另外一回事。至少从现实来看,商汤依然面临训练数据、参数优化、硬件算力这三大硬伤。”
图片来源:商汤科技算力需求剧增
商汤科技董事长兼CEO徐立表示:“在AI大模型时代,数据、算法和算力这三要素也在经历新的演变,大模型参数量将以指数级的速率提升,而数据量随着多模态的引入也将大规模增长,因此必然会导致算力需求的剧增。”
据介绍,商汤以AI大装置SenseCore打造AGI时代的基础设施,并基于此将大模型体系命名为“日日新SenseNova”,希望在模型的迭代速度及处理问题的能力上不断解锁AGI的更多可能。
商汤科技表示,大装置上总共有27000块的GPU芯片卡,可以输出5.0 exaFLOPS的总算力,是亚洲目前最大的智能计算平台之一。基于大装置的能力,商汤目前已构建了计算机视觉、自然语言处理、AI内容生成、多模态、决策智能等多个领域的大模型,持续演进能力并广泛支持各种应用。
“AGI催生了新的研究范式,即基于一个强大的多模态基模型,通过强化学习和人类反馈不断解锁基模型新的能力,从而更高效地解决海量的开放式任务。”商汤科技联合创始人、首席科学家王晓刚表示,商汤已建立了全栈的大模型研发体系,并已在多个行业场景中落地。
推出语言大模型“商量SenseChat”
“日日新SenseNova”为政企客户提供了多种灵活的API接口和服务,包括图片生成、自然语言生成、视觉感知通用任务与标注服务。
“日日新SenseNova”也已为商汤的自身业务带来了诸多突破。例如在智能驾驶领域,基于视觉大模型,商汤实现了可识别3000类物体的BEV环视通用感知算法的实车量产,也构建了感知决策一体化的自动驾驶多模态模型,带来更强的环境、行为、动机解码能力。
“日日新SenseNova”也推出了商汤最新研发的语言大模型“商量SenseChat”。作为千亿级参数的自然语言处理模型,“商量SenseChat”使用大量数据训练,并充分考虑了中文语境,能够更好地理解和处理中文文本。活动现场,“商量SenseChat”展示了出色的多轮对话和超长文本的理解能力。
商汤也展示了语言大模型支持的几项创新应用,包括编程助手、健康咨询助手、PDF文件阅读助手等。
此外,商汤还展示了“日日新SenseNova”的各种AI文生图创作、2D/3D数字人生成、大场景/小物体生成等一系列生成式AI模型及应用,包括“秒画SenseMirage”文生图创作平台、“如影SenseAvatar”AI数字人视频生成平台、“琼宇SenseSpace”和“格物SenseThings”3D内容生成平台等。
商汤科技表示,“日日新SenseNova”带来的这些强大而易用的内容生成能力,将会改变内容生产行业的生产范式,突破内容创意的天花板,将会重塑内容生产行业生态并打开新的增长空间。
基于AI大装置SenseCore和“日日新SenseNova”大模型体系,商汤或将提供涵盖自动化数据标注、自定义大模型训练、模型增量训练、模型推理部署、开发效率提升等多种大模型即服务(Model-as-a-Service)。例如,模型推理部署服务可将大模型推理效率提高100%以上,降低用模型提供服务的成本。