文 | 吕栋
日前,市场上传出消息,在今年7月举行的华为云开发者大会上,华为将发布一款直接对标ChatGPT的多模态千亿级大模型产品,名为“盘古Chat”,产品主要面向To B/G政企端客户。
6月5日,一位华为云高层人士就这一消息独家回复观察者网称:“假的”。
今年以来,在国内这轮AI大模型竞赛中,百度、阿里、商汤、科大讯飞等已相继推出“类ChatGPT”产品,并不断将AI概念引向高潮,而华为到目前为止,尚未推出ChatGPT这种AI聊天机器人产品。
但从历史资料来看,华为其实很早就已开始布局AI大模型。
今年4月,国金证券发布的研报显示,华为盘古大模型从2020年启动研发,2021年4月正式发布,到2022年聚焦行业应用落地,其进化路径可分为L0-L1-L2三个阶段,上层是在下层的基础上演化而来。L0是指基础大模型,包括NLP(中文语言)大模型、CV(视觉)大模型、多模态大模型、科学计算大模型以及Graph(图网络)大模型。
同样在4月,华为云AI领域首席科学家田奇透露,过去几年,华为主要聚焦打造“盘古”系列的预训练大模型。大模型诞生分两个阶段:第一是预训练阶段,由海量数据来运行链路的通用底座基础模型;第二是针对下游的千行百业的具体的任务,基于行业数据进行微调,同时华为也布局了第三步,即大模型迭代。
根据华为披露的信息,从发展关键节点来看,华为于2021年4月发布了盘古NLP大模型、盘古视觉大模型、盘古科学计算大模型;2021年9月,推出用于药物研发细分场景的大模型;2022年,与能源集团合作发布了盘古矿山大模型、盘古气象大模型、盘古海浪大模型、盘古金融OCR大模型。
田奇在人工智能大模型技术高峰论坛上的演讲内容田奇透露,过去的2022年,华为盘古大模型主要是AI for Industry(AI赋能产业),希望为煤矿、水泥、电力、金融、农业等行业创造更多产业价值,目前已有多个案例。例如,盘古CV大模型目前覆盖工业质检、物流仓库监控、时尚辅助设计等行业;盘古NLP大模型覆盖智能文档检索、智能ERP、小语种大模型等领域,去年交付一个阿拉伯语千亿参数大模型;盘古科学计算大模型也用在了气象预报、海浪预测等方向。
一些市场分析称,与其他厂商相比,华为的优势或在于拥有完整的产业链和较强的算力调配能力。浙商证券研报显示,在训练千亿参数的盘古大模型时,华为团队调用了超过2000块昇腾910芯片,进行了超2个月的数据训练能力。还有传言称,华为每年大模型训练调用GPU/TPU卡超过4000片,3年的大模型算力成本高达9.6亿元人民币。
与此同时,华为也在大模型商标领域持续布局。企查查信息显示,华为技术有限公司于2023年4月19日申请注册两枚“HUAWEI.NETGPT”商标,国际分类为科学仪器、网站服务,当前商标状态为申请中。商标结构均为纯英文。同时商标申请进度显示,华为已成功注册多枚“盘古”“PANGU”商标。其中华为早在2019年就已经申请“PANGU”商标,该商标于2021年注册成功。