IT之家 7 月 28 日消息,在今日举行的 2023 年华为云数字文娱 AI 创新峰会上,华为云全球 Marketing 与销售服务总裁石冀琳表示,华为云将在后续推出盘古数字人大模型,可帮助用户 12 小时完成数字人生成。同时,她还宣称在人工智能的加持下,“每个人都有望实现‘数字人’自由”。
另据华为云开发者联盟介绍,盘古数字人通用大模型由华为云 MetaStudio 数字内容生产线构建而成。数字人基于华为云盘古基础大模型能力、渲染引擎和实时音视频能力,并使用 PB 级的音视频数据进行训练构建。
盘古数字人大模型包含数字人形象、动作、表情、口型、声音等要素,官方号称“每个用户可以结合个人数据对数字人进行训练”,构建自己的数字人个性化大模型。数字人生成后,用户通过文字、语音、视频等方式生产驱动向量信息,从而驱动数字人生成高清视频。
据称,用户可通过输入文字(文本、Prompt 文本),在 10 秒左右生成数字人模型;通过上传照片,在 30 秒左右生成不同类型的数字人模型。
此外,用户还可以通过拍摄一段 5 分钟的视频,在一个小时内通过训练来生成数字人。官方表示,通过此手段生成的数字人,可保留用户的个性化形象、表情、动作、声音和口型信息。生成数字人后,可以通过对话完成对数字人的二次编辑和背景融合,比如发型、配饰、服装等。
IT之家此前报道,盘古大模型 3.0 于 2023 年 7 月 7 日的 2023 年华为开发者大会上正式发布,可在矿山、铁路、气象、金融、代码开发、数字内容生成等领域发挥作用。