您当前的位置:首页 > 新闻资讯 > 科技

用AI“复制”另一个你?腾讯云推出2D真人小样本数智人,打造“AI+数智人工厂”

时间:2023-04-27 11:57:56  来源:DeepTech深科技  作者:

如果让你用一句话简单描述下腾讯的“数智人” ,你会想到什么?“它既可以是多才的员工,也可以是吸粉的明星代言人。”这是腾讯云智能数智人产品总经理陈磊的答案。

2022年9月,在央视播出的《闪亮的名字——2022最美教师发布仪式》上,腾讯数智人“云萱”以节目主持人的身份亮相,其通过真实生动的形象和专业的主持能力,给观众带来了一场亮点颇多的节目体验。同年,适逢中国国家博物馆创建110周年之际,腾讯数智人“艾雯雯”走进国博展厅,开启国博“打工人”新生活,并将在今后通过不断的学习,肩负国博形象代言人和具备多个工作岗位能力的员工的责任。

而在2023年4月25日,通过腾讯数智人的支持,数字经济学者刘兴亮以短视频“亮三点”为例,展示了他的首个数智人分身。

图丨刘兴亮用小样本数智人生产视频(来源:资料图)

“这个形象近似真人,表情、唇型匹配自然,包括我的特色口音也模拟得惟妙惟俏的数智人,正是腾讯云智能小样本数智人。未来,不需要搭建拍摄场地,也不用提前化妆彩排,不受空间、时间限制,数智人可以随时随地帮我生成口播视频,解放我的生产力。”刘兴亮如是说。

推出2D真人小样本数智人,只需24小时即可为用户打造出专属数智分身

腾讯自2018年起开始研发数智人,一直以来都将“更智慧、更懂行”作为发展方向。陈磊解释道:“一个通过AI技术,能够提升智能性,更智慧。第二个是更懂行,我们进入到各种各样的行业和场景,做深入的场景集成,使我们在行业的技术诀窍里形成很强的积累,提升行业的服务效能。”

综观旗下数智人的整体产品矩阵,其形象类型非常丰富,覆盖3D写实、3D半写实、3D卡通、2D真人、2D卡通五种风格,能够掌握数百种肢体动作和细腻的面部情感表情,支持内容生产、形象资产管理等方面的服务。

腾讯研究院高级研究员宋扬表示:“整个数字人围绕着两点,第一是好看的皮囊,第二是有趣的灵魂。”

2D真人风格分为精品和小样本两种模式。前者主要面向客服、虚拟IP形象等场景,成本约在数十万、百万级别,需要一个专业主播在录影棚录制一到两天,才能完成形象的打造。

而本次沟通会上推出的数智人,是2D真人小样本数智人。其也是根据真人形象定制,但普通人只需要录制3至5分钟的视频,就能够生成属于自己的数智分身,人工成本、时间和效益等已经迎来了极大的改善。

具体来说,用户只需提交少量的样本数据进行AI训练,比如3分钟真人口播视频、100句语音素材,就能在24小时内打造出一个与真人形象、语音非常逼真的数智分身。

图丨2D真人小样本数智人(来源:资料图)

据此得到的数智人,既支持半身或全身形象展示,又能根据内容调整动作、手势、口型、表情等,还支持任意更换录制背景,应用场景的适用性得到极大的增强。

事实上,2D小样本技术是由3D技术来提供支撑的。腾讯优图实验室研究总监汪铖杰表示:“小样本数智人从直观上感受是2D视频,背后其实是3D人像在做支撑。从‘文本/音频’信息到‘3D人像驱动’再到‘2D人像视频’的模式,通过3D人脸结构的先验信息引入,使数智人口型、表情更到位,让小样本数智人形象实现‘皱纹级’还原。”

与此同时,小样本的背后是“大”,也即基于自监督技术,构建大的数据和模型,用大模型持续消化语音、文本、口型等更多的数据。

从声音复刻上看,小样本数智人基于腾讯自研的新一代小样本音色制定技术,以及深度学习的声学模型及神经网络声码器,能够有效改善传统声学模型语音韵律单一、语调平淡的问题,进而提升语音合成的精细化水平。

此外,为了进一步提高小样本数智人的品质,腾讯还运用了包括高精度人像分割、人像美化、视线矫正等多项视觉AI技术。

加速数智人向千行百业普及,向行业开放数智人工厂生产能力

如上所述,小样本数字人具备基于真人形象定制、人人可用的特点。那么,如果面向的是整个行业或C端用户,又该如何才能为每一个人打造独立专属的数智人形象呢?

为了降低数智人制作门槛,加速数智人向千行百业的普及,腾讯云智能提出了“AI+数智人工厂”的方向。

首先,在基础设施即服务层面,基于腾讯云强大的算力体系,提供强有力的支撑。其次,依托腾讯云TI平台这个一站式低门槛、低代码的训练平台。基于TI-平台即服务的能力,构建标准化、工业化的数智人生产工厂。该工厂覆盖数智人生产的全流程环节,集成了十余种AI算法。未来,即便是没有研发经验的普通用户,也能自行操作并快速打造出属于自己的、近似真人的分身。

不仅如此,腾讯云智能还面向行业开放“产、销、服”的一体化平台,将数智人工厂的生产能力开放给整个行业,赋能到每一个个体。使用者可以在腾讯云上开设账号、上传素材、下订单,生产属于自己的数智分身。在进行效果确认之后,还能在交互服务平台、播报服务平台上使用,通过数智分身进行实时的视频生产和交互服务等。

短短几个月,已经有十几家生态企业先后完成了腾讯云智能小样本数智人能力接入的签约,其中包括微媒数字会议、上海医微讯等企业。

作为一家产品咨询公司,微媒数字会议致力于为品牌提供营销活动数字化解决方案。其与腾讯云智能合作,为小红书营销讲师、拾意文化创始人苏歆打造了一个专属数智人,后者帮助苏歆完成了一套40多节培训课程的视频内容。

在此之前,同样的工作需要由包括稿件制作人、主讲人、拍摄人等在内的全套制作团队,用一个月的时间来完成。如今,不需要影棚、拍摄和背稿,只需通过数智人平台,输入语音或文本音频,即可快速批量生成由专属数智人出镜的系列课程视频,充分实现对视频内容产出的降本增效。

微媒数字会议创始人兼CEO天狐表示:“我们一直在和腾讯团队合作探索,如何帮助IP老师更快速地做出千变万化的内容视频,帮助媒体同学快速产出有意思的内容,避免同质化的内容在网上大面积传播。”

作为医疗行业数字技术的供应商,上海医微讯早期采用3D虚拟仿真技术,帮助医生进行手术模拟,帮助患者更好地学习和掌握医学知识,后来逐渐通过虚拟现实、AI直播等技术为医疗赋能。对于数智人在医疗领域的应用,该公司也有自己的想法。

首先,该希望通过数智人打通就医过程中各环节存在的障碍,比如,在就医者进入门诊大厅以后,帮助其快速挂号、诊室指引等。

其次,通过数智人为患者提供智能、情感的陪伴。比如,通过数智人声音克隆技术保存需要做喉部手术的患者的声音;为罹患老年痴呆的患者提供陪伴服务等。

同时,帮助医生开展医患教育和知识分享。比如,用数智人代替医生为患者进行相关知识的科普和培训。

此外,让更多的数智人扮演药企中的虚拟代表角色,促进药企的转型发展。

“这四个领域,赋能医生、赋能医院、赋能患者、赋能药企,每个场景都是巨大的,也是我们这样的公司希望一直能做的事情。”上海医微讯数字科技股份有限公司创始人兼CEO潘耿表示。

推动数智人应用快速落地,让其能以普惠化的发展形式走入千行百业,是腾讯云智能打造数智人业务的初心。未来,其将继续朝着提升自然语言处理、自动语音识别等AI技术、探寻丰富的应用场景、联合更多生态伙伴等方面前进,为数智人的发展开辟更广阔的空间。



Tags:数智人   点击:()  评论:()
声明:本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,不构成投资建议。投资者据此操作,风险自担。如有任何标注错误或版权侵犯请与我们联系,我们将及时更正、删除。
▌相关推荐
AI赋能下的“数字人”与“数智人”:异同解析
由于人工智能技术的快速发展,我们逐渐进入了一个数字化的时代。在这个时代中,两个概念引起了广泛的关注和讨论,那就是“数字人”和“数智人”。虽然这两个概念都与人工智能有关...【详细内容】
2023-08-01  Search: 数智人  点击:(305)  评论:(0)  加入收藏
用AI“复制”另一个你?腾讯云推出2D真人小样本数智人,打造“AI+数智人工厂”
如果让你用一句话简单描述下腾讯的“数智人” ,你会想到什么?“它既可以是多才的员工,也可以是吸粉的明星代言人。”这是腾讯云智能数智人产品总经理陈磊的答案。2022年9月,在央...【详细内容】
2023-04-27  Search: 数智人  点击:(116)  评论:(0)  加入收藏
▌简易百科推荐
英特尔发布新一代AI芯片并首推AI芯片代工 “单挑”英伟达和台积电
新华财经上海4月11日电 当地时间4月9日,英特尔在Vision 2024客户和合作伙伴大会上宣布推出最新AI芯片产品Gaudi 3加速器。英特尔称,相比英伟达的H100 GPU,Gaudi3 AI芯片的模型...【详细内容】
2024-04-11    上海证券报  Tags:英特尔   点击:(2)  评论:(0)  加入收藏
AI“复活”亲人成生意,哪些红线待划定?
提供一张照片、一段10多秒的音频,即可让逝者在视频中“活”过来——AI“复活”亲人成生意,哪些红线待划定?本报记者 陶稳《工人日报》(2024年04月11日 06版)阅读提示...【详细内容】
2024-04-11    工人日报  Tags:AI   点击:(2)  评论:(0)  加入收藏
科技巨头狂撒千亿美元 “买照片”,只为训练AI模型?
高质量的数据,越来越值钱。你能想象,那些被遗忘在网盘的陈年老图,有朝一日能价值千金?就在最近,路透社报道称,苹果公司正与图像托管网站Photobucket协商,希望得到这家公司近130亿张...【详细内容】
2024-04-10    镁客网  Tags:AI模型   点击:(0)  评论:(0)  加入收藏
谷歌推出适用于安卓设备的“查找我的设备”网络
IT之家 4 月 9 日消息,谷歌今日推出了适用于安卓设备的“查找我的设备”网络,其功能类似于苹果的“查找”网络,旨在帮助用户定位丢失、被盗的安卓产品。IT之家注意到,与苹果的“...【详细内容】
2024-04-09    IT之家  Tags:安卓   点击:(2)  评论:(0)  加入收藏
你的自拍和聊天记录,正被硅谷大厂砸数十亿美元疯抢
2026年的数据荒越来越近,硅谷大厂们已经为AI训练数据抢疯了。它们纷纷豪掷十数亿美元,希望把犄角旮旯里的照片、视频、聊天记录都给挖出来。不过,如果有一天AI忽然吐出了我们的...【详细内容】
2024-04-09    新智元  Tags:硅谷   点击:(2)  评论:(0)  加入收藏
谷歌搜索史上最大变革!考虑对AI搜索收费
快科技4月7日消息,据国外媒体报道,谷歌正计划对由生成式人工智能驱动的新高级功能收费,这将是谷歌搜索业务历史上最大的一次变革。自2000年以来,谷歌的搜索产品一直依靠广告盈利...【详细内容】
2024-04-08    快科技  Tags:谷歌搜索   点击:(8)  评论:(0)  加入收藏
为训练AI,OpenAI等科技巨头花式淘数据
[环球时报特约记者 甄翔]《纽约时报》6日披露了科技公司训练人工智能的秘密——利用语音识别工具转录视频网站YouTube上的视频,形成对话文本数据,供其最新的AI学习...【详细内容】
2024-04-08    环球网  Tags:AI   点击:(9)  评论:(0)  加入收藏
训出GPT-5短缺20万亿token!OpenAI被曝计划建「数据市场」
全网真的无数据可用了!外媒报道称,OpenAl、Anthropic等公司正在努力寻找足够的信息,来训练下一代人工智能模型。前几天,OpenAI和微软被曝出正在联手打造超算「星际之门」,解决算...【详细内容】
2024-04-08    新智元  Tags:GPT-5   点击:(2)  评论:(0)  加入收藏
当“机器人”有了“AI大脑” 人形机器人时代来了吗
数智风向标当“机器人”有了“AI大脑”​人形机器人时代来了吗简单明了的口令下达后,机器人便开始搬箱子、运小球,在各类不同的地形行走……这些身上布满芯片和传...【详细内容】
2024-04-08    中国青年报  Tags:机器人   点击:(5)  评论:(0)  加入收藏
报告称 OpenAI 采集了超一百万小时的 YouTube 视频来训练 GPT-4
IT之家 4 月 7 日消息,本周早些时候,《华尔街日报》报道称 AI 公司在收集高质量训练数据方面遇到了困难。今天,《纽约时报》详细介绍了 AI 公司处理此问题的一些方法,其中涉及到...【详细内容】
2024-04-07    IT之家  Tags:OpenAI   点击:(7)  评论:(0)  加入收藏
相关文章
    无相关信息
站内最新
栏目相关
  • · 英特尔发布新一代AI芯片并首推AI芯片代工 “单挑”英伟达和台积电
  • · AI“复活”亲人成生意,哪些红线待划定?
  • · 科技巨头狂撒千亿美元 “买照片”,只为训练AI模型?
  • · 谷歌推出适用于安卓设备的“查找我的设备”网络
  • · 你的自拍和聊天记录,正被硅谷大厂砸数十亿美元疯抢
  • · 谷歌搜索史上最大变革!考虑对AI搜索收费
  • · 为训练AI,OpenAI等科技巨头花式淘数据
  • · 训出GPT-5短缺20万亿token!OpenAI被曝计划建「数据市场」
  • · 当“机器人”有了“AI大脑” 人形机器人时代来了吗
  • · 报告称 OpenAI 采集了超一百万小时的 YouTube 视频来训练 GPT-4
  • · 量子计算会和经典计算一样融入人们的日常生活
  • · ChatGPT官宣免注册,全球互联网变天!OpenAI将取代谷歌搜索?
  • · 谷歌为了结集体诉讼,同意删除 Chrome 无痕模式下收集的用户数据
  • · 哥伦比亚大学华人开发「人脸机器人」,照镜子自主模仿人类表情超逼真
  • · 谷歌服务现已支持使用 Windows Hello 人脸和指纹解锁登录
  • · GPT商店热度不尽人意 仅用在写论文和炒股票上较受欢迎
  • · 距实现全球安全量子通信更近一步:量子点源产生近乎完美纠缠光子对
  • · 中国三大运营商共同发布通过GSMA Open Gateway认证的一次性密码 API
  • · 马斯克脑机接口再造奇迹:瘫痪小伙意念玩赛车击败正常人
  • · 国家数据局局长刘烈宏:充分发挥数据要素价值 培育新质生产力
  • 站内热门
    相关头条
  • · 谷歌搜索史上最大变革!考虑对AI搜索收费
  • · ChatGPT官宣免注册,全球互联网变天!OpenAI将取代谷歌搜索?
  • · 马斯克脑机接口再造奇迹:瘫痪小伙意念玩赛车击败正常人
  • · Kimi引燃大模型“长文本竞赛”,阿里360百度急出手
  • · 瘫痪8年小哥植入马斯克脑机接口,狂打8小时「文明6」!Neuralink首个人类植入者直播来了
  • · 英伟达“算力核弹”强在哪里?
  • · AI大模型之争远未落幕
  • · 世界首款!英伟达重磅发布人形机器人模型
  • · 全程回顾黄仁勋GTC演讲:Blackwell架构B200芯片登场
  • · 真“Open ” AI?马斯克旗下大模型Grok宣布开源:参数量全球最大
  • · 全球首位AI程序员诞生 人类程序员会失业吗?
  • · 谷歌宣布更新搜索算法:打击AI生成内容,提高搜索结果质量
  • · 英伟达、微软等巨头“抱团”,AI有望助推6G时代到来 国内产业如何接招?
  • · OpenAI Sora已开放对外申请 网友爆料:可能还有其它重磅产品发布
  • · 周鸿祎再谈Sora:真正给人工智能补上了“眼睛”
  • · Sora爆火超100小时:美国狂“卷”算力,国内则卖 AI 课程“捞金”一年5000万|钛媒体AGI
  • · 爆火Sora参数规模仅30亿?谢赛宁等大佬技术分析来了
  • · “AI女友”霸占GPT商店,OpenAI苦不堪言:开发者也难出头!
  • · 从居家到工作,CES 2024上演 AI硬件大秀
  • · OpenAI新年头号重磅!GPT Store上线,企业客户新品也来了
  • 站内头条