焦点　股票　程序开发　站长技术　抖音　安卓　电商　 iphone　微信　理财　职场　美食　　

简易百科手机版

您当前的位置：首页 > 电脑百科 > 人工智能

异军突起的视频AI，揭示了什么？

时间：2023-10-11 12:51:01 来源：作者：阿尔法工场

悄然崛起的视频AI，标志着AI竞争进入了下一阶段。

在当下的AI赛道上，AI聊天、绘画一类的应用，早已枝繁叶茂。

然而，在此类同质化应用扎堆的情况下，一类颇有技术难度，也较少被人提及的方向，正在悄然崛起。

这就是最能调动人感官的视频AI领域。

异军突起的视频AI，揭示了什么？

根据Twitter上的作者Will 郎瀚威统计的图表，今年8—9月，各大文生图类AI网站的访问量均开始呈现下降趋势。

然而，就在这种情况下，国外知名视频AI网站HeyGen的访问量上升了92%，流量跃居各大独立AI网站之首。

异军突起的视频AI，揭示了什么？

那么，为何此前一直默默无闻的视频AI，最近突然异军突起，盖过了风头正盛的文生图类AI应用？

而在GPT-4V发布，多模态技术不断取得突破的情况下，这一微妙的变化，又预示着什么？

01 多模态的前奏

从AI发展的大格局上来说，HeyGen的这波流量上升，或许只是多模态高歌猛进背景下的一个插曲。

异军突起的视频AI，揭示了什么？

从谷歌宣布Gemini具有多模态功能的消息，到OpenAI发布GPT-4V，各个AI巨头，似乎都将下一阶段竞争的焦点放在了多模态上。

那为何多模态成了巨头眼中关键的“突破点”？

原因或许就在于，其具有打破“专业壁垒”的意义。

异军突起的视频AI，揭示了什么？

在多模态尚未取得突破之前，不同模态、领域之间，存在着巨大的鸿沟。

写文案，做编辑的人，即使再妙笔生花，如果缺乏相应的美术知识，以及各种专业的提示词，也难以用AI画出出色的作品。

而一个画师如果没有受过专业的写作训练，缺乏谋篇布局的思路，也难以凭借AI写出上乘的文章。

类似的“壁垒”，在视频剪辑方面，也同样存在着。

异军突起的视频AI，揭示了什么？

根据知乎上一位视频剪辑方面的从业者介绍，一个完整的视频剪辑流程，包括了调色、整理素材、配字幕等一系列工作，要想熟练地进行剪辑，必须掌握PR、Edius、剪映等多种剪辑软件，同时还需熟悉各种转场、调色、粒子特效等插件的使用。

如果想让视频呈现更丰富的效果，还要掌握b-roll转场、字幕遮罩、坡度变速等复杂的操作。

异军突起的视频AI，揭示了什么？

此外，素材的搜集和整理，也是剪辑工作中的一大“苦活”，倘若题材较为冷门，素材就会很不好找。有时尽管遇到了好的素材，也可能由于版权问题难以使用。

正是由于上述原因，视频剪辑，注定不是一个简单的、易于掌握的技能。

以国内知名网站B站为例，据一位B站上百万粉丝的UP主团队透露，为了保证视频更新的效率、质量，这些账号往往会配备数名较为熟练的剪辑人员，轮番进行剪辑。

异军突起的视频AI，揭示了什么？

那么，倘若有一种智能化的AI剪辑应用，能根据创作者想表达的思路，自动、高效地完成整个视频的制作，视频制作领域，又会发生怎样的颠覆呢？

实际上，这样的技术早已出现。

下面这两张图片，分别来自两段不同的视频片段。

你能分辨出哪个是真人，哪个是AI生成的吗？

异军突起的视频AI，揭示了什么？

答案是：这两个视频都是100%由AI生成的人像视频。

而它们均出自此前提到的HeyGen之手。

在HeyGen上，用户只需要用上传一段2分钟的小视频，就能达到和真人一样的效果，即使是像手势、面容和口型这种“细微肢体语言”也能调整。

而这类效果的实现，正是当下多模态技术发力的开端。

02 视频AI之力

上面所有这些视频都出自HeyGen的Joshua Avatar 2.0，一款AI人像视频的工具，主打的就是一个超逼真。

而实现这样真实的视频效果，步骤也非常简单，只需完成选形象—写文本—输出三个步骤即可。

异军突起的视频AI，揭示了什么？

如果要论HeyGen与其他同类视频AI应用最大的区别，就是它可以利用现有数据来创造全新和从未有过的内容。

以往的类似应用，例如D-ID，虽然也能让用户从照片或者AI形象中生成视频，但是这样的技术，更多是基于复制或处理已有的内容的AI技术。

异军突起的视频AI，揭示了什么？

这些技术虽然也可以制作视频，但是需要用户提供自己的照片或录音，或者从D-ID提供的一些固定的AI形象中选择。这样就需要用户花费更多的时间和精力来准备和上传素材，也限制了用户的选择和定制空间。

而相较之下，HeyGen的技术则可以让用户从文本中直接生成视频，并使用多种不同的AI形象和声音。

异军突起的视频AI，揭示了什么？

目前，HeyGen提供超过100+数字人素材和模板，广告、电商、新闻等一应俱全，也可以自己编辑PPT生成。

同时，HeyGen还支持300+不同音色和40+语言，以及视频翻译功能。用户可以一键将视频无缝地翻译成其他语言，这对于跨国和多语言的沟通非常有用。

通过这种定制化的、排列组合的方式，HeyGen可以快速、精简地制作出各种适用于多种场景的视频。

而这样的高自由度，也让HeyGen使许多不精通视频剪辑的人，打破了以往“技能边界”，可以恣意地用视频表达自己的想法。

异军突起的视频AI，揭示了什么？

除了HeyGen之外，在视频AI领域，许多正在蓄势待发的类似应用，也已经在悄然崛起。

例如能直接将脚本转化成视频的Pictory.AI就是其中之一。

Pictory 允许用户仅通过几次点击，就能将脚本转化为配有逼真的AI语音、匹配的素材和音乐的专业质量视频。

异军突起的视频AI，揭示了什么？

具体来说，在制作视频时，用户可以从Pictory 提供的多种模板中选择一种，来设置视频的样式。

之后，Pictory 会根据用户输入的文本和选择的模板和比例，自动地生成一个故事板。故事板是一个由多个场景组成的视频序列，每个场景包含了文字、图片、AI语音和一段音乐。

异军突起的视频AI，揭示了什么？

最后，用户可以在故事板上预览视频的效果，并进行一些编辑和调整。

如此一来，团队不需要昂贵的摄影师、剪辑师，也能制作出专业的、高质量的视频。

同样地，用3D CGI角色替换真人演员的Wonder Studio，也是旨在提高视频制作效率的AI应用之一。

异军突起的视频AI，揭示了什么？

Wonder Studio 是一个基于网页的视频平台，它可以让用户轻松地将任意的计算机生成的角色（CGI character）添加到任何场景中，使用AI技术来实现无缝的融合。

用户只需要拍摄自己想要的场景，并上传到网站上，Wonder Studio 的AI引擎就会自动分析场景中的演员的表演，包括他们的动作和面部表情，并将这些信息转换成运动数据，然后用这些数据来驱动用户选择的CGI角色。

异军突起的视频AI，揭示了什么？

这样，用户就可以完美地用3D CGI角色替换真人演员，无需使用复杂的3D软件或者昂贵的制作设备，例如动作捕捉服。

03 趋势及国内现状

从以上视频AI的技术特点中，我们至少可以总结出目前视频AI技术的两大趋势：

1、制作流程极大简化

利用生成式AI技术，人们能够以自动化、智能化的方式，将文本、图像、音频、视频等多模态数据重新组合，来创造全新和从未有过的内容，在降低成本的同时，也打破了各个模态（或专业）之间的“技术壁垒”。

而这一壁垒的打破，正是生成式AI走向通用化、普及化的关键。

异军突起的视频AI，揭示了什么？

2、内容的多样性和定制性

利用多模态AI的技术，人们能够处理和关联多种信息模态，从而在内容创作过程中，更好地表达自己的个性和风格，并适应不同的场合和目的。

这是以往受限于已有素材的单一模态技术难以实现的。

异军突起的视频AI，揭示了什么？

在上述两大趋势中，目前国内的视频AI应用，只勉强做到了“简化”这一步。

虽然国内目前也有一些与HeyGen类似的AI视频应用，例如腾讯智影、一帧秒创、万彩微影等。这些应用也利用了AI技术来简化视频创作过程，并提供了文本配音、文章转视频、数字人播报等功能。

然而，在具体的生成效果方面，国内应用的视频清晰度、素材丰富度，以及定制化功能方面，仍与HeyGen等应用有着较大差距。

异军突起的视频AI，揭示了什么？

腾讯智影的数字人视频，可选素材比较有限

从总体上来说，这类应用仍旧只能在平台提供的素材库内，选择有限的元素进行创作，并且在某些类别（如数字人视频）上，国产应用生成的视频，也未达到HeyGen视频那样流畅、逼真的标准。

如果说，在本轮AI革命中，国内视频AI技术仅仅止步于“降本”这一环节，从长远来看，是远远不足以征服智能化时代的观众的。

从当下观众的态度来看，AI制作的视频仍处于一种“不受待见”的状态，很多观众仍然觉得，在视频中使用AI技术，是一种偷懒、不负责，且廉价的制作方式。

异军突起的视频AI，揭示了什么？

究其原因，是因为当下国内的部分AI技术，仍未突破一种感官上的阈值，仍然让人明显觉察到“这不是人做的”。

于是就给人造成了一种“没有感情”、“粗制滥造”的印象。

更有甚者，甚至将那些使用了AI技术的视频，打上了“营销号”的标签。

异军突起的视频AI，揭示了什么？

面对这样的环境，任何珍惜自己羽毛的视频创作者，都不敢轻易使用AI技术了，因为生怕被人当成“营销号”，扣上“粗制滥造”的帽子。

生成式AI的进步，确实极大简化了视频制作的流程，但在已经到来的智能时代，观众们已经不想再看到那些批量的、流水线式的“低劣”视频了。

而要想摘掉这样的“低劣”标签，真正地让作品具有感情和灵魂，除了一个劲儿地“降本”之外，在个性化、拟真度，以及素材丰富性方面，国产视频AI还有很长的路要走。

Tags：视频AI 点击:() 评论:()

声明：本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,不构成投资建议。投资者据此操作，风险自担。如有任何标注错误或版权侵犯请与我们联系，我们将及时更正、删除。

▌相关推荐

视频AI再一次突破，生成时间不再有限制！

视频AI再一次突破，生成时间不再有限制！

近日，谷歌推出了一款名为VideoPoet的大语言模型，该模型以其强大的视频生成能力引发了业界的广泛关注。据悉，VideoPoet不仅能够执行各种视频生成任务，包括文本到视频、视频转音频...【详细内容】

2024-01-02　　Search: 视频AI 点击:(96)　　评论:(0)　　加入收藏

异军突起的视频AI，揭示了什么？

异军突起的视频AI，揭示了什么？

悄然崛起的视频AI，标志着AI竞争进入了下一阶段。在当下的AI赛道上，AI聊天、绘画一类的应用，早已枝繁叶茂。然而，在此类同质化应用扎堆的情况下，一类颇有技术难度，也较少被人提及...【详细内容】

2023-10-11　　Search: 视频AI 点击:(355)　　评论:(0)　　加入收藏

▌简易百科推荐

藏在AI背后的“吃电狂魔”

藏在AI背后的“吃电狂魔”

人工智能时代的能耗黑洞据估算，到2027年，人工智能行业每年将消耗85~134太瓦时的电力，相当于瑞典或荷兰一年的总用电量。马斯克判断，电力缺口最早可能会在2025年发生，“明年你会看...【详细内容】

2024-04-09　　　　雪豹财经社　　Tags:AI 　点击:(1)　　评论:(0)　　加入收藏

OpenAI和谷歌再起纷争：AI的尽头是内容

OpenAI和谷歌再起纷争：AI的尽头是内容

日前，纽约时报的一篇报道称，人工智能公司 OpenAI为收集高质量训练数据而开发了一个语音转录模型Whisper。该模型主要用于转录 OpenAI 获取的超过 100 万小时的 YouTube 视频，也...【详细内容】

2024-04-09　　小编也疯狂　　新浪网　　Tags:AI 　点击:(1)　　评论:(0)　　加入收藏

AI产业的灰色暗面：OpenAI、谷歌、META如何搞训练语料

AI产业的灰色暗面：OpenAI、谷歌、META如何搞训练语料

财联社4月7日讯（编辑史正丞）种种迹象显示，目前站在全世界AI领域潮头浪尖的这些公司，早在几年前就已经陷入对训练语料的“绝望”追逐中——为此他们不惜修改政策条款...【详细内容】

2024-04-09　　　　财联社　　Tags:AI产业　点击:(1)　　评论:(0)　　加入收藏

和“数字人”交朋友，当心隐私被出卖......

和“数字人”交朋友，当心隐私被出卖......

在虚拟社交中如何在保护用户隐私和数据安全的同时提供高质量的社交体验？如何避免过度依赖虚拟社交找到虚拟与真实之间的平衡点？《中国消费者报》记者就此展开了调查APP里有个...【详细内容】

2024-04-09　　　　中国消费者报　　Tags:数字人　点击:(2)　　评论:(0)　　加入收藏

AI“复活”成产业链：成本可降至数百元

AI“复活”成产业链：成本可降至数百元

大模型应用落地，带火数字人(11.560, 0.29, 2.57%)赛道。文|《中国企业家》记者李艳艳实习生孙欣编辑|姚赟头图来源|《流浪地球2》电影画面截图清明节前，预估会有需求的庞立...【详细内容】

2024-04-09　　　　中国企业家　　Tags:AI“复活” 　点击:(2)　　评论:(0)　　加入收藏

多方热议人工智能产业新机遇

多方热议人工智能产业新机遇

编者按&emsp;&emsp;从前沿科技展会到高层对话平台，从上海、重庆到博鳌，从线上到线下……一场场高规格、大规模的盛会中，人工智能正在成为各界热议的高频词。赋能千...【详细内容】

2024-04-08　　　　中国家电网　　Tags:人工智能　点击:(4)　　评论:(0)　　加入收藏

人形机器人时代来了吗

人形机器人时代来了吗

日前，由中国人形机器人(11.080, -0.05, -0.45%)百人会主办的人形机器人大赛在北京经济技术开发区开赛。工作人员向参观者展示一款人形机器人。参观者与一款陪护型人形机器人...【详细内容】

2024-04-08　　　　中国青年报　　Tags:人形机器人　点击:(5)　　评论:(0)　　加入收藏

AI重塑社交：腾讯与字节跳动的新赛场

AI重塑社交：腾讯与字节跳动的新赛场

文|新火种一号编辑|美美最近，腾讯和字节跳动这两大互联网巨头几乎同步推出了各自的AI社交产品，尽管腾讯和字节跳动在前段时间刚刚“破冰”，但这一举措不仅意味着这两大巨头之...【详细内容】

2024-04-07　　　　蓝鲸财经　　Tags:AI 　点击:(8)　　评论:(0)　　加入收藏

第一批用 Kimi 做内容的网红已经杀疯了

第一批用 Kimi 做内容的网红已经杀疯了

作者：王东东文章来自：斗战圣佛小组技术信仰派 VS 市场信仰派朱啸虎和月之暗面老板杨植麟在前几天有一场不算 battle 的 battle。battle 的争论点是：大模型有没有戏。技术派...【详细内容】

2024-04-04　　　　斗战圣佛小组　　Tags:Kimi 　点击:(4)　　评论:(0)　　加入收藏

昆仑万维发布面向人工智能时代的六条人才宣言

昆仑万维发布面向人工智能时代的六条人才宣言

过去的一年多，是人工智能取得非凡进步的一年。在这充满突破性技术飞跃和备受争议的一年里，我们见证了人工智能的快速发展和广泛的影响，人工智能已经迅速地融入了我们的生活，深刻...【详细内容】

2024-04-03　　　　砍柴网　　Tags:昆仑万维　点击:(7)　　评论:(0)　　加入收藏

推荐资讯

“龙年龙月龙日龙时”	20元引发的官司：“仅退
网约车抽成“套路”多	A股分拆上市密集改道：
探访“中国黄金第一家	藏在AI背后的“吃电狂
看1280份年报：大消费复	美联储年内可能不降息

相关文章

无相关信息

站内最新

栏目相关

· 藏在AI背后的“吃电狂魔”

· OpenAI和谷歌再起纷争：AI的尽头是内容

· AI产业的灰色暗面：OpenAI、谷歌、META如何搞训练语料

· 和“数字人”交朋友，当心隐私被出卖......

· AI“复活”成产业链：成本可降至数百元

· 多方热议人工智能产业新机遇

· 人形机器人时代来了吗

· AI重塑社交：腾讯与字节跳动的新赛场

· 第一批用 Kimi 做内容的网红已经杀疯了

· 昆仑万维发布面向人工智能时代的六条人才宣言

· AI干掉声优？音频大模型追逐“图灵时刻”

· 生成式人工智能有哪些新趋势？

· AI世界的新难题：互联网的信息不够用了！

· 今天起，ChatGPT无需注册就能用了！

· AI时代，面对死亡有了第二种选择？

· 影视业AI应用如何超乎想象？

· 当AI会作词作曲唱歌，音乐人何去何从

· 大模型Kimi火了，长文本“卷”出新高度

· 把GPT变成算命大师需要几步？

· Sora开启文生视频新纪元影视游戏产业加速变局求突破

站内热门

相关头条

· OpenAI和谷歌再起纷争：AI的尽头是内容

· 和“数字人”交朋友，当心隐私被出卖......

· 人形机器人时代来了吗

· 今天起，ChatGPT无需注册就能用了！

· 8款AI视频生成产品实测，谁将成为中国Sora？

· Sora到底怎么样？第一批试用者这样说！

· AI社交来了，微信慌了吗？

· 成立仅2年，做出能和人类对话的人形机器人，Figure AI什么来头？

· 通俗易懂地解释OpenAI Sora视频生成的特点有哪些？它与此前的Runway Gen2、Pika有什么区别？以及缺点是什么？

· AI配音版Sora视频刷屏！绝美逼真音效打破「无声电影」，或颠覆万亿美元产业

· 爆火Sora背后的技术，一文综述扩散模型的最新发展方向

· 揭秘Sora技术路线：核心成员来自伯克利，基础论文曾被CVPR拒稿

· Sora为什么是AGI的又一个里程碑时刻？

· 人人都能看懂的Sora技术报告

· 谷歌聊天机器人Bard新增图像生成能力：可生成图片、ai画作

· OpenAI新功能：ChatGPT可调用自定义机器人，对话更高效！

· 到底什么是大模型？

· 简易百科之什么是大型语言模型？

· ChatGPT元年之后，AI重塑世界，人类如何与其“智慧共生”？

· 鹅厂最新AI工具刷屏！杨幂寡姐多风格写真秒秒钟生成，LeCun点赞 | 可免费体验

站内头条

网站首页 | 关于我们 | 服务条款 | 广告服务 | 联系我们 | 网站地图 | 免责声明 | 手机版

Copyright @ 简易百科 V 2.0 ©2020-2022 ISOLVES.com | 电脑百科 | 生活百科 | 手机百科 | 简易号
京ICP备14042104号　　

京公网安备 11010802035086号

简易百科手机版