您当前的位置:首页 > 电脑百科 > 虚拟现实

计算机图形学将迎来新突破?Meta 携手斯坦福大学推出 3D 交互模型,VR 时代似乎不远了

时间:2023-12-14 12:29:48  来源:InfoQ  作者:

作者 | 李冬梅、核子可乐

近日,斯坦福大学与 Meta/Facebook AI 研究(FAIR)实验室的工作人员共同开发出一套突破性的 AI 系统,能够仅根据文本描述在虚拟人和物体之间生成自然、协调的运动关系。

这套新系统被称为 CHOIS(Controllable Human-Object Interaction Synthesis,即可控人机交互合成),使用最新的条件扩散模型技术生成无缝且精确的交互,例如“将桌子举过头顶、行走,然后放下桌子。”

简而言之,这是一套先进的人工智能系统,用于合成逼真的 3D 人机交互。

这项工作被公布在 arXiv 论文预发表网站的一篇文章中,也让我们得以一睹虚拟人如人类般顺畅理解并响应语言命令的未来景观。例如,把椅子拉近桌子来创造一个工作空间,调整落地灯以投射出完美的光芒,或者整齐地存放手提箱。每一项任务都需要人、物体和周围环境之间的精确协调。语言是表达和传达这些意图的有力工具,在语言和场景背景的指导下,合成逼真的人类和物体运动是构建先进的人工智能系统的基石,该系统可以在不同的 3D 环境中模拟连续的人类行为。

论文地址:https://arxiv.org/pdf/2312.03913.pdf

研究人员们在文章中指出,“根据语言描述在 3D 场景中生成连续的人 - 物交互一直存在不少挑战。”

他们必须确保生成的运动真实且协调同步,保持人手与物体之间的适当接触,且物体的运行应当与人类行为具有因果关系。

如何实现

CHOIS 系统之所以效果拔群,依靠的就是其在 3D 环境中摸索出一套独特的人 - 物交互合成方法。CHOIS 的核心为条件扩散模型,这是一种能够模拟详尽运动序列的生成模型。

当给定人 / 物位置的初始状态以及所需操作的语言描述之后,CHOIS 就会据此生成一系列动作,最终完成任务要求的交互效果。

例如,假设指令是将灯具移到沙发旁边,CHOIS 会理解指令内容并创建一段逼真的动画,显示人类形象拿起灯具并将其放置在沙发附近。

利用 AMASS 等大规模、高质量的运动捕捉数据集,人们对生成人体运动建模的兴趣有所上升,包括动作条件合成和文本条件合成。虽然之前的工作使用 VAE 公式从文本生成不同的人体运动,但 CHOIS 专注于人与物体的交互。与通常以手部运动合成为中心的现有方法不同,CHOIS 在物体抓取之前考虑全身运动,并根据人体运动预测物体运动,为交互式 3D 场景模拟提供全面的解决方案。

计算机图形学将迎来新突破?Meta 携手斯坦福大学推出 3D 交互模型,VR 时代似乎不远了

给定初始对象和人类状态、语言描述和 3D 场景中的稀疏对象路径点,CHOIS 生成的物体运动与人体运动同步。

CHOIS 的独特之处,就在于它使用稀疏对象路径点和语言描述来指导动画生成。各个路径点充当对象移动轨迹中的关键标记点,确保运动不仅符合物理规律,而且与语言输入中描述的高级目标保持一致。

CHOIS 的另一大优势,在于能够将语言理解能力与物理模拟功能加以结合。传统模型往往难以将语言同空间和身体动作联系起来,特别对于较大的交互范围,必须考虑诸多因素才能始终保持交互的真实性。

CHOIS 首先解释语言描述所承载的意图和风格,而后将其转化为一系列既符合人体构造、又不违背物体特性的肢体动作,从而解决了大范围交互过程中的这一现实难题。

该系统尤其具有开创性的一点,就是它能准确表现接触点(例如手与物体之间的接触位置),且物体的运行与人类化身施加的力保持一致。此外,该模型在训练和生成阶段还引入了专门的损失函数和指导性术语,旨在强制遵循这些物理约束,这也是让 AI 成功实现以人类方式理解物理世界、并与物理世界正确交互的重要一步。

对计算机图形学、

AI 与机器人技术的影响

CHOIS 系统对计算机图形学产生了深远影响,特别是在动画和虚拟现实领域。通过让 AI 获得解释自然语言指令并据此生成逼真人机交互过程的能力,CHOIS 能够大大减少制作复杂场景动画所需要的时间和精力。

动画师们可以使用这项技术来创建出以往极为费时费力的关键帧动画序列,显著提升设计效率与成果产出。此外,在虚拟现实环境当中,CHOIS 还能带来更加身临其境且高度交互的体验,由用户通过自然语言指挥虚拟角色,并观察其以逼真精度执行任务的全过程。这种更高水平的交互能够将 VR 体验从僵化、脚本化的事件转化为更加顺畅自然的动态环境用户输入响应效果。

在 AI 和机器人领域,CHOIS 则代表我们朝着更加自主的情境感知系统迈出的一大步。传统机器人往往受到预编程例程的限制,而 CHOIS 这类系统的出现能够帮助其更好地理解现实世界、并顺利按照自然语言给出的描述完成任务。

这对于医疗保健、酒店或家庭环境下的服务型机器人来说尤其有着变革性的影响。在这类环境下,理解物理空间并在其中执行各类任务的能力往往至关重要。

对于 AI 来说,这种同时处理语言和视觉信息以引导任务执行的能力,也使其距离充分理解情境和环境上下文又更进了一步。而且在此之前,这种能力一直是人类的优势和专利。在 CHOIS 的支持下,未来的 AI 系统有望在更多复杂任务中发挥更大的作用,不仅能够消化人类指令的“内容”、更能理解人类指令的操作“方式”,以前所未有的灵活性适应新的挑战。

成果令人惊艳,

前景值得期待

CHOIS 代表了人工智能领域的重大飞跃,特别是在计算机视觉和人机交互领域。通过综合 3D 人与物体交互,CHOIS 可以生成逼真的动画和场景,这对于创建沉浸式虚拟体验至关重要。

该系统使用组合分层方法来理解人类与物体之间交互的复杂本质。这涉及将交互分解为更小的、可管理的部分,并理解这些部分之间的关系。模型的层次结构使其能够考虑交互的上下文,例如环境和所涉及对象的属性。

CHOIS 由深度学习算法提供支持,深度学习算法是机器学习的子集。这些算法使系统能够从人与物体交互的大型数据集中学习,随着时间的推移提高其准确性和预测能力。

总体而言,斯坦福大学和 Meta 的研究人员在计算机视觉、自然语言处理(NLP)和机器人技术交叉领域的这一极具挑战的问题上,成功取得了关键进展。

研究团队认为,他们的工作是建立先进 AI 系统的重要一步,该系统能够在不同的 3D 环境中模拟连续的人类行为。CHOIS 也为进一步研究如何利用 3D 场景加语言输入来合成人机交互过程打开了大门,有望在未来孕育出更加复杂的 AI 系统。

参考链接:

https://venturebeat.com/ai/stanford-and-meta-inch-towards-ai-that-acts-human-with-new-chois-interaction-model/

https://isp.page/news/chois-stanford-and-fair-metas-revolutionary-ai-for-realistic-3d-human-object-interactions/#gsc.tab=0

https://www.marktechpost.com/2023/12/10/researchers-from-stanford-university-and-fair-meta-unveil-chois-a-groundbreaking-ai-method-for-synthesizing-realistic-3d-human-object-interactions-guided-by-language/



Tags:VR   点击:()  评论:()
声明:本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,不构成投资建议。投资者据此操作,风险自担。如有任何标注错误或版权侵犯请与我们联系,我们将及时更正、删除。
▌相关推荐
IDC:预计2028年全球VR/AR设备规模达2470万台
日前,IDC发布最新市场调研数据,2023年全球VR/AR设备出货量暴跌23.5%,不过IDC也表示伴随着苹果Vision Pro的大规模上市以及全球宏观经济的改善,预计2024年将迎来爆发,出货量预计增...【详细内容】
2024-03-20  Search: VR  点击:(14)  评论:(0)  加入收藏
虚拟现实(VR)和增强现实(AR)技术的最新发展,以及它们在游戏领域的应用
虚拟现实(VR)和增强现实(AR)技术的最新发展,以及它们在游戏领域的应用随着科技的快速发展,虚拟现实(VR)和增强现实(AR)技术已经成为当今最热门的话题之一。这些技术为游戏领域...【详细内容】
2024-02-01  Search: VR  点击:(121)  评论:(0)  加入收藏
AR 野心遭遇 VR 现实:苹果Vision Pro头显视频透视功能并非完美
IT之家 1 月 30 日消息,苹果 Vision Pro 头显的媒体评测已经出炉,其主要亮点功能之一是 Passthrough(视频透视)功能,该功能利用外部摄像头将周围环境实时投影到头显显示屏上,旨在...【详细内容】
2024-01-30  Search: VR  点击:(43)  评论:(0)  加入收藏
Meta:苹果入局证明扎克伯格对AR/VR坚持投入是正确的
(映维网Nweon 2024年01月29日)根据《华尔街日报》报道,对于苹果携Vision Pro正式入局头显市场,Meta实际上非常欢迎,并希望苹果及Vision Pro可以助力他们已投入500亿美元的元宇宙...【详细内容】
2024-01-29  Search: VR  点击:(46)  评论:(0)  加入收藏
计算机图形学将迎来新突破?Meta 携手斯坦福大学推出 3D 交互模型,VR 时代似乎不远了
作者 | 李冬梅、核子可乐近日,斯坦福大学与 Meta/Facebook AI 研究(FAIR)实验室的工作人员共同开发出一套突破性的 AI 系统,能够仅根据文本描述在虚拟人和物体之间生成自然、协...【详细内容】
2023-12-14  Search: VR  点击:(129)  评论:(0)  加入收藏
网络工程师必备:理解VRRP协议及其容错功能
在当今的计算机网络环境中,网络可靠性已成为一项关键要求。为了满足这一要求,虚拟路由冗余协议(VRRP)提供了一种有效的解决方案。本文将详细介绍VRRP协议的工作原理、配置方法以...【详细内容】
2023-12-11  Search: VR  点击:(100)  评论:(0)  加入收藏
微软AR/VR专利提出改善显示组件失准校正的方法
MR系统通常包括单独的显示组件,并分别配置在用户的眼睛前面。然而,立体错位经常发生在MR系统中,亦即通过单独显示组件显示的内容没有正确对齐。立体错位可能导致用户在混合现实...【详细内容】
2023-11-24  Search: VR  点击:(155)  评论:(0)  加入收藏
将智能手表作为VR头显控制器,谷歌“脑洞大开”
元宇宙这一概念的冷却让VR遭受池鱼之殃,使得其在全球范围内的退潮已然成为了不争的事实,但对于科技巨头而言,虚拟现实背后的广阔市场依旧不容有失,例如Meta就还在继续推出新品Qu...【详细内容】
2023-11-23  Search: VR  点击:(183)  评论:(0)  加入收藏
VR虚拟现实和AR增强现实有什么区别
VR是一种完全的数字化体验,通过头戴式显示器、手套或控制器等设备来创建一种虚拟世界。用户可以在这个虚拟世界中感受到自己在真实世界中无法获得的体验,比如登上高山、潜入海...【详细内容】
2023-11-17  Search: VR  点击:(137)  评论:(0)  加入收藏
微软AR/VR专利分享用于虚拟表示的并行人体姿态估计
关于人类用户姿势的信息可以映射到虚拟铰接表示。例如,当参与虚拟现实环境时,人类用户在虚拟环境中的表现会呈现出与现实世界姿势相似的姿势。用户的真实世界姿态可以通过先前...【详细内容】
2023-11-13  Search: VR  点击:(138)  评论:(0)  加入收藏
▌简易百科推荐
Meta:Quest 手势追踪不会用于模拟手柄
IT之家 3 月 28 日消息,Meta Quest 用户期待的“空气手柄”功能可能要落空了。近日,Meta 的一位产品经理明确表示,手势追踪功能不会用于模拟传统的实体手柄控制器。据IT之家了...【详细内容】
2024-03-29    IT之家  Tags:Quest   点击:(8)  评论:(0)  加入收藏
月入25万,批量AI美女,收割中年男人的钱包
  文|刘奕琦  号称“最难被电商撬动”的中年男人们,拜倒在了AI美女们的石榴裙下。  “中年男人不如狗”这句话,一直被视为是中年男性在消费鄙视链里的真实写照。爱捯饬...【详细内容】
2024-03-22    电商在线  Tags:AI美女   点击:(6)  评论:(0)  加入收藏
你关注的网红博主 可能是“假人”
在社交平台上,卡塔琳娜是一位在中国生活了5年的俄罗斯女孩,今年1月开始发布视频,多数附带着商品链接。她拥有超过10万粉丝,看起来只是众多带货网红中的一个。但如果留意就会发现...【详细内容】
2024-03-22    中国宁波网  Tags:网红博主   点击:(11)  评论:(0)  加入收藏
数字人下半场:奔向“真”生产力
作者:产业家如果说2023年,大家关心数字人,更多在于好奇心和新鲜感。如今的2024年,人们则更加看重其是否真正解决行业中的某些痛点。 随着技术的深入发展,数字人正在成为生产生活...【详细内容】
2024-03-21    砍柴网  Tags:数字人   点击:(7)  评论:(0)  加入收藏
IDC:预计2028年全球VR/AR设备规模达2470万台
日前,IDC发布最新市场调研数据,2023年全球VR/AR设备出货量暴跌23.5%,不过IDC也表示伴随着苹果Vision Pro的大规模上市以及全球宏观经济的改善,预计2024年将迎来爆发,出货量预计增...【详细内容】
2024-03-20    PChome电脑之家  Tags:VR   点击:(14)  评论:(0)  加入收藏
虚拟偶像的崛起:科技与艺术的完美结合!
随着科技的飞速发展,我们见证了无数领域的巨大变革。其中,虚拟偶像的崛起是近年来最为引人注目的现象之一。这些虚拟人物不仅引领了新的潮流,还为艺术与科技的结合提供了无限...【详细内容】
2024-02-01    简易百科  Tags:虚拟偶像   点击:(114)  评论:(0)  加入收藏
虚拟现实(VR)和增强现实(AR)技术的最新发展,以及它们在游戏领域的应用
虚拟现实(VR)和增强现实(AR)技术的最新发展,以及它们在游戏领域的应用随着科技的快速发展,虚拟现实(VR)和增强现实(AR)技术已经成为当今最热门的话题之一。这些技术为游戏领域...【详细内容】
2024-02-01    简易百科  Tags:虚拟现实   点击:(121)  评论:(0)  加入收藏
AR 野心遭遇 VR 现实:苹果Vision Pro头显视频透视功能并非完美
IT之家 1 月 30 日消息,苹果 Vision Pro 头显的媒体评测已经出炉,其主要亮点功能之一是 Passthrough(视频透视)功能,该功能利用外部摄像头将周围环境实时投影到头显显示屏上,旨在...【详细内容】
2024-01-30    IT之家  Tags:AR   点击:(43)  评论:(0)  加入收藏
简易百科:什么是虚拟现实与增强现实?
虚拟现实(VR)和增强现实(AR)是两种技术,它们改变了我们与数字世界的互动方式。虚拟现实是一种技术,它使用计算机生成的三维环境来模拟真实世界,通过头戴式设备等设备,用户可以沉浸在...【详细内容】
2024-01-29    简易百科  Tags:虚拟现实   点击:(157)  评论:(0)  加入收藏
虚拟现实与增强现实:电脑技术的新前沿
当我们谈论电脑技术的新发展时,虚拟现实(VR)和增强现实(AR)无疑是两个最令人瞩目的领域。这两种技术为我们的生活和工作带来了前所未有的体验,也为我们打开了全新的可能性。本文将...【详细内容】
2024-01-29  苦瓜的愁苦西瓜不知    Tags:虚拟现实   点击:(59)  评论:(0)  加入收藏
站内最新
站内热门
站内头条