您当前的位置:首页 > 电脑百科 > 人工智能

解析服务型智能机器人的学习方法论

时间:2022-07-26 14:14:06  来源:  作者:格物斯坦机器人教育

近些年,随着服务型机器人和民用无人设备的快速发展,传统依靠人手工编程设计规则实现的基于规则判断的确定性的机器人操作和规划正面临着越来越大的挑战:随着任务的逐渐复杂化和场景的动态化,机器人所面对的操作环境和过程的复杂程度快速上升,使得规则难以设计;另一方面,用户对服务型机器人和无人设备的行为亲和性提出了更高的要求,机器人需要在与人合作过程中采取更适应人类习惯,更个性化的行为模式,即从人适应机器逐步向机器适配人发展,这就使机器人行为的可学习性与适应性变得格外重要。

 

早先为赋予机器人执行任务的能力,在机械和自动化领域已有大量成熟的不基于学习的方法,其特点为使用了大量的预先设计的操作与决策规则。代表性的如使用软件编程方式实现的序列操作逻辑、使用目标相关的引导函数直接完成对行为的逆运动学优化求解、使用轨迹跟随方式直接控制机器人执行给定轨迹和远程遥操作机器人行为等。机器人实验室建设在目前主流的机器人任务环境中拥有广泛的应用,但仍有不足:在设计规则或任务优化函数时,需要对机器人的机械结构、性能有较清晰的建模;对环境的确定性有较为严格的假设要求,在遥操作中对操作者的操作水平、操作通信的实时性有较高的要求,这些要求随着机器人在道路、室内等非结构化环境中的逐步普及,变得越来越难以满足。基于青少儿机器人学习方法依赖现存的方法发展而来,通过从数据中的学习完成对策略的调整,不断地降低机器人操作策略制定中人参与的部分;同时通过探索学习,自主实现对环境的建模,从而放松对环境和自身机械结构建模的依赖。

解析服务型智能机器人的学习方法论

 


不同于使用预先设计的规则实现操作任务,机器人技能学习强调在动态变化的环境中,在给定的任务下,利用大量数据或仿真提供的信息,动态交互地自主实现任务技能学习,并使用学习得到的策略在动态的环境中完成任务规划。创未来机器人作为一种学习方法,数据的质量和形式极大地影响着学习效果的好坏。对于离散时间(多步)决策序列,我们定义每一个决策时刻所依据的有限信息为,在此时刻执行的有限决策行为为,所构成的行为序列轨迹为。学习的数据为由行为序列构成的集合,学习的对象是任意状态下的决策策略。现有的两种常见的数据获取和策略优化方式为:


给出人工指定的函数来指导策略学习的强化学习类方法:使用建模在行为序列上的回报函数和建模序列行为的好坏,通过动态规划迭代求取最优策略。机器人课程教案与儿童机器人编程此方法适用于序列中每一时刻的行为优劣都有清晰明确的定义的情形,即较高的回报函数和代表较好的执行效果。此时我们可以通过大量的迭代探索,实现对回报函数的优化,同时得到大量较优的行为轨迹以进行策略的学习。

此方法以最大化与专家示教策略的相似程度作为学习目标,适用于任务指标难以明确,回报函数难以设计的场合。可以通过遥操作或专家在回路中的操作来获得。得到专家示教序列后,可以通过不断地环境交互实现最大化重现专家状态,进而最大化重复专家的决策行为。目前常见的使用回报函数定义最优策略并进行学习的方法为强化学习方法,强化学习方法通过定义一套值函数,并借助环境探索遍历迭代完成对值函数的采样与近似。教学教具 机器人其中值函数的物理意义为在当前策略下,在状态或在状态而做出动作所得到的预期回报函数和,即代表了对当前策略在当前情形下的最优性的判断。通过每次采用最大化回报函数的策略,或按照回报函数增长方向更新现有策略,即可学习得到更好的行为决策模型。此类方法由于其目标为最优化回报函数期望和,因此效果好坏严格依赖回报函数本身的定义是否足够严谨,对较差轨迹的区分是否足够显著。


目前常见的使用示教轨迹定义最优策略并进行学习的方法为模仿学习方法。模仿学习方法通过定义一种建立在专家决策序列和当前策略产生的序列之间的相似性度量,或直接建立策略之间的相似性度量,并使之最大化(或最小化)来完成对专家示教中蕴含策略的学习。机器人早教常见的模仿学习方法分为两大类,其一为直接通过在示教样本上的监督学习来学习专家策略,数学描述为在专家决策序列每一时刻的状态-决策对下,监督式的学习,从而使得在每个专家状态上,最大可能性的复现专家示教的决策行为。

 

这种做法在面对确定性环境时较为快捷,但无法应对动态环境下未知状态带来的影响,即当实际执行时,由于累计误差和噪声等因素的影响,机器人到达未出现在专家示教序列中的状态时,其决策行为将无法得到有效保证。另一种方法是使用逆强化学习,借助环境探索,机器人少儿评价,不仅要求在专家示教包含的状态上做出相似于专家的决策行为,同时通过在整个观测空间回归代价函数并进行优化,使得学习到的策略在未包含在示教中的状态上,做出最大可能回到示教状态的行为。在儿童机器人方案中,不管使用监督学习或逆强化学习中的何种方式,模仿学习方法由于学习目标在模仿专家行为,因此对专家示教的数量和质量都提出了极高的要求,在示教较少,质量不好的情况下,很难进行有效的学习。

 

作为一种人在回路中的学习方法,倾向性学习的核心是人参与交互的便捷性,其中包括尽可能少的交互次数、尽可能充分的对样本的利用、尽可能符合人习惯的倾向性信息获取方式。编程机器人在以上三种倾向性学习方式中,第一种方式虽然较为简单直观,但要求专家在机器人每一次决策时给出判断,效率较低;第二种方式的学习稳定性依赖每一次交互得到的倾向性建模好坏,对策略缺少合理的约束使得求解效率低下;第三种方式将倾向性学习问题转化为一种类似于对倾向性选择得到结果的模仿学习,具备模仿学习的高效性和稳定性,但不适用于以排序为呈现形式的倾向性数据。

 

综上所述,通过借助示教的强化学习和倾向性学习,我们可以部分解决示教和回报函数质量不高或难以提供情形下的学习问题,面对现实生活中的机器人操作技能学习问题,在已经充分建模的确定性环境如生产线中,科学机器人现有的基于学习的方法仍难以取代基于手工方式设计实现的传统意义下的机器人控制器。相关领域的研究目前仍处在实验室阶段,但由于学习方法能够明显减轻人工设计规则的压力,同时从原理上能够有效地应对动态环境与交互操作需求,基于学习的方法有极大的研究必要性,相关领域也在快速发展中。此份简述仅作为对其中两个小方向的部分总结,机器人操作技能学习领域仍有大量待解决的问题,值得进行更深入的探讨。



Tags:机器人   点击:()  评论:()
声明:本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,不构成投资建议。投资者据此操作,风险自担。如有任何标注错误或版权侵犯请与我们联系,我们将及时更正、删除。
▌相关推荐
当“机器人”有了“AI大脑” 人形机器人时代来了吗
数智风向标当“机器人”有了“AI大脑”​人形机器人时代来了吗简单明了的口令下达后,机器人便开始搬箱子、运小球,在各类不同的地形行走……这些身上布满芯片和传...【详细内容】
2024-04-08  Search: 机器人  点击:(15)  评论:(0)  加入收藏
​人形机器人时代来了吗
日前,由中国人形机器人(11.080, -0.05, -0.45%)百人会主办的人形机器人大赛在北京经济技术开发区开赛。工作人员向参观者展示一款人形机器人。参观者与一款陪护型人形机器人...【详细内容】
2024-04-08  Search: 机器人  点击:(10)  评论:(0)  加入收藏
哥伦比亚大学华人开发「人脸机器人」,照镜子自主模仿人类表情超逼真
【新智元导读】OpenAI 机器人理解力虽强,却无法进行非语言交流。最近,哥伦比亚大学华人团队打造了全新的机器人 Emo,不仅可以提前预测和模拟人类表情,还可以进行眼神交流。此前,...【详细内容】
2024-04-01  Search: 机器人  点击:(26)  评论:(0)  加入收藏
马斯克:人形机器人成本将不到一辆汽车的一半
特斯拉CEO埃隆·马斯克周二表示,他认为人形机器人的成本最终将不到一辆汽车的一半。马斯克是在回应一位X用户的帖子,该用户写道:“人形机器人的重量还不到汽车的十分之一...【详细内容】
2024-03-27  Search: 机器人  点击:(23)  评论:(0)  加入收藏
世界首款人形机器人模型正式亮相,距离真正进入生活还有多久?
央广网北京3月19日消息(记者 万玉航)人形机器人正在智能化道路上加速狂奔,成为未来AI发展的新热点。3月19日,英伟达CEO黄仁勋宣布世界首款人形机器人模型正式发布。在演讲中,黄仁...【详细内容】
2024-03-20  Search: 机器人  点击:(30)  评论:(0)  加入收藏
英伟达发布机器人基础模型,具身智能离现实又进了一步?
·英伟达发布人形机器人通用基础模型Project GR00T和新型计算机 Jetson Thor,希望能让机器人拥有更聪明的大脑。·上海机器人产业技术研究院副院长周梅杰分析认...【详细内容】
2024-03-20  Search: 机器人  点击:(12)  评论:(0)  加入收藏
世界首款!英伟达重磅发布人形机器人模型
3月19日,在备受瞩目的GTC 2024大会上,英伟达CEO黄仁勋带来了一项震撼人心的发布:世界首款人形机器人模型正式亮相。这一创新成果不仅标志着英伟达在人工智能领域的又一重大突破...【详细内容】
2024-03-19  Search: 机器人  点击:(18)  评论:(0)  加入收藏
英伟达抛出年度AI杀器:史上最强芯片,还有机器人大模型
作者丨邱晓芬、景霖编辑丨苏建勋3月18日-21日期间,英伟达在美国圣何塞召开GTC大会。作为英伟达一年一度的技术发布会, GTC大会也被誉为AI行业的风向标。创始人黄仁勋在GTC大会...【详细内容】
2024-03-19  Search: 机器人  点击:(17)  评论:(0)  加入收藏
与OpenAI合作13天后,Figure人形机器人展示与人类对话能力
人形机器人与AI的结合加快了,Figure AI的机器人开始与人类对话。北京时间3月13日深夜,一段人形机器人视频在社交媒体上热传,主角是Figure AI的人形机器人。2月底,Figure AI刚刚...【详细内容】
2024-03-14  Search: 机器人  点击:(14)  评论:(0)  加入收藏
成立仅2年,做出能和人类对话的人形机器人,Figure AI什么来头?
昨天夜里,一段人形机器人的视频在外网刷屏了。视频里,这款机器人按照人类口头指令进行了一些简单的抓取和放置动作,比如递给人类苹果、将塑料袋收拾进篮子里,把杯子和盘子归置放...【详细内容】
2024-03-14  Search: 机器人  点击:(16)  评论:(0)  加入收藏
▌简易百科推荐
Meta AI 全球市场扩张,并上线网页版 meta.ai
IT之家 4 月 19 日消息,Meta 公司近日宣布 Llama 3 大语言模型之外,扩展 Meta AI 服务到美国之外的 13 个国家和地区,还宣布上线专门的聊天网站:meta.ai。Meta 公司在新闻稿中表...【详细内容】
2024-04-19    IT之家  Tags:Meta AI   点击:(2)  评论:(0)  加入收藏
重磅!Meta推出开源大模型Llama 3,性能直逼GPT-4
每经编辑:杜宇当地时间4月18日,AI 领域迎来重磅消息,Meta正式发布了人们等待已久的开源大模型Llama 3。与此同时,Meta首席执行官扎克伯格宣布:基于最新的Llama 3模型,Meta的AI助手...【详细内容】
2024-04-19    每日经济新闻  Tags:Llama 3   点击:(4)  评论:(0)  加入收藏
大模型下众生相:焦虑者、使用者和弃用者
大模型实际运用如何?文 | 周享玥编辑 | 赵艳秋 来源丨数智前线2024年,公认的大模型应用元年,不管是B端还是C端,都呈现出加速快跑的姿势。最近,我们和六位来自不同行业的大模型...【详细内容】
2024-04-18    投中网  Tags:大模型   点击:(10)  评论:(0)  加入收藏
AI圈公开的秘密:天下模型一大抄
抄袭已经成为AI世界公开的秘密。据The Information周一的文章,许多初创公司的AI聊天机器人很可能是采用了OpenAI和其他公司的数据开发的。这些机器人在某些任务上可以媲美GPT...【详细内容】
2024-04-17    华尔街见闻  Tags:AI圈   点击:(5)  评论:(0)  加入收藏
“AI+”进入中学课堂,家长何以很矛盾?
据4月15日《中国青年报》报道,近年来,随着ChatGPT等模型的快速迭代,生成式人工智能(AIGC)技术逐渐成为大众广泛关注的焦点。新技术的发展给各行各业带来新的可能和挑战,对教育领...【详细内容】
2024-04-17    工人日报  Tags:AI   点击:(6)  评论:(0)  加入收藏
Sora加入Adobe全家桶,视频改图加戏样样行
基于 Adobe 自己的大模型 Firefly 的能力,可以在视频素材上直接添加或减少内容,转场时感觉少点烘托背景的镜头,用 OpenAI 的 Sora 可以自动生成一段。Adobe 全家桶马上就要拥有...【详细内容】
2024-04-16    机器之心  Tags:Sora   点击:(3)  评论:(0)  加入收藏
光明日报:孩子用AI写作业,该担忧吗?
随着科技的发展,人工智能技术不断得到拓展与完善。而今,文字输出、信息检索、方案优化,乃至居家生活,越来越多的人已经离不开AI的帮助。与此同时,根据媒体报道,近期,一些“独具慧眼...【详细内容】
2024-04-16    光明日报  Tags:AI写作业   点击:(6)  评论:(0)  加入收藏
“弱智吧”成最佳中文AI语料库,究竟什么算优质数据?
出品|搜狐科技作者|郑松毅谁能想到,被誉为“最大原创段子手孵化地”的弱智吧,最近竟摇身一变成了——最佳中文AI训练语料库?由此受到启发,是否并不是训练AI的优质数据不...【详细内容】
2024-04-16  搜狐科技    Tags:优质数据   点击:(7)  评论:(0)  加入收藏
ChatGPT 应用商店?可能是一个万能应用程序!
OpenAI 在去年 11 月召开了一次开发者大会,首席执行官 Sam Altman 希望软件制造商在 ChatGPT 之上进行进一步的构建。OpenAI 表示,它将很快推出一个市场,开发人员和非技术人员...【详细内容】
2024-04-12  视角先锋队    Tags:ChatGPT   点击:(9)  评论:(0)  加入收藏
Kyligence发布企业级AI解决方案!AI数智助理降低数据使用门槛
智东西作者 | 长颈鹿编辑 | 李水青智东西4月12日报道,昨日大数据分析和指标平台供应商Kyligence(硅智信息)召开了数智论坛暨春季发布会,并分享和探讨Data+AI产品及解决方案在金...【详细内容】
2024-04-12    智东西  Tags:Kyligence   点击:(10)  评论:(0)  加入收藏
站内最新
站内热门
站内头条