微软团队正探索如何将 OpenAI研发的ChatGPT扩展到机器人领域,旨在让人类用自然语言控制如机械臂、无人机、家庭辅助机器人等多个平台。3月23日,OpenAI还领投了挪威人形机器人公司1X。
3月8日,谷歌和柏林工业大学的团队重磅推出了史上最大的视觉语言模型——PaLM-E,同时谷歌表示,计划探索PaLM-E在现实世界场景中的更多应用,例如家庭自动化或工业机器人,希望PaLM-E能够激发更多关于多模态推理和具身AI的研究。
据了解,阿里云工程师也正在实验将千问大模型接入工业机器人,以便实现远程指挥机器人工作。在近日举行的第六届数字中国建设峰会上,阿里云发布的一个演示视频中展示了千问大模型的实际应用场景。
“我渴了,找点东西喝吧。”工程师通过钉钉对话框向机器人发出指令后,千问大模型回答,“好的,我找找有什么喝的。”随后,千问大模型在后台自动编写了一组代码发给机器人,机器人开始识别周边环境,从附近的桌上找到一瓶水,并自动完成移动、抓取、配送等一系列动作,递送给工程师。
科幻电影中机器人和人交互的画面正在变成现实。
▍技术能力解析
从技术原理上来理解,这意味着千问大模型首先理解了人类这句话的内容,然后在后台自动编写一组代码发给机器人,机器人则完成识别周边环境、找水至配送等一系列动作。
在钉钉对话框输入一句人类语言即可指挥机器人工作,这将为工业机器人的开发和应用带来革命性的变化。其背后意味着大模型为工业机器人的开发打开了新的大门。因为千问等大模型为机器人提供了推理决策的能力,从而有望让机器人的灵活性和智能性大幅提升。
阿里云工程师表示,这种能力意味着新的变革。机器人之前能够完成一些人类设置的固定任务,但并不能执行一些需要“随机应变”的任务,“AI大模型突破了机器人的局限,让人类可以通过自然语言指挥机器完成负责任务,让机器人真有了大脑。”
可以说大模型的诞生为工业机器人打开了一扇新的窗,据阿里云工程师介绍,例如在生产运行时,一线工程师只需发送一段文字,千问就能理解其意图进行任务推理,并自动翻译成机器可以理解的代码,指挥机器执行任务,有效提升生产效率。
阿里巴巴董事会主席兼 CEO、阿里云智能 CEO 张勇表示,数字化是基础,智能化是方向,当前的人工智能浪潮是和 20 年前的数字化浪潮同等重要的机会,行业正处于智能化时代的历史新起点。阿里正朝着这个方向快速迈进。
“就像数字化时代出现一批数字原生企业,智能化时代也必将出现一系列智能原生企业。我们深刻感受到,‘所有不可想象,终将化为寻常’。”他说。
目前,人们依然严重依赖代码来实现对机器人的控制,人类操作机器人需要学习复杂的编程语言或机器人系统的细节,而GPT等大模型的出现,为推翻竖立在人类与AI面前的“巴别塔”提供了新思路,即将多模态的大语言模型作为人类与机器人沟通的桥梁。
正如阿里云工程师所说,“AI大模型突破了机器人的局限,让人类可以通过自然语言指挥机器完成负责任务,让机器人真正有了大脑。”
张勇也表示,由于实体经济是智能化主战场,新的AI大模型让千行百业将被重新定义。“AI大模型将以更低门槛、更高效率,打通一个个数据断流节点,推动数据在研发、生产、配送、服务等环节畅通流动,服务实体经济的智能化升级。”
当然,大模型对机器人领域的加持不仅体现在应用环节,也可参与开发环节。
面向制造领域,阿里云将进一步融合千问大模型与阿里云物联网平台能力,为企业提供智能解决方案,让生产制造全流程变得更智能、更高效。
据阿里云工程师介绍,在机器人开发阶段,工程师可通过千问大模型自动生成代码指令完成机器人功能的开发与调试,甚至还能为机器人创造一些全新的功能。
日前,阿里云已宣布启动“通义千问伙伴计划”,将优先为千问伙伴提供大模型领域的技术、服务与产品支持,共同推动大模型在不同行业的应用,已有超20万企业用户申请接入千问测试。
▍难点和未来
不过,大模型只是提供了一种新思路,距离能听懂“人话”的机器人面世,或许还有很长的路要走。
因为语言模型固然可以为机器人提供更好的步骤规划评估和选择,但并不能面面俱到,比如不能告诉机器人打开冰箱时应施加多大的力。因此,我们发现全世界包括谷歌在内的巨头也暂时没有将装上大模型的机器人商业化的计划。
但制造业是AI大模型的重要应用场景之一,未来的机遇在于云、AI与物理世界机器的融合,AI大模型必然能为工业机器人、服务机器人的智能化发展带来了新的机遇和挑战,而这也将推动实体经济向更加智能化的方向发展。
为此,除了阿里外,国内多家互联网巨头也在AI+机器人领域动作频频。
4月25日,据腾讯Robotics X实验室公布最新机器人研究进展,首次展示在灵巧操作领域的成果,推出自研机器人灵巧手“TRX-Hand”和机械臂“TRX-Arm”。
4月24日,据企查查App显示,近日北京小米机器人技术有限公司成立,注册资本5000万元人民币。经营范围包含:智能机器人的研发;人工智能行业应用系统集成服务;人工智能基础资源与技术平台;微特电机及组件制造等。资料显示,小米在国内机器人布局版图不断扩大,从CyberDog(仿生机器狗),再到Cyberone(仿生机器人),持续加注在机器人领域的研发和创新。
而国内2022年受益于汽车动力 电池、光伏等新能源行业的发展机遇,随着今年工业机器人行业景气度继续提升,多家机器人企业也在开辟自己的新方向,例如通过机器视觉、传感器等相关技术的发展及与工业机器人深度结合,促进工业机器人的可用性和易用性。
根据国家统计局统计,2015—2022年我国工业机器人产量由3.30万台增长至44.31 万台,CAGR达44.92%,2023年1-3月工业机器人累计产量10.37万台,同比-3.00%,工业机器人行业正步入窗口期。多家企业收入实现快速增长,但盈利能力需要进一步改善。
从发展方向上看,随着工业机器人应用门槛的下降,工业机器人的应用已经不再局限于对负载、响应性、一致性要求较高的行业,AI的发展更是已经推动了机器人企业软硬件迭代加速。未来工业机器人的发展以提升应用广度和深度为方向,其中运动控制技术、控制系统技术促进产品性能提升,AI相关技术促进智能化提升,未来工业机器人会向着智能化、精细化方向努力,另一部分硬件制造、集成新技术则推动工业机器人赋能多行业进一步深化。