关键词:机器人,
来源:机器人大讲堂 2022-01-17
许多人都在思考机器人进入千家万户会有多远,但丰田的机器人研究者认为,机器人进入家庭生活已经没有问题,但最大挑战是可靠性。
机器人进入人类社会的初期,必然会比小孩子犯更多各类错误,只有将这种错误率降低到接近于零,机器人才真正有可能稳定走进人类生活。
因为与环境大多是相对结构化和可编程的工厂不同,人类环境如某人的家必然是非结构化和多样化,机器人在人们每天工作生活的复杂、非结构化环境中持续可靠地运行难度很高,每个家庭独一无二,具有不同配置且由不断变化的对象随机组合。
由于人类活动中任务、环境和要处理的物体(从玩具和餐具到洗衣)种类多流程长,机器人进行例如如何学习和执行诸如擦拭表面、捡起各种物品和装入洗碗机,以及在专为人类而非机器人设计的动态环境中运行的任务难度非常高。在这种动态非结构化环境中,传统获取大量数据进行动作的方式并不实用。因此,丰田的研究者们一直希望找到一种更省时省力的方法,从更少的数据中学习如何完成动作,同时降低成本。
▍研究演变历程
早在2020年10月,美国加利福尼亚州洛斯阿尔托斯的 TRI 总部里,由 Jeremy Ma 和 Dan Helmick领导的研究团队就首先尝试让机器人进入一个“模拟家庭”的设施中测试工作。模拟家庭设有厨房、用餐区、浴室和生活空间,与实际房屋中的相似。在这种研究环境中,TRI 可以重新排列地板布局和移动物体,使TRI 能够在更像真实的家庭环境中测试它们之前开发基本的机器人功能。
这项工作侧重于解决两个关键挑战:一个是如何从人类行为逻辑延伸到机器人,另外则是如何使用模拟来训练和验证机器人行为。
TRI 机器人技术副总裁 Max Bajracharya表示:“未来在家庭环境中,我们希望当一台机器人从人类那里学习某些东西时,它们都会像孩子一样总结和学到一些技巧,这将是使机器人在人类环境中更加实用化的关键。”
同时,TRI 认为,要使机器人技术在家庭中取得更大范围的成功,发现并考虑到个人的特性、需求和实现方式也非常重要。因为每个用户代表一个独特的案例,真正了解如何开发以人为中心的机器人技术需要不仅仅只是为人们提供小工具,而是想方设法让机器人保留人类真正独特的个性化方式。
▍核心技术解析
基于这些认识,TRI采用了云机器人技术和深度学习结合的fleet learning技术,开始使用遥操作和虚拟现实系统结合的方式,指导机器人进行学习,同时建立了一个机器人用户体验和工业设计小组来发现和探索真正的用户需求。
人类训练师实时查看机器人所见,然后命令机器人执行各种不同的动作,这样如果一个机器人在模拟家庭厨房学习擦拭任务,它可以在任何厨房完成相同的任务。
Fleet learning技术的好处在于,如果研究者无论通过人类遥操作还是在模拟中让一个机器人学习执行了一项任务,后续该主体都可以与系统中其它所有机器人共享这些知识,以便它们可以在类似新情况下执行任务,从而帮助机器人实现能力指数级增长。
这种人类参与的方式,能利用人类的智慧和洞察力,来指导机器人的具体执行,从而让机器人的行为动作更加具备通用性和可靠性。为了解决机器人在家庭环境中面临的多样性问题,TRI 则尝试教导机器人使用各种对象执行任意任务,而不是对机器人进行编程以使用特定对象执行特定的预定义任务。
通过这种方式,机器人学会将它所看到的与它所教的动作联系起来。当机器人再次看到特定的物体或场景时,即使场景略有变化,机器人也能知道它可以根据所看到的内容采取什么行动。
在教授任务时,训练员可以利用他们的创造力使用机器人的手和夹爪来尝试不同的方法执行任务,这使得机器人利用和使用不同的工具变得容易,也让人类能针对特定情况将他们的知识快速转移到机器人。
,时长
04:50
TRI 的实验表明,目前TRI 的这套系统可以在大约 85% 的时间内成功执行相对复杂的人类任务,这个数据包括让机器人在识别出它在特定行为上失败时自动重试的概率。每个任务由大约 45 个独立的行为组成,这意味着每个单独的行为在 99.6% 的情况下都会导致成功或可恢复的失败,当然这距离100%可靠并真正走进千家万户,还有非常大的距离。
▍延伸与发展
丰田也在考虑例如厨房等相对固定化的场景中,开发一些折中的系统化方案,这让这项技术也在2021年得到了非常多的延伸。
(龙门吊顶式厨房机器人。资料来源:丰田研究所)
低成本传感器无疑是人类将机器人技术带进更大范围场景的重要推动力。多年来人们一直尝试让机器人具备更像人的特性,传感器就是人类感官的很好替代物,但用机器人复制人类身体的各项能力往往就需要无数传感器,同时能将所有的数据发送到某个处理单元进行处理,这其实也非常考验整体数据处理能力。
在硬件上,为了满足机器人与室内环境交互时对软接触的需求,TRI 研究人员开发了具有高密度触觉感知能力的新型软抓手。这种抓手类似于人类指垫的软气泡夹具,其内部装有摄像头,可记录不同物体如何使气泡变形,同时在环境中加入了一些摄像头和传感器,这配合大量虚拟仿真后的算法,能让机器人不需要对物体有太多了解,只需要感知基本几何形状就可以执行某些动作。但这还远远不够,在真实家庭生活中,往往还必须了解每个物体的形状、位置和方向,因此这条路径还很长。
(TRI开发了一直柔软触感的机器人“手试图解决更多问题,资料来源:丰田研究所)
不只是在家庭生活,TRI 也希望在一些公共场景中能够快速落地。虽然抓取技术能够满足要求,但在这些场景中,不同的光环境带来的挑战尤其巨大。例如在超市,机器人面对的环境比家庭中更加复杂,由于超市中各种商品,有的非常柔软,有的棱角分明,货架上的商品在超市的强光照下,更是反射出五颜六色的光芒,这对于机器人的各种传感器提出了更为巨大的挑战。
12月27日,丰田研究所 ( TRI ) 的机器人公布了正在进一步尝试挑战这种存在复杂光源环境的方法场景,该研究已经取得了一定成效。TRI 发现,人类对于这些复杂事物的处理方式,除了用眼睛看见,也经过了大量的思考和理解,才有了更进一步的动作执行,因此,丰田继续选择了“fleet learning”的方法,希望能让机器人摆脱人类云端控制或者编程,通过具备“判断能力”来进一步解决这些现实难题。
,时长
04:16
TRI 认为,fleet learning的方法还可以轻松扩展到家庭之外并应用于其他环境。例如,一个人可以快速远程地教工厂的多台工业机器人执行重复的制造任务,或者快速调整物流机器人的拣货-移动-包装任务,但这目前也面临数据私密性和工艺可复制性问题,TRI 也正在尝试解决。
“如果一个机器人无法正确处理您的杯子,那么世界各地的所有机器人都会从该错误中吸取教训。我们的下一项工作重点是开发算法,以便在我们发现新的故障案例时自动“修复”感知算法或控制器从而实现对这项工作的升级优化。”TRI 机器人研究副总裁Russ Tedrake说。
▍技术与理念
与大多数为了实现自动驾驶汽车而去开发机器人技术的汽车制造商不同,当前,随着丰田转变为一家移动解决方案的公司,其团队正利用技术通用性,扩大技术本身的应用面和覆盖面,专注于最终为城市的控制平台或基础设施技术提供各类解决方案。
丰田研究所认为,丰田正在投资的机器人技术,可以将其作为汽车增强移动性的逻辑延伸,但无论研究领域如何扩展,都将保留“自动化以人为本”作为最重要的技术元素。就像是 Ikigai 概念提出的理念,这意味着机器人或人工智能等系统不应取代人类,而是永远珍惜人本身的“能动性”,丰田一直希望通过开发更人性化的系统来实现幸福生活。
据联合国称,在接下来的三十年中,全球 65 岁以上的人口预计将增加一倍以上。这意味着到 2050 年,全世界将有超过 15 亿人年满 65 岁或以上。人口老龄化将对社会、劳动力和经济产生深远影响。
因此机器人技术必然将在未来逐渐走进更多家庭,丰田研究人员一直在尝试将机器人技术用于各种应用,希望致力于“帮助人类完成各类生活活动,推动与人和谐相处”。例如丰田研究所就也曾开发了外骨骼机器人,希望帮助无法自行移动的残疾人以及解决人口老龄化问题。
基于这种认识,丰田研究所提到,未来TRI 的研究不是取代人类,而是利用人工智能来增强人类能力。这种方法被称为智能增强 (IA),即大数据和机器学习代表着人类智能的放大,使用大量数据和机器学习,目的就像让机器人能够“联系上下文”一样,最终实现以一种更简单而基础的方式来理解他们所看到的东西,突破“从看到行为”的认知障碍。当然,这条路或许还很漫长。
▍结语
“经过1000次不计成本的实验,我们的镜头成功捕捉到机器人成功了一次,然后向全世界展示了该视频,这让人们会误以为它在所有情况下都能正常工作。”TRI 首席执行官 Gill Pratt 说道。“研究者所做的大量工作,必然是试图将机器人技术带出DEMO的时代,这就需要更高的可靠性和稳定性。”
可以判断,走进千家万户的机器人必然与大多数自动驾驶汽车一样,需要去不断感知周围环境,预测一个“绝对”安全路径,然后根据这种理解计算出运动轨迹。另一方面,新的深度学习方法未来必然直接将从视觉和各类传感器输入计算低级运动动作,这就需要机器人能够处理执行任务带来的大量数据,将会拉动和延伸出更多产业的发展。
机器人走进千家万户,远没有在科幻小说和流行娱乐影像作品中看到的那么简单,但在这个技术进步巨大的时代,我们相信这并不会太遥远。