为了使机器人能够像人类一样在飞行中学习,一种新的方法扩展了机器人的训练数据集,用于处理绳子和织物等柔软物体,或者在混乱的环境中工作。
它由密歇根大学的机器人研究人员开发,可以将新材料和新环境的学习时间缩短到几个小时,而不是一两个星期。
在模拟中,扩展的训练数据集将机器人在发动机缸体上绕绳子的成功率提高了40%以上,几乎是物理机器人完成类似任务的成功率的两倍。
这项任务是机器人机械师需要能够轻松完成的任务之一。但是,使用今天的方法,学习如何操作每条不熟悉的软管或皮带将需要大量的数据,可能需要收集数天或数周,密歇根大学机器人副教授德米特里贝伦森说,他今天在纽约机器人科学与系统会议上发表了一篇论文。
在这段时间里,机器人会摆弄软管——拉伸它,把两端合在一起,绕着障碍物绕圈等等——直到它明白软管可以移动的所有方式。
贝伦森说:“如果机器人在安装软管之前需要玩很长时间,这对很多应用来说都是行不通的。”
事实上,人类机械师可能不会对一个需要这么多时间的机器人同事留下深刻印象。因此,贝伦森和机器人博士研究生彼得·米特拉诺(Peter Mitrano)对一种优化算法进行了改进,使计算机能够做出我们人类所做的一些概括——预测在一个实例中观察到的动态如何在其他实例中重复。
在一个例子中,机器人在拥挤的表面上推动圆柱体。在一些情况下,圆柱体没有击中任何东西,而在另一些情况下,它与其他圆柱体相撞,它们也随之移动。
如果圆柱体没有撞到任何东西,这个运动可以在桌子上的任何地方重复,只要轨迹没有把它带到其他圆柱体上。这对人类来说是直观的,但机器人需要获得这些数据。米特拉诺和贝伦森的程序不需要做耗时的实验,而是可以在第一次实验的基础上创造出不同的结果,以同样的方式为机器人服务。
他们把捏造的数据集中在三个方面。它必须具有相关性、多样性和有效性。例如,如果您只关心机器人在桌子上移动圆柱体,那么地板上的数据就无关紧要了。另一方面,数据必须是多样化的——表格的所有部分,所有角度都必须被探索。
“如果你最大化了数据的多样性,它就不会足够相关。但如果你最大化了相关性,它就不会有足够的多样性。”“两者都很重要。”
最后,数据必须是有效的。例如,任何两个圆柱体占用相同空间的模拟都是无效的,需要识别为无效,以便机器人知道不会发生这种情况。
对于绳子的模拟和实验,Mitrano和Berenson通过将绳子的位置外推到物理空间的虚拟版本中的其他位置来扩展数据集——只要绳子的行为方式与初始实例中的相同。仅使用最初的训练数据,模拟机器人在48%的时间内将绳子挂在发动机缸体上。在增强数据集上进行训练后,机器人的成功率为70%。
一项用真实机器人进行的实时学习实验表明,让机器人以这种方式扩展每次尝试,在30次尝试的过程中,成功率几乎翻了一番,成功尝试了13次,而不是7次。
这项工作得到了美国国家科学基金会拨款IIS-1750489和IIS-2113401,海军研究办公室拨款N00014-21-1-2118和丰田研究所的支持。
引用此页: