敏捷机器人公司(Agility Robotics)制造的机器人“凯西”(Cassie)本质上是一对机器人腿。
但由于加州大学伯克利分校的研究人员在强化学习上采用了独特的方法,凯西已经学会了走路。
为什么它很重要:有腿的机器人比有轮的机器人更擅长在崎岖的地形上导航。
这给了他们无数应用程序——从搜索和救援来与世隔绝的探索——而这项新技术可以让训练机器人完成上述任何一项任务变得更容易。
订阅Freethink获取更多类似的故事。
对待技巧:强化学习是训练人工智能机器人行走的常用技术。
研究人员将创建一个虚拟环境,以模拟真实环境的物理特性,而不是让人工智能立即控制机器人——并冒着让昂贵的设备直接从一组楼梯上走下来的风险。
然后,他们的人工智能版本将通过一个反复试验的过程学会在这种环境中行走。它会因为想要的行为而得到奖励,而当它做错事时就会得到惩罚。
根据这些反馈,人工智能最终会在模拟中学会走路然后它可以控制一个真正的机器人。
挑战:在模拟中完美地模仿真实世界是不可能的,虚拟世界和真实世界之间的微小差异都可能影响机器人的表现。
这意味着一旦人工智能达到了机器人阶段,研究人员必须经常手动调整他们的人工智能,这可能是一个耗时的过程。
翻:伯克利的研究团队使用的是人工智能,而不是让它们的机器人腿在一次模拟中学会走路两个虚拟环境。
在第一个实验中,人工智能通过从一个预先编程的大型机器人动作库中尝试不同的动作来学会走路。在训练过程中,模拟环境的动态会随机变化——有时人工智能会遭遇较少的地面摩擦或发现自己需要承担负载。
机器人的腿可以在光滑的地面上行走、搬运货物,甚至在被推的时候还能恢复。
这种被称为“领域随机化”的技术被纳入了训练中,以帮助AI在遇到有时无法预测的现实世界时独立思考。
在第二个环境中,AI测试了它在一个非常接近真实世界物理的模拟中所学到的东西。
这种模拟的准确性只有在牺牲处理速度的情况下才有可能实现——对于机器人来说,学习如何在它上面行走花费的时间太长了,但它确实在跃入现实世界之前作为一个有用的试验场。
在那之后,人工智能被赋予了控制机器人腿的能力,在使用它们时几乎没有遇到什么麻烦。它可以在光滑的地面上行走,携带重物,甚至在推着它的时候还能恢复——这些都不需要研究人员做任何额外的调整。
第一步骤:机器人的腿需要更多的训练,才能在实验室之外真正使用。伯克利大学的研究小组现在计划,看看他们是否能复制机器人平滑的模拟到真实的转移,以更动态和敏捷的行为。
我们很乐意收到你的来信!如果你对这篇文章有什么看法,或者你对Freethink未来的故事有什么建议,请给我们发邮件(电子邮件保护)。