在***近发表在《科学机器人》杂志上的一篇论文中,联合研究小组详细介绍了一种人工智能强化方法,他们用这种方法让自己的机器狗“绝影”学会如何走路和自主从跌倒中恢复过来。该团队表示,他们首先在模拟环境中通过软件训练虚拟机器人。这个软件由八名经过培训以掌握特定技能的AI“***”组成,例如,一个“***”训练机器人流利的行走,而另一个训练机器人如何保持平衡。每次虚拟机器人成功完成一项任务时,团队都会以虚拟积分奖励它。这个过程听起来与Google***近用来训练MuZero算法的方法相同。 当八种专项技能培训完成后,研究团队开发了一个额外的神经网络,有些类似于运动队伍中的总教练管理,它将管理其他八种专项技能,在特定的情况下,还会根据需要对一种或者多种技能进行优先排序。***后,研究团队会将软件移植到原型机器人上进行实际测试。
他们研究的目标是创造更加智能化的机器人,这种智能机器人能够在行进中更加灵活地根据实际情况自适应选择技能,以便于处理未经训练过的任务内容。目前,该团队面临的挑战之一是如何减少模拟机器人训练所需要的计算力,这样研究才更具有实用性价值。
更多详情查询:智能机器人