跳转到主要内容
移动世界。
加固学习机器人

引导形象©Bublikhaaus / Adob​​e Stock

Treats-for-tricks工作训练狗显然,AI机器人,太。

这是一个新的外卖学习在约翰·霍普金斯大学,研究人员开发了一种新的训练系统,通过模仿狗学习新技巧的方式,机器人可以快速学习如何在现实世界中完成多步骤的任务。

强化学习

有一天,AI机器人可以清洁我们的家园照顾长者,做所有的沉闷,肮脏和危险职位我们不想做。

但现实世界很复杂。开发人员需要培训机器人来学习工作 - 例如,无法识别每种可能的脏盘子,但仍然需要知道当一个不熟悉的人进来时要做什么水槽。

开发人员培训AIS是通过让他们探索虚拟世界和“奖励”他们做正确的事情。这技术被称为加强学习,它与我们如何训练狗 - 他们做了一件伎俩,他们得到了款待。

强化学习可能是有效的,但也可能是耗时的——人工智能在找到值得奖励的技巧之前可能会尝试很多东西。

为了克服这一限制,JHU团队开发了一个新的加强学习框架,他们呼叫正面任务(现货)的时间表。

“这里的问题是,我们如何让机器人学习一项技能?在新闻发布会上说的。“我养过狗,所以我知道奖励工作,这是我设计学习算法的灵感。”

见点堆栈

在现场框架中,机器人的“奖励”并不是一种美味的对待,而是数值点。与此同时,“诀窍”,彼此叠加多个块。

研究人员发现,加快训练时间的一种方法是奖励他们的人工智能完成“子任务”。这就相当于试着训练一只狗坐下,如果它坐下就给它一个奖励开始降低其后方 - 狗没有做到你想要的,但它在正确的道路上。

“它曾经花一个月达到100%的准确性。我们能够在两天内完成。”

安德鲁Hundt

如果AI做了一些与之前的进程相反的事情而丢了分,比如在堆叠积木后把积木打翻,这也会有帮助——这被称为“进程逆转”。

他们还将一些常识进行了编写了一些常识,用直觉进行预编程,以避免在死亡的浪费时间,并认识到它应该更快地做的事情。

“(g)在薄的空气中咆哮不值得拥有机器人的时间,但(自从)机器人通过试验和错误学习,他们通常不会有这种直觉,直到现在,”Hundt告诉Freethink。“我们已经为机器人制定了一种实用的方法,将这种常识知识纳入安全检查,这跳过绝对不值得尝试的行动。”

SPOT框架的未来

总的来说,他们的框架让他们培养一个实际的机器人 - 不仅仅是一个虚拟世界的AI - 准确地完成多步任务的速度比另一种普通的强化学习更快方法

“(机器人)迅速了解获得最佳奖励的正确行为,”Hundt在新闻稿中说。“事实上,它曾经为机器人进行了一个月的练习,以实现100%的准确性。我们能够在两天内完成。”

他希望SPOT框架有朝一日能帮助人工智能开发人员训练机器人做比堆叠积木复杂得多的事情。

“我们认为,随着进一步的发展,这项技术有可能改变各种行业,从家庭护理和手术到仓储,甚至自驾驾驶,”他告诉弗里希思。

我们很乐意收到你的来信!如果你对这篇文章有什么看法,或者你对Freethink未来的故事有什么建议,请给我们发邮件(电子邮件保护)

下一个

人工智能
培训一个家居机器人看 - 听到
家庭机器人
人工智能
培训一个家居机器人看 - 听到
脸书的人工智能实验室为其嵌入式人工智能训练平台发布了新工具,包括训练家用机器人对声音做出反应的工具。

脸书的人工智能实验室为其嵌入式人工智能训练平台发布了新工具,包括训练家用机器人对声音做出反应的工具。

未来的探索
机器人可以阅读您的P-P-P-Poker脸
情绪ai.
未来的探索
机器人可以阅读您的P-P-P-Poker脸
情感检测技术可能是个性化的下一个前沿。但这对隐私意味着什么?

情感检测技术可能是个性化的下一个前沿。但这对隐私意味着什么?

错误的
机器人会带走我们的工作吗?
机器人会带走我们的工作吗?
现在看
错误的
机器人会带走我们的工作吗?
自工业革命开始以来,对自动化的恐惧一直在上升。从织布机到汽车……
现在看

自工业革命开始以来,对自动化的恐惧一直在上升。从编织机器到汽车到电脑,哭泣有关机器人来临我们的工作继续越来越响亮。但如果机器人正在接受我们的工作 - 他们是! - 为什么为什么似乎比以往更多的工作?我们得到了什么......错了?

机器人
这个AI机器人可能成为你最喜欢的同事
ai机器人
机器人
这个AI机器人可能成为你最喜欢的同事
欧洲研究人员已经开发出AI机器人,以安全地与人类一起工作,预测他们的需求并提供强大的额外手。

欧洲研究人员已经开发出AI机器人,以安全地与人类一起工作,预测他们的需求并提供强大的额外手。

环境
机器人赛车学习南极洲的巨大冰融化
机器人赛车学习南极洲的巨大冰融化
环境
机器人赛车学习南极洲的巨大冰融化
一个半自治研究船只的冰菲是在冰川冰川中寻找一个关于大陆最快的融化冰川之一的条件。
经过莎拉韦尔斯

一个半自治研究船只的冰菲是在冰川冰川中寻找一个关于大陆最快的融化冰川之一的条件。

农业
这种大规模的农场机器人正在帮助确保食物的未来
农业机器人
农业
这种大规模的农场机器人正在帮助确保食物的未来
一个大规模的农场机器人正在分析亚利桑那州的作物,帮助识别可能在更热的气候中生长的人,以帮助确保食物的未来。

一个大规模的农场机器人正在分析亚利桑那州的作物,帮助识别可能在更热的气候中生长的人,以帮助确保食物的未来。

起义
建造太空殖民地的建筑机器人
标枪机器人
起义
建造太空殖民地的建筑机器人
将建筑机器人发送到外层空间将有助于为人类探索铺平道路,但是未来有一些真正的挑战。
经过Tien阮

将建筑机器人发送到外层空间将有助于为人类探索铺平道路,但是未来有一些真正的挑战。

机器人
水下机器人可能是深海采矿的未来
机器人
机器人
水下机器人可能是深海采矿的未来
科技需要原材料,还有一些在海底的东西。水下机器人会成为深海采矿的未来吗?

科技需要原材料,还有一些在海底的东西。水下机器人会成为深海采矿的未来吗?