懒人狂喜，会洗衣做饭的家务机器人来了

随着科技的发展，许多家庭电器和工具的出现，使家务变得更加便利和高效。例如，洗碗机、扫地机器人、洗衣机等电器可以帮助人们完成繁重的家务，减轻人们的负担。但是，现代社会的生活节奏加快，许多人都在忙碌的工作和社交生活中奔波，因此有些人还是对琐碎、繁重且需要耗费时间的家务“深恶痛绝”。

为了让做家务变得更加轻松有趣，斯坦福大学打造了Mobile ALOHA，这是一个创新的家务机器人，专为双手动远程操作而设计，旨在提高烹饪和清洁能力。

跟人抢工作不如帮人做家务

模仿学习在机器人学中显示出巨大的潜力，特别是在桌面操作方面。来自斯坦福大学和谷歌DeepMind的研究人员团队通过创建Mobile ALOHA（一个低成本开源硬件系统，以下简称“ALOHA”）人形系统，在这一领域取得了进展。

这个机器人可以由用户远程操作执行多种活动，并通过模仿学习自主执行。人类操作员通过远程操作控制操作机器人手臂来演示任务。该系统捕获演示数据，并通过端到端的模仿学习来训练控制系统。演示显示，训练有素的机器人烹饪三道菜，并完成精细的任务，如打鸡蛋、切碎大蒜、倒液体、打开蔬菜包装和在煎锅中翻转鸡肉。

ALOHA还可以完成各种家务任务，包括给植物浇水、使用真空吸尘器、装卸洗碗机、从冰箱里取饮料、开门和操作洗衣机。虽然这些是机器人列出的一些家务，但该开源发明能够完成许多其他尚未宣布的任务，如煮虾或在家里整理东西。

为培训机器人系统提供具有成本效益的解决方案，ALOHA通过将其安装在轮式底座上来扩展系统。整个设置包括网络摄像头和带有消费级GPU的电脑，价格约为32,000美元，比现成的双手动机器人便宜得多，后者价格高达20万美元。

ALOHA集成了移动基地和全面的远程操作界面，以实现全身控制。该系统旨在模拟复杂的移动操作任务，这些任务以前使用专注于桌面场景的传统模仿学习技术。ALOHA的关键特征之一是它能够与已建立的静态ALOHA数据集同时训练，这使其与常规机器人系统不同。该系统结合监督行为复刻和每项任务的50次演示，实现了令人印象深刻的成功率。

如何拓展家务机器人的智能

最初的ALOHA系统使用一种名为Action Chunking with Transformers（ACT）的架构，该架构从多个视角和联合位置获取图像作为输入，并预测一系列动作。ALOHA通过输入向量添加运动信号来扩展该系统。

这些操作允许ALOHA以最小的更改重用以前的深度模仿学习算法。研究人员写道：“我们观察到，简单地连接基础和手臂动作，然后通过直接模仿学习进行训练，可以产生强劲的表现……具体来说，我们将ALOHA的14-DoF联合位置与移动基地的线性和角速度连接起来，形成一个16维动作矢量。”

这项工作还受益于最近方法的成功，这些方法在其他项目的各种机器人数据集上预训练模型。特别值得注意的是RT-X，这是DeepMind和33个研究机构的一个项目，它结合了几个机器人数据集，创建了可以超越其训练数据和机器人形态的通用控制系统。

研究人员写道：“尽管在任务和形态上存在差异，但我们观察到几乎所有移动操作任务的正转移，与仅使用ALOHA数据训练的策略相比，实现了同等或更好的性能和数据效率……通过协同训练，我们能够在这些任务上取得超过80%的成功，每项任务只需50次人类演示，与没有协同训练相比，平均绝对改善34%。”

另外，ALOHA 一个关键创新是谷歌在机器人导航和地图方面的进步。ALOHA能够使用摄像头和传感器识别家具、物体和墙壁，从而构建室内空间的动态地图。它能够在地图中定位自己，并规划最优路径进行导航。机器学习使得机器人能够随着时间的推移，在收集更多感知数据后，改进其地图和导航能力。

总结

基于ALOHA引发的轰动，Mobile ALOHA项目联合负责人Tony Z. Zhao亲自在X（原推特）上放出ALOHA执行任务失败的视频，并称“机器人还没有准备好接管世界！”虽然机器人厨师的能力确实给人留下了深刻的印象，但仍不完美，它也会把事情弄糟，而且其笨重外形不适合严密的环境。再者，其学习新知识仍然需要人类操作员在环境中进行全面演示。

即便如此，这依旧是机器人系统的重大发展。未来，研究人员计划通过增加更多自由度和减少机器人体积来改进系统，并探索人工智能模型的变化，这将使机器人能够自我改进并获得新知。

懒人狂喜，会洗衣做饭的家务机器人来了

你可能会喜欢

Uber或借foodpanda重返东南亚，泰国上半年投资申请额达436亿美元｜SEA Now

长鑫科技，穿越周期

AI 下一步怎么走？中国工程院外籍院士点名“小型智能体协作”

押注隐私保护，苹果智能眼镜主打差异化竞争