谷歌 DeepMind 联合斯坦福推出了主从式遥操作双臂机器人系统增强版ALOHA 2

谷歌 DeepMind 联合斯坦福推出了 ALOHA 的增强版本 ——ALOHA 2。与一代相比,ALOHA 2 具有更强的性能、人体工程学设计和稳健性,且成本还不到 20 万元人民币。并且,为了加速大规模双手操作的研究,ALOHA 2 相关的所有硬件设计全部开源了,并提供了详细的教程,以及具有系统识别功能的 ALOHA 2 MuJoCo 模型。谷歌 DeepMind 放出了相关论文《ALOHA 2: An Enhanced Low-Cost Hardware for Bimanual Teleoperation》。

论文地址:https://aloha-2.github.io/assets/aloha2.pdf

项目主页:https://aloha-2.github.io/

我们先来一睹升级后的 ALOHA 2 能做些什么,比如将不同的玩具放进三个不同的碗里。

玩杂耍,你扔我接。

图片

开可乐瓶并将可乐倒进别的杯子里、开酸奶盒。

图片

给熊猫玩偶戴上美瞳。

图片

更难以想象的是,它还能变身扒手,悄无声息拿走你的钱包,并给你放回去。

图片

简直绝了!ALOHA 2 显著提高了一代 ALOHA 的耐用性,从而能够在更复杂的任务上进行大规模数据收集。

相较于一代,ALOHA 2 都升级了些啥

为支持对复杂操作任务的研究,在 ALOHA 平台上扩大数据收集的规模成为目标之一,包括使用的机器人数量、每台机器人的数据收集小时数以及数据收集的多样性。这一扩展过程改变了相对于第一代 ALOHA 平台的要求和范围。

对于 ALOHA 2,除了在 ALOHA 平台的基础上建设,研究者还针对以下领域寻求进一步改进:

性能和任务范围:增强 ALOHA 性能的关键组件,包括夹持器和控制器,以实现更广泛的操控任务。

用户友好性和人体工学:为了优化大规模数据收集,优先考虑用户体验和舒适度,包括改进用户界面系统的响应性和人体工学设计。

稳健性:增加系统的稳健性,最大限度地减少因诊断和维修造成的停机时间。这就需要简化机械设计,并确保更大规模的机器人队伍在整体上易于维护。

根据上述目标,ALOHA 2 的具体改进如下:

夹持器:研究者为主/从机器人的夹持器设计了新的低摩擦轨道。对于主机器人,这改善了遥操作的人体工学和响应速度。对于随动机器人,这改善了延迟和夹持器的力量输出。此外,他们还升级了手指上的抓胶带材料,以提高耐用性和抓取小物体的能力。

重力补偿:研究者使用现成的组件创建了一个被动的重力补偿机制,与 ALOHA 原有的抓带材料系统相比,这提高了耐用性。

框架:研究者简化了围绕工作单元的框架,同时保持了相机安装点的刚性。这些变化为人机协作者和机器人互动的道具提供了空间。

相机:ALOHA 2 使用更小的英特尔 RealSense D405 相机和定制的 3D 打印相机支架,以减小跟随臂的占地面积,从而减少对操作任务的阻碍。这些摄像头还具有更大的视场角、深度、全局快门和更多的定制功能。

模拟:研究者在 MuJoCo Menagerie 中的 MuJoCo 模型中模拟了 ALOHA 2 机器人的精确规格,从而改进了数据收集、策略学习和模拟评估,以应对具有挑战性的操纵任务。

夹持器

为了使遥控操作更顺畅,并改善人体工程学,本次采用了低摩擦轨道设计,降低了机械复杂性,从而取代了 ALOHA 原有的剪刀导轨式机械手设计。

图片

研究者设计并制造了低摩擦随动机械手,取代了 ALOHA 最初的设计。较低的摩擦减少了领导机器人和跟随机器人夹持器之间感知的延迟,显著改善了远程操作期间的用户体验。

框架

研究者重新设计了支撑框架,并使用 20x20mm 铝型材将其制成。框架为领导机器人和重力补偿系统提供支撑,并为俯视摄像机和虫眼摄像机提供安装点。

在这里插入图片描述

与 ALOHA 相比,本次设计进行了简化,去掉了工作台与遥控操作员相对一侧的垂直框架。增加的空间使数据收集方式更加多样化。例如,人类协作者可以更轻松地站在工作区的对面与机器人互动,从而收集人机互动数据。此外,还可以在工作台前摆放较大的道具,让机器人与之互动。

在这里插入图片描述

模拟

研究者发布了用于 ALOHA 2 工作单元的 MuJoCo Menagerie 模型,它对于远程操作和模拟学习非常有用。

与之前发布的 ALOHA 模型相比,MuJoCo 的物理精度更高、视觉保真度更高,允许快速、直观、可扩展的模拟数据收集。

在这里插入图片描述

MuJoCo 模型渲染。

图片

模拟远程操作任务。

以下为使用 Google Scanned Objects Dataset 与 MuJoCo 模型进行远程操作的示例(1 倍速度):

图片

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://xiahunao.cn/news/2775942.html

如若内容造成侵权/违法违规/事实不符,请联系瞎胡闹网进行投诉反馈,一经查实,立即删除!

相关文章

H5 带网站测速引导页源码

H5 带网站测速引导页源码 源码介绍:一款带网站测速功能的引导页源码 下载地址: https://www.changyouzuhao.cn/10717.html

C语言操作符超详细总结

文章目录 1. 操作符的分类2. 二进制和进制转换2.1 2进制转10进制2.1.1 10进制转2进制数字 2.2 2进制转8进制和16进制2.2.1 2进制转8进制2.2.2 2进制转16进制 3. 原码、反码、补码4.移位操作符4.1 左移操作符4.2 右移操作符 5. 位操作符:&、|、^、~6. 逗号表达式…

【DDD】学习笔记-领域实现模型

实现模型与编码质量 领域设计模型体现了类的静态结构与动态协作,领域实现模型则进一步把领域知识与技术实现连接起来,但同时它必须守住二者之间的边界,保证业务与技术彼此隔离。这条边界线应由设计模型明确给出,其中的关键是遵循…

GPT-4模型中的token和Tokenization概念介绍

Token从字面意思上看是游戏代币,用在深度学习中的自然语言处理领域中时,代表着输入文字序列的“代币化”。那么海量语料中的文字序列,就可以转化为海量的代币,用来训练我们的模型。这样我们就能够理解“用于GPT-4训练的token数量大…

初始web服务器(并基于idea来实现无需下载的tomcat)

前言 前面学习了对应的http协议,我们知道了他是在网络层进行数据传输的协议,负责相应数据以及接收数据的规则,但是在人员开发后端的时候不仅仅需要你写io流进行数据传输,还需要你进行对应的tcp协议来进行数据打包发送http协议-CSD…

【MySQL】MySQL表的增删改查(基础)

MySQL表的增删改查(基础) 1. CRUD2. 新增(Create)2.1 单行数据全列插入2.2 多行数据 指定列插入 3. 查询(Retrieve)3.1 全列查询3.2 指定列查询3.3 查询字段为表达式3.4 别名3.5 去重:DISTINCT…

Netty源码系列 之 ChannelPipeline IO处理回顾 源码

目录 ChannelPipeline【包含AbstractUnsafe.write的源码流程,比之前更加深化了,必看】 ChannelPipeline概念回顾 ChannelPipeline的创建 Inbound(输入Handler)所对应的事件传播 Outbound(输出Handler)所对应的事件传播【包含AbstractUnsafe.write的…

一款VMP内存DUMP及IAT修复工具

前言 加壳是恶意软件常用的技巧之一,随着黑客组织技术的不断成熟,越来越多的恶意软件家族都开始使用更高级的加壳方式,以逃避各种安全软件的检测,还有些恶意软件在代码中会使用各种多态变形、加密混淆、反调试、反反分析等技巧&a…

Vue3.0(五):Vue-Router 4.x详解

Vue-Router详解 vue-router教程 认识前端路由 路由实际上是网络工程中的一个术语 在架构一个网络的时候,常用到两个很重要的设备—路由器和交换机路由器实际上就是分配ip地址,并且维护着ip地址与电脑mac地址的映射关系通过映射关系,路由器…

Window环境下使用go编译grpc最新教程

网上的grpc教程都或多或少有些老或者有些问题,导致最后执行生成文件时会报很多错。这里给出个人实践出可执行的编译命令与碰到的报错与解决方法。(ps:本文代码按照煎鱼的教程编写:4.2 gRPC Client and Server - 跟煎鱼学 Go (gitbook.io)&…

【MySQL】_JDBC编程

目录 1. JDBC原理 2. 导入JDBC驱动包 3. 编写JDBC代码实现Insert 3.1 创建并初始化一个数据源 3.2 和数据库服务器建立连接 3.3 构造SQL语句 3.4 执行SQL语句 3.5 释放必要的资源 4. JDBC代码的优化 4.1 从控制台输入 4.2 避免SQL注入的SQL语句 5. 编写JDBC代码实现…

《Git 简易速速上手小册》第2章:理解版本控制(2024 最新版)

文章目录 2.1 本地仓库与版本历史2.1.1 基础知识讲解2.1.2 重点案例:回滚错误提交2.1.3 拓展案例 1:利用 git bisect 查找引入 bug 的提交2.1.4 拓展案例 2:合并提交历史 2.2 远程仓库的使用2.2.1 基础知识讲解2.2.2 重点案例:在 …

midnightsun-2018-flitbip:任意地址写

题目下载 启动脚本 启动脚本如下,没开启任何保护 #!/bin/bash qemu-system-x86_64 \-m 128M \-kernel ./bzImage \-initrd ./initrd \-nographic \-monitor /dev/null \-append "nokaslr root/dev/ram rw consolettyS0 oopspanic paneic1 quiet" 2>…

预测模型:MATLAB线性回归

1. 线性回归模型的基本原理 线性回归是统计学中用来预测连续变量之间关系的一种方法。它假设变量之间存在线性关系,可以通过一个或多个自变量(预测变量)来预测因变量(响应变量)的值。基本的线性回归模型可以表示为&…

备战蓝桥杯---动态规划(基础2)

本专题主要是介绍几个比较经典的题目: 假设我们令f[i]为前i个的最长不下降子序列,我们会发现难以转移方程很难写(因为我们不知道最后一个数)。 于是,我们令f[i]为以i结尾的最长不下降子序列,这样子我们就可…

香港倾斜模型3DTiles数据漫游

谷歌地球全香港地区倾斜摄影数据,通过工具转换成3DTiles格式,将这份数据完美加载到三维数字地球Cesium上进行完美呈现,打造香港地区三维倾斜数据覆盖,完美呈现香港城市壮美以及维多利亚港繁荣景象。再由12.5米高分辨率地形数据&am…

SpringCloud-Ribbon:负载均衡(基于客户端)

6. Ribbon:负载均衡(基于客户端) 6.1 负载均衡以及Ribbon Ribbon是什么? Spring Cloud Ribbon 是基于Netflix Ribbon 实现的一套客户端负载均衡的工具。简单的说,Ribbon 是 Netflix 发布的开源项目,主要功能是提供客户端的软件负…

【Java EE】----SpringBoot的日志文件

1.SpringBoot使用日志 先得到日志对象通过日志对象提供的方法进行打印 2.打印日志的信息 3.日志级别 作用: 可以筛选出重要的信息不同环境实现不同日志级别的需求 ⽇志的级别分为:(1-6级别从低到高) trace:微量&#…

SCI 1区论文:Segment anything in medical images(MedSAM)[文献阅读]

基本信息 标题:Segment anything in medical images中文标题:分割一切医学图像发表年份: 2024年1月期刊/会议: Nature Communications分区: SCI 1区IF:16.6作者: Jun Ma; Bo Wang(一作;通讯)单位:加拿大多…

排序算法---插入排序

原创不易,转载请注明出处。欢迎点赞收藏~ 插入排序是一种简单直观的排序算法,它的基本思想是将待排序的元素分为已排序和未排序两部分,每次从未排序部分中选择一个元素插入到已排序部分的合适位置,直到所有元素都插入到已排序部分…