6D位姿估计学习

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档

文章目录

  • 一、基本知识
    • 6D位姿
    • 相机内参
  • 二、6D位姿估计方法
    • 1.基于对应点的方法
    • 2.基于模板
    • 3.基于投票
    • 评价标准
    • 小结

一、基本知识

6D位姿

参见文章:物体6D位姿的含义
6D位姿,即3D位置和3D姿态(朝向),可以认为是相对概念,代表两个坐标系之间相对的位移和旋转;即拍摄时,相机坐标系相对于原始物体所在世界坐标系的平移和旋转变换[R,T];其中R的方向为旋转轴的方向,模长为旋转角大小,为逆时针。
我们所估计的6D位姿是物体6D位姿(等价于相机外参),即从物体所在的坐标系(以物体的重心为原点)到相机坐标系(以相机光心为原点)的旋转和平移,故即使在同一个场景下,不同物体的6D位姿也不同,但他们所在的相机坐标系是一致的。用公式表示为:Tc=R*Tm+t
其中为Tc物体在相机系的坐标,Tm为物体在世界系的坐标,R、t分别为旋转矩阵和平移向量。若将坐标扩充为4维T=[T 1]T,该公式也可以表示为:*Tc=[R t]Tm

  • 在世界系到相机系的变换过程中,可以假设有一个中间坐标系,该坐标系的原点与世界系一致,基与相机系一致。即中间坐标系的坐标与世界系只需要旋转:Tz=R*Tm,与相机系只需要平移:Tc=Tz+t
  • 旋转矩阵R的特点:旋转矩阵(Rotate Matrix)的性质分析

相机内参

参见文章:一文带你搞懂相机内参外参
如下图所示,真实世界坐标为[x,y,z],像素平面坐标为[u,v,1]两者通过相机内参矩阵K变换
在这里插入图片描述

二、6D位姿估计方法

在这里插入图片描述

  • PNPnet:找若干匹配的点对,知道这些点对在物体坐标系和相机2维坐标系中的位置,由此求出R、T矩阵

1.基于对应点的方法

主要使用特征点
  • 对纹理丰富的2D图像:将3D模型投影到多个方向得到N张2D模板,并记录对应关系;对新图像,提取特征点与2D模板对应,由PnP算法求得6D位姿;
  • 对弱纹理2D:借助深度学习
  • 对3D点云:最小二乘法

2.基于模板

使用整体。对模型构造多个模板,模板含有位姿信息。目标物体与哪一个模板接近,就使用该模板的位姿;。
  • 2D图像:模板是模型在各个方向的2D投影,转为图像检索问题
  • 3D点云:模板是目标物体的完整点云,转为单视角点云和完整点云的全局配准问题。

3.基于投票

使用基元,每个像素或3D点都对整体有影响。分为间接投票、直接投票。
  • 间接投票(多见于深度学习)
    每个像素或3D点对特征点投票,再通过PnP或最小二乘法—例如6PACK
  • 直接投票
    每个像素或3D点直接对6D位姿投票.通过生成大量位姿预测,再进行选择和优化,可以得到最终的位姿。

评价标准

  • 非对称物体:ADD度量,即预测的RT和实际的RT分别作用在点云上后,所有点的平均偏差。

  • 对称物体:ADD-S度量,考虑到对称性,寻找变换后,每一点到另一片点云的最近邻点,计算他们的平均距离偏差。

    对于LineMod数据集,度量结果<模型直径的10%即估计正确;
    对于YCB-Video数据集,常用ADD-S度量,而且阈值经常设置为2cm(面向抓取应用),而且ADD-S曲线下的面积(AUC)也被使用,其阈值设为10cm。

小结

对于纹理清晰的目标,常用基于对应的方法;无纹理或弱纹理,多用基于模板的方法;而对于有部分遮挡的目标,多采用基于投票的方法。
目前的问题:1.遮挡场景下的位姿估计效果并不好。2.即使是基于深度学习的方法,当前的数据集也不足够。
未来方向:1.如何得到可靠且大量的数据;2.如何降噪;3.仿真和现实的差距如何缩小;4.如何估计被遮挡不可见物体的6D位姿

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://xiahunao.cn/news/1549969.html

如若内容造成侵权/违法违规/事实不符,请联系瞎胡闹网进行投诉反馈,一经查实,立即删除!

相关文章

YOLO6D

同时检测RGB图像和预测其6D位姿&#xff0c;不需要多阶段或者检查多重假设 只需要3D bounding box作为物体形状加入训练&#xff0c;不需要详细的3d模型 CNN卷积网络架构 预测与感兴趣的对象的三维模型相关联的虚拟三维控制点&#xff08;9个点&#xff0c;8个角点&#xff0c…

6D模型:超越PDCA

敏捷教练的核心能力之一是策略思考。 敏捷教练核心能力之&#xff1a;策略思考 敏捷教练的另一项核心能力是沟通与影响力。 变革需跨越的鸿沟&#xff1a;TOC六层抗拒&#xff08;TOC R6&#xff09; 策略思考背后有一个6D模型。 6D模型概览 Six-Discipline Model: Overview 6D…

6D位姿估计的理解及BOP数据集参数说明

6D位姿估计的理解及BOP数据集参数说明 一、6D位姿估计 姿态估计在百度上搜会出现“姿态估计问题就是确定某一三维目标物体的方位指向问题”的解释&#xff0c;但是具体来讲确定某一三维目标物体的方位指向问题到底是什么意思呢&#xff1f; 首先&#xff0c;6D表示6个自由度&…

物体6D位姿的含义

本文同步于微信公众号&#xff1a;3D视觉前沿&#xff0c;欢迎大家关注。 在一些有关物体6D位姿估计或者机器人抓取的论文中&#xff0c;我们常会听到一个词&#xff1a;物体6D位姿估计 (6D object pose estimation)&#xff0c;那什么是物体的6D位姿呢&#xff1f;它和SLAM中…

春秋云镜:CVE-2019-9042(Sitemagic CMS v4.4 任意文件上传漏洞)

一、题目 靶标介绍&#xff1a; Sitemagic CMS v4.4 index.php?SMExtSMFiles 存在任意文件上传漏洞&#xff0c;攻击者可上传恶意代码执行系统命令。 进入题目&#xff1a; admin/admin /index.php?SMExtSMFiles&SMTemplateTypeBasic&SMExecModeDedicated&SMFil…

midi键盘接电脑实现电子琴功能

将一台midi键盘接到电脑上&#xff0c;变成一台电子琴&#xff0c;似乎是一个很简单的事情。找一个音乐编辑类软件&#xff0c;可以接受midi键盘的输入就可以了。比如 freeepiano 就可以接midi键盘。但是这样实现的其实是电钢琴&#xff0c;而不是电子琴。 为什么&#xff1f;…

简述docker的网络模式

Docker 提供了多种网络模式&#xff0c;用于控制容器之间以及容器与主机之间的网络通信。以下是 Docker 的一些常见网络模式 briage模式&#xff1a; docker容器启动时默认就是该模式,在该模式下&#xff0c;docker容器会连接到一个名为docker0的虚拟以太网桥上&#xff0c;通…

PG Music Band-in-a-Box 2021 + RealBand WiN 智能伴奏软件安装升级包

Band-in-a-Box 2021 是一款屡获殊荣的自动伴奏软件&#xff0c;非常易于使用&#xff01;只需使用标准和弦符号&#xff08;例如 C、Fm7 或 C13b9&#xff09;输入任何歌曲的和弦&#xff0c;选择您想要的风格&#xff0c;剩下的就交给 Band-in-a-Box 2021 。Band-in-a-Box 202…

Android 11 Display亮灭屏

系统休眠唤醒的时候会涉及到亮灭屏&#xff0c;下面分析下系统&#xff08;高通8155平台&#xff09;Display亮灭屏流程 1. 点亮屏幕 点亮屏幕入口在framework/base/下面LightsService.java&#xff0c;然后通过调用SurfaceControl.java ,最终调用到framework/native下面的Sur…

lgg7无需9008,最简单无脑root

LGg7 root方法&#xff08;解bl锁后通用&#xff09; 前提&#xff0c;已经解了bl锁&#xff08;这个不难&#xff0c;LG的845机型解锁方法都一样。除了g7的t版&#xff0c;这个要换u硬解&#xff09; 工具:已破解的LG up&#xff08;LG官方的线刷工具&#xff09;&#xff0c…

SAP ABAP实现类似于ME23N/MIGO的折叠屏幕开发

本文用于说明折叠屏幕的开发实现方式&#xff0c;类似于标准前台ME23N或者MIGO类似的效果&#xff0c;最终demo程序实现效果如下。 实际上屏幕折叠并不是真正的控件&#xff0c;而是根据想要的折叠或者展开效果&#xff0c;来选择不同的子屏幕进行展现。 比如下图点击折叠抬头…

小新pad TB-J606按键无法进入刷机模式,9008端口无法识别,可尝试如下主板短接操作,操作步骤

小新pad TB-J606按键无法进入刷机模式&#xff0c;9008端口无法识别&#xff0c;可尝试如下主板短接操作&#xff0c;操作步骤 1、断开电池连接线 2、镊子短接图中两点 3、安装电池 4、连接数据线&#xff0c;等待9008端口识别 5、移除镊子&#xff0c;进行刷机 具体操作步骤…

s6 android 6.0,三星Android 6.0更新升级详细名单:只有国行S6 Edge(G9250)

此前&#xff0c;外媒曾泄露了一份三星机型的Android 6.0首批升级清单&#xff0c;去年的旗舰机Galaxy S5竟不在其中&#xff0c;使得消费者对手机第一大厂很失望。其中&#xff0c;三星目前的旗舰智能手机Galaxy S6, Galaxy S6 edge, Galaxy Note5和Galaxy S6 edge将升级到And…

新能源汽车技术的最新进展和未来趋势

文章目录 电池技术的进步智能驾驶与自动驾驶技术充电基础设施建设新能源汽车共享和智能交通未来趋势展望结论 &#x1f389;欢迎来到AIGC人工智能专栏~探索新能源汽车技术的最新进展和未来趋势 ☆* o(≧▽≦)o *☆嗨~我是IT陈寒&#x1f379;✨博客主页&#xff1a;IT陈寒的博客…

正则表达式一小时学完

闯关式学习Regex 正则表达式&#xff0c;我感觉挺不错的&#xff0c;记录一下。 遇到不会的题&#xff0c;可以评论交流。 真的很不错 链接 Regex Learn - Step by step, from zero to advanced.

如何基于亚马逊云科技打造高性能的 SQL 向量数据库 MyScale

MyScale 是一款完全托管于亚马逊云科技、支持 SQL 的高效向量数据库。MyScale 的优势在于&#xff0c;它在提供与专用向量数据库相匹敌甚至优于的性能的同时&#xff0c;还支持完整的 SQL 语法。在这篇文章中&#xff0c;我们将阐述 MyScale 是如何借助亚马逊云科技的基础设施&…

Supervisor配置和使用

Supervisor配置和使用 一、使用背景二、工具简介三、安装四、配置文件1. 位置2. 步骤 五、服务启动六、supervisorctl客户端管理七、常用操作指令八、示例九、配置项说明supervisored.conf配置项说明进程任务配置项说明 十、web页面监控 一、使用背景 目前在公司搭建了一套基于…

Mac最佳屏幕录像机:FoneLab Screen Recorder

FoneLab Screen Recorder是一款功能强大的屏幕录像机软件&#xff0c;它允许您在 Mac 上捕获视频、音频、在线教程等&#xff0c;您可以轻松自定义大小、编辑视频或音频等。如果您想录制会议、电影、电话、教程、电视节目、歌曲、快照或其他内容&#xff0c;FoneLab Screen Rec…

MRMC推机器人摄像机Polycam,可自动跟拍运动员

这款名为Polycam的电动相机机器人支持使用图像识别和人工智能技术来追踪运动员的动作&#xff0c;完全不需要人工摄像师的操作。 近日&#xff0c;据外媒报道&#xff0c;MRMC推出一款名为Polycam的电动相机机器人&#xff0c;其支持使用图像识别和人工智能技术来追踪运动员的…

使用Workerman做一个简单的录像直播功能

1、准备好项目 之前做过一个简单的聊天室&#xff0c;我是根据之前弄的聊天室改过来的。 参考&#xff1a;https://blog.csdn.net/qq_38231822/article/details/1128004572、大致思路 这些小东西都是自己没事捅咕玩的&#xff0c;随便写一写。概括来说的话就是将录像定时的转成…