碾压SOTA!最新视觉SLAM:渲染速度提升176倍,内存占用减少150%

视觉SLAM,一种结合了CV与机器人技术的先进方法。与激光SLAM相比,它成本低廉且信息量大,易于安装,拥有更优秀的场景识别能力,因此在自动驾驶等许多场景上都非常适用,是学术界与工业界共同关注的热门研究方向。

但传统的视觉SLAM也面临着一些挑战和局限性,比如在低光或强光照环境下性能下降、不太适合处理动态场景或高速移动等。为此,研究者们提出了许多改进方案。

效果很赞的如最新提出的NGD-SLAM,既能保证效率和精度,又无需GPU,是行业第一个达到此目标的视觉动态SLAM系统。另外还有基于3D高斯SLAM系统,猛超SOTA实现了渲染速度提升176%,内存使用减少150%的炸裂效果。

我今天就帮各位整理了12个最新发布且超高质量的视觉SLAM改进方案,代码开源的都有,强烈建议想发论文的同学研读。

论文原文+开源代码需要的同学看文末

NGD-SLAM: Towards Real-Time SLAM for Dynamic Environments without GPU

方法:本文提出了一种新颖的视觉SLAM系统,在CPU上实现了实时性能。通过引入一个独立的mask预测机制来减轻使用深度学习模型带来的低效问题,同时保持了动态目标识别的高准确性,并采用了双阶段跟踪方法来进一步提高系统的效率。

NGD-SLAM作为一个无需GPU支持的视觉SLAM系统,在动态环境中实现了56帧每秒的高跟踪帧率,同时保持了与最先进的方法相当的定位精度。

创新点:

  • 引入了一个独立于框架的掩码预测机制,使相机跟踪和动态对象分割能够同时进行,而不需要等待对方的输出。

  • 开发了一个双阶段跟踪方法,使用光流方法跟踪识别出的动态和静态特征,以及将光流和ORB特征的优势结合起来进行相机跟踪。

Compact 3D Gaussian Splatting For Dense Visual SLAM

方法:论文提出了一个名为“Compact 3D Gaussian Splatting SLAM”的系统,旨在解决现有基于3D高斯(Gaussian)的SLAM方法中存在的问题,如高内存和存储成本以及训练速度慢。

该系统在保持与现有最先进方法相当的高质量场景表示的同时,实现了训练速度提升33%,渲染速度提升176%,内存使用减少150%。

创新点:

  • 提出了一种全面的密集视觉SLAM系统,实现了高保真性能、快速训练、紧凑性和实时渲染。

  • 提出了一种可学习的滑动窗口遮罩策略,用于减少冗余的三维高斯椭球体数量,从而实现高保真性能。

  • 设计了一种新颖的基于滑动窗口的在线遮罩方法,以在SLAM系统操作期间移除冗余的高斯椭球体数量,实现更快的渲染速度和高效的内存使用。

GGC-SLAM: A VSLAM System Based on Predicted Static Probability of Feature Points in Dynamic Environments

方法:论文介绍了一种基于特征点静态概率的动态环境下的视觉同时定位与建图(VSLAM)系统,名为GGC-SLAM。GGC-SLAM系统结合了ORB-SLAM2框架,并引入了轻量级物体检测、基于网格的运动统计(GMS)和随机采样一致性图割(GC-RANSAC)算法。

在TUM公共数据集和真实世界环境中进行的评估表明,GGC-SLAM能够有效地处理动态场景中的动态特征点,同时确保实时操作。在高动态场景中,与ORB-SLAM2相比,该系统的平均绝对轨迹误差降低了约90%。

创新点:

  • 提出了一种特征匹配优化方法,引入了基于网格的运动统计(GMS)和图割随机抽样一致性(GC-RANSAC)算法。该方法能够从大量的粗匹配中有效地筛选出高质量匹配,并精确解决基础矩阵。

  • 作者结合语义信息和对极约束,初步预测了特征点的静态概率。通过GC-RANSAC求解的基础矩阵确定了对极约束,而轻量级目标检测网络SSD则快速获取了语义信息。

  • 构建了一个基于几何关系和条件随机场的特征点概率模型,通过整合先验的静态概率信息和分析一系列帧中的观测,进一步细化了特征点的动态和静态属性的判断。

Light-SLAM: A Robust Deep-Learning Visual SLAM System Based on LightGlue under Challenging Lighting Conditions

方法:本文提出了一种基于深度学习网络的Light-SLAM系统,将深度学习网络成功应用于传统视觉SLAM技术,实现了在不同时间和具有挑战性的光照条件下的稳健和高精度的实时定位。

Light-SLAM 在适应不同时间段的光照变化环境方面表现优越,显著提高了系统的鲁棒性和准确性,同时能够在 GPU 上实时运行。

创新点:

  • 使用深度学习网络成功将深度学习应用于传统的视觉SLAM技术,实现了在不同时间和具有挑战性的光照条件下的鲁棒且高精度的实时定位。

  • 在许多实验中,Light-SLAM在准确性和鲁棒性方面优于传统的基于手工特征和基于深度学习的方法,甚至在挑战性的低光场景中也能克服ORB-SLAM2等流行算法可能无法稳定运行的困难。

关注下方《学姐带你玩AI》🚀🚀🚀

回复“SLAM改”获取全部论文+开源代码

码字不易,欢迎大家点赞评论收藏

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://xiahunao.cn/news/3227326.html

如若内容造成侵权/违法违规/事实不符,请联系瞎胡闹网进行投诉反馈,一经查实,立即删除!

相关文章

如何将heic格式转换jpg?四种将heic转换成jpg的方法!

如何将heic格式转换jpg?在现今的数字图像处理领域,Heic格式作为一种被吹捧的创新型图像格式,以其先进的压缩技术,迅速减小了图片文件的大小,然而,尽管其有许多优点,实际使用中Heic格式却带来了一…

RSA加密算法因N强度不足破解实例

已知如下RSA密文和公钥信息,要求解密得到明文。 ----------------------- ciphertext(HEX) 94808F954A8AF9B9 N(HEX) C6EAD137492B4631 e(HEX) 10001 ------------------------ 分析过…

【Linux】命令执行的判断依据:;,,||

在某些情况下,很多命令我想要一次输入去执行,而不想要分次执行时,该如何是好? 基本上有两个选择, 一个是通过shell脚本脚本去执行,一种则是通过下面的介绍来一次入多个命令。 1.cmd:cmd&#…

【Android】基于 LocationManager 原生实现定位打卡

目录 前言一、实现效果二、定位原理三、具体实现1. 获取权限2. 页面绘制3. 获取经纬度4. 方法调用5. 坐标转换6. 距离计算7. 完整代码 前言 最近公司有个新需求,想要用定位进行考勤打卡,在距离打卡地一定范围内才可以进行打卡。本文将借鉴 RxTool 的 Rx…

buuctf面具下的flag

细节: 这道题可能因为是vmdk的原因 导致在window上 7z无法得到全部的信息 所以最后解压要在linux系统上 解密网站 Brainfuck/Ook! Obfuscation/Encoding [splitbrain.org] 这道题010打开,可以发现里面隐藏了很多 binwalk解压 两个文件 vmdk可以直接 用7z解压 7z x flag.…

常用网络概念

📑打牌 : da pai ge的个人主页 🌤️个人专栏 : da pai ge的博客专栏 ☁️宝剑锋从磨砺出,梅花香自苦寒来 ​​ 目录 了解组织 局域网技术 …

20240711 每日AI必读资讯

🎨Runway Gen-3 Alpha 详细使用教程以及提示词指南大全 - 7月9日,著名生成式AI平台Runway在官网公布了,最新发布的文生视频模型Gen-3 Alpha的文本提示教程。 - 从技术层面来说,输入的文本提示会被转换成“向量”,这些…

怎么提高音频声音大小?提高音频声音大小的四种方法

怎么提高音频声音大小?在音频处理和编辑中,增加声音的音量是一个常见的需求,尤其是在确保音频清晰度和听觉效果的同时。调整音频的音量不仅仅是简单地提高音频的响度,它也涉及到如何保持音质的高标准,确保没有失真或削…

如何写好品牌宣传稿提升品牌曝光?看这篇文章就够了

在这个信息爆炸的时代,一句精炼而富有力量的宣传语,足以让品牌在万千竞争者中脱颖而出。撰写一篇成功的品牌宣传稿,不仅是对文字艺术的驾驭,也是对品牌灵魂的深刻洞察与精准传达,更是连接品牌与消费者情感与认知的桥梁…

怎样将aac转换mp3格式?推荐四个aac转MP3的方法

怎样将aac转换mp3格式?当需要将aac格式音频转换为MP3格式时,有几种方法可以轻松实现这一目标。MP3是一种广泛支持的音频格式,几乎所有设备和平台都能播放MP3文件,包括各种音乐播放器、手机、平板电脑和汽车音响系统。而且它也提供…

实习记录3

1.Mybaits懒加载 MyBatis 延迟加载(懒加载)一篇入门-腾讯云开发者社区-腾讯云 (tencent.com) 2.高级映射 106-高级映射之多对一映射第一种方式_哔哩哔哩_bilibili 3.TableId(type IdType.INPUT) Mybatis-plus 主键生成策略_mybatis-plus 自增主键等于…

使用PEFT库进行ChatGLM3-6B模型的QLORA高效微调

PEFT库进行ChatGLM3-6B模型QLORA高效微调 QLORA微调ChatGLM3-6B模型安装相关库使用ChatGLM3-6B模型GPU显存占用准备数据集加载数据集数据处理数据集处理加载量化模型-4bit预处理量化模型配置LoRA适配器训练超参数配置开始训练保存LoRA模型模型推理合并模型使用微调后的模型 QLO…

Apache功能配置:访问控制、日志分割; 部署AWStats日志分析工具

目录 保持连接 访问控制 只允许指定ip访问 拒绝指定主机其他正常访问 用户授权 日志格式 日志分割 操作步骤 使用第三方工具cronolog分割日志 AWStats日志分析 操作步骤 访问AwStats分析系统 保持连接 Apache通过设置配置文件httpd-default.conf中相关的连接保持参…

Everything搜索无法搜索到桌面的文件(无法检索C盘 或 特定路径的文件)

现象描述 在Everything搜索框中输入桌面已存在的文件或随便已知位置的文件,无法找到。 搜索时检索结果中明显缺少部分磁盘位置的,例如无法检索C盘,任意关键字搜索时结果中没有位于C盘的,无论怎样都搜不到C盘文件。 解决方法 在…

读论文《Unpaired Unsupervised CT Metal ArtifactReduction》

论文题目:非配对无监督CT金属伪影还原 项目地址:GitHub - ChenBoYam/Metal-Artifact-Reduction: Eliminate metal artifacts from CT images Semi-supervised learning 重点应该就是怎么实现无监督吧 先看论文,再看代码 摘要:…

海南云亿商务咨询有限公司抖音电商服务领军者

在当今这个数字化高速发展的时代,抖音电商已经成为了一种不可忽视的新型商业模式。作为行业的佼佼者,海南云亿商务咨询有限公司凭借其专业团队和卓越的服务能力,为众多商家提供了一站式的抖音电商解决方案,助力商家在竞争激烈的市…

springboot“小鱼在乎”日程计划系统-计算机毕业设计源码51307

摘要 本文介绍了一种基于微信小程序和Spring Boot后端服务的“小鱼在乎”日程计划系统。该系统结合了前端微信小程序的便捷交互与后端Spring Boot框架的稳健性能,为用户提供了一款功能全面、体验出色的日程管理工具。 “小鱼在乎”日程计划系统涵盖了多种功能&#…

空中交通新动能!2024深圳eVTOL展动力电池展区核心内容抢先看!

空中交通新动能!2024深圳eVTOL展动力电池展区核心内容抢先看! 关键词:2024深圳eVTOL展 动力电池 高能量密度电池 高性能电池材料 作为2024深圳eVTOL展重要组成部分,2024深圳eVTOL动力电池展将于9月23-25日在深圳坪山燕子湖国际会…

硅谷甄选二(登录)

一、登录路由静态组件 src\views\login\index.vue <template><div class"login_container"><!-- Layout 布局 --><el-row><el-col :span"12" :xs"0"></el-col><el-col :span"12" :xs"2…

7月10日学习打卡,环形链表+栈OJ

前言 大家好呀&#xff0c;本博客目的在于记录暑假学习打卡&#xff0c;后续会整理成一个专栏&#xff0c;主要打算在暑假学习完数据结构&#xff0c;因此会发一些相关的数据结构实现的博客和一些刷的题&#xff0c;个人学习使用&#xff0c;也希望大家多多支持&#xff0c;有…