BS-Diff | 扩散模型在骨抑制任务上的首次登场!

摘要

胸部 X 射线(CXR)是肺部筛查中常用的低剂量方式。然而,由于大约 75% 的肺部区域与骨骼重叠,这反过来又阻碍了疾病的检测和诊断,因此 CXR 的功效受到了一定程度的影响。作为一种补救措施,骨抑制技术已经问世。目前临床上使用的双能量减影成像技术需要昂贵的设备, 而且受试者会暴露在高辐射下。为了规避这些问题,人们提出了基于深度学习的图像生成算法。然而,现有方法在生成高质量图像和捕捉纹理细节(尤其是肺血管)方面存在不足。为了解决这些问题,作者提出了一种新的骨抑制框架,称为 BS-Diff,它由一个配备 U-Net 架构的条件扩散模型和一个包含自动编码器的简单增强模块组成。

1. Introduction

近年来,与肺部疾病相关的发病率和死亡率居高不下。胸部 X 光片(CXR)是一种广为接受的低剂量肺部筛查技术。然而,即使是技术娴熟的临床医生也可能会忽略肺部并不突出的病变,这主要是由于 CXR 中 75% 的肺部区域与骨骼重叠,从而阻碍了疾病的发现和诊断。为了提高临床诊断的准确性,人们引入了一种称为骨抑制的方法。目前最受推崇的方法是双能量减影(DES)成像技术。然而,这种技术需要昂贵的设备,并使患者暴露于较高的辐射剂量。因此,研究人员正在努力寻找危害较小、成本效益较高的骨抑制技术。

在早期的方法中,Suzuki 等人使用大规模人工神经网络从 CXR 中生成骨图像。然后再减去骨图像,生成类似软组织图像的图像。随后,Juhasz 等人使用主动形状模型分割 CXR 上的解剖结构并抑制骨阴影。他们将该模型应用于 JSRT 数据集,该数据集是目前唯一公开的同类数据集。然而,这些方法容易缺乏与骨骼结构相关的高级语义信息。因此,最近有几种骨抑制方法采用了深度学习技术来学习从 CXR 到软组织的映射。Yang等人开发了一种多尺度卷积神经网络(CNN)模型,用于图像梯度域内的骨抑制。该模型可以有效地学习稀疏特征,并取得了卓越的效果。Gusarev 等人将骨骼视为噪声级,分别采用自动编码器 (AE) 和具有各种损失函数的深度 CNN 来抑制骨骼。然而,这种方法由于无法捕捉高频细节而导致图像模糊。为了降低模糊度,Zhou 等人提出了一种多尺度条件生成对抗网络(GAN),以大幅保留高频细节并提高生成图像的清晰度。为了提高肺结核的分类和检测准确率,Rajaraman 等人利用性能最好的 ResNet-BS 开发了多个模型,大大抑制了骨骼。最近,Liu 等人利用一种特殊的数据校正方法和蒸馏学习算法,提出了一种用于侧位 CXR 的骨骼抑制技术。尽管如此,许多此类研究仍存在一些问题,如去噪苛刻或生成的骨图像质量不高,导致图像清晰度和纹理细节下降。此外,目前唯一可获得的数据集的质量也不够高。

最近,去噪扩散概率模型(DDPMs)这类新型生成模型浮出水面,以解决 GAN 中普遍存在的模式崩溃和不收敛问题。这些模型通过对随机噪声进行一系列变换来生成数据。在本文中,作者提出了一个名为 BS-Diff 的新框架,该框架集成了一个配备 U-Net 架构的条件扩散模型(CDM)和一个采用 AE 的直接增强模块。作者提出的方法证明了其生成高质量图像的能力,具有高度的骨抑制,并增强了捕捉复杂纹理细节(如肺部小血管)的能力。作者已经进行了全面的实验、比较、消融研究和临床评估,通过多种指标综合肯定了作者的 BS-Diff 优于现有的众多骨抑制模型。此外,作者还收集了 2010 年后最大的数据集,包括来自 120 名患者的高质量、高分辨率数据。该数据集包括成对的心血管造影和软组织图像,是与作者的合作医院共同收集的。作者研究的主要贡献可归纳如下:

这是一项开创性的研究,它利用扩散模型从 CXR 中生成软组织图像,从而解决并克服了 DES 的普遍局限性。

在增强模块中,作者引入了各种损失函数的创新组合,旨在更有效地囊括图像的空间特征和复杂纹理细节,同时保留图像的整体结构。

作者还收集了自 2010 年以来最广泛的数据集,其中包括与合作医院共同收集的 120 名患者的高质量、高分辨率配对图像。

通过全面的实验、比较分析、消融研究和临床评估,作者证实了作者提出的 BS-Diff 模型与几种高性能骨抑制模型相比的优越性能。

2. 方法

图1:作者提出的 BS-Diff 的总体结构。

作者提出的方法概览如图1所示。BS-Diff 模型通常分为两个阶段运行:第一阶段涉及采用 U-Net 架构的 CDM,第二阶段涉及使用 AE 的直接增强模块。在第一阶段,CDM 将高斯噪声和 CXR 作为输入,生成估计的软组织。随后,在第二阶段,AE 使用 CDM 的输出生成更清晰、更高质量的软组织图像。最重要的是,模型应保持软组织的纹理、颜色和肺血管,包括那些与骨骼结构重叠的组织。

3. Hybrid Loss Function

扩散模型的传统目标与作者的方法一致,都是利用均方误差(MSE)损失来预测前向处理过程中应用于图像的噪声。这一预测是通过噪声估计网络完成的。对于增强模块,作者提出了一种混合损失函数,旨在帮助网络生成更清晰、更锐利、更高质量的图像,同时保持出色的纹理细节。作者提出的损失函数包含多个新的加权损失。这些损失包括 MAE 损失、通过预训练 VGG-16 网络的感知损失(perceptual loss)、多尺度结构相似性(MS-SSIM)损失(multi-scale Structural Similarity loss),以及基于 Pix2PixHD 方法的补丁判别器上的对抗损失(adversarial loss )。最终的损失函数可以表示为:

4. 对比

基于公平比较的原则,作者将所提出的模型与之前工作中的三种方法进行了比较:多尺度条件对抗网络(MCA-Net)、类似于自动编码器的卷积模型和ResNet-BS模型。为了评估生成的软组织,作者采用了骨抑制率(BSR)、SSIM、MSE和 PSNR指标。表1显示了不同方法的性能。总体而言,作者的方法在所有指标上都优于其他方法。由于亮度差异和纹理的明显损失,ResNet-BS 在所有评估指标上都表现最差,而类似于自动编码器的卷积模型和 MCA-Net 则表现出了相当的效果。总体而言,作者的方法超越了竞争模型,在 BSR、MSE、SSIM 和 PSNR 方面分别提高了至少 1.7%、0.003、0.015 和 0.164。图2展示了作者提出的两阶段 BS-Diff 的结果,它捕捉到了复杂的图像细节,保留了整体结构,并提高了性能。

表1:和之前工作的对比表现。

 图2:CXR,DES软组织图像和作者的方法产生的软组织图像的可视化

5. 消融实验

为了评估 BS-Diff 中提出的增强模块的重要性,作者对有无该模块的模型进行了训练。作者发现,完全依赖 CDM 可生成更平滑的图像,但会忽略一些纹理细节;而使用增强模块生成的图像则不会出现这种情况。很明显,使用增强模块生成的图像效果更好,尤其是更清晰,PSNR 和 BSR 分数分别提高了 8.786 和 0.153,如表2所示。

表2:增强模块的消融表现。

6.  Clinical evaluation

根据骨抑制应用评估标准,作者的模型生成的骨抑制图像由作者合作医院的三位不同专业水平的医生进行了独立评估。平均得分(最高分:3 分)如表3所示。结果表明,作者的软组织图像可以清晰地保留肺血管和中心气道的可见度,并极大地抑制了骨骼,这可以显著提高临床医生发现肺部病变的能力。

表3:作者提出的 BS-Diff 的临床评估。

 7. 结论

为了减轻与 DES 设备相关的高成本和剂量问题,本文介绍了一种新型骨抑制框架 BS-Diff,该框架由一个 U-Net 架构的 CDM 和一个包含 AE 的直接增强模块组成。作者的方法能够生成具有高骨抑制率的高质量图像,并能增强辨别精细纹理信息的能力。综合实验和临床评估表明,作者提出的 BS-Diff 在多个指标上都优于现有的骨抑制模型。此外,作者还编制了 2010 年之后最大的高质量数据集,其中包括从作者的合作医院收集的 120 名患者的成对 CXR 和软组织图像数据。但仍有改进的余地。在本文中没有执行检测或分类等下游任务,可以进一步探索改进模型架构或引入更好的条件引导方法来精确控制生成。

8. 参考

[1] BS-Diff: Effective Bone Suppression Using Conditional Diffusion Models from Chest X-Ray Images.

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://xiahunao.cn/news/3019831.html

如若内容造成侵权/违法违规/事实不符,请联系瞎胡闹网进行投诉反馈,一经查实,立即删除!

相关文章

Python程序中温度更新出现振荡问题的分析和解决方案

在处理温度更新出现振荡问题时,可以考虑以下分析和解决方案:检查温度更新算法是否正确,可能存在错误导致振荡。检查温度更新的步长(时间步长)是否合适,步长过大可能导致振荡。检查系统动力学模型是否准确&a…

北交所佣金费率标准是多少?北交所相关信息科普

北交所的佣金费率并非固定不变,而是可以根据投资者的需求和证券公司的政策进行调整。目前北交所的佣金费率最低是万分之二。 一般来说,北交所的佣金费率默认在万分之三左右,但这不是固定的费率。根据证券公司的不同,佣金费率可以…

01-基本概念- 索引,文档和 REST API

# kibana_sample_data_ecommerce 为es 索引#查看索引相关信息 GET kibana_sample_data_ecommerce#查看索引的文档总数 GET kibana_sample_data_ecommerce/_count#查看前10条文档,了解文档格式 POST kibana_sample_data_ecommerce/_search { }#_cat indices API #查看…

【翻译】Processing系列|(四)用 Android Studio 从 0 到 1 进行 Processing 安卓开发

原文链接:Processing for Android Developing with Android Studio 朋友跟我说官方教程里也写了该怎么用 Android Studio 开发,并且亲测可行。这种方式确实能开发出结构更加清晰、额外组件更加少的程序,比上一篇文章中直接克隆 Processing-An…

社交媒体数据恢复:多闪

社交软件多闪是一款深受用户喜爱的社交应用,用于与朋友、家人保持联系。有时,多闪软件的聊天记录可能会丢失或被删除,这时用户需要进行数据恢复。本文将详细介绍多闪软件聊天记录的恢复过程。 一、多闪软件聊天记录恢复方法 从手机备份中恢…

Docker 容器中 PHP 使用 Curl 访问本地服务异常

在 Docker 环境中,将应用程序和服务容器化是常见的做法,但是有时会遇到一些网络通信方面的问题。其中一个常见的问题是 PHP 容器无法使用 Curl 访问本地服务,这可能导致开发和调试过程中的困扰。 问题描述 通常情况下,我们会将 …

PCIE协议-1

1. PCIe结构拓扑 一个结构由点对点的链路组成,这些链路将一组组件互相连接 - 图1-2展示了一个结构拓扑示例。该图展示了一个称为层级结构的单一结构实例,由一个根复合体(Root Complex, RC)、多个端点(I/O设备&#xf…

Failed to build flash-attn:ERROR: Could not build wheels for flash-attn

安装 FlashAttention 的时候遇到报错: Failed to build flash-attn ERROR: Could not build wheels for flash-attn, which is required to install pyproject.toml-based projects可能是安装的版本与环境存在冲突吧,我的环境是: python 3.1…

vector、heap数组、stack数组访问性能验证

测试目的 本次测试旨在比较不同数据结构(vector、数组)以及不同访问方法([]、at()、offset)在性能上的差异,从而为开发者提供在特定情境下做出最佳选择的依据。 测试代码 测试网址:Quick C Benchmarks 使用GCC9.5 …

网盘应用:桌面端界面欣赏,这个赛道容不下小玩家。

网盘(Cloud Storage)是一种云存储服务,允许用户在互联网上存储、管理和共享文件。它提供了一个在线的虚拟硬盘,用户可以通过网络将文件上传到云端,并随时随地访问和管理这些文件。 阿里云盘

王道数据结构个人向笔记-第二章(线性表)

文章目录 2.1 线性表的定义和基本操作2.2 顺序表2.2.1 顺序表的定义2.2.2 顺序表的插入、删除(实现是基于静态分配)2.2.3 顺序表的查找 2.3 链表2.3.1 单链表的定义2.3.2 单链表的插入删除2.3.3 单链表的查找2.3.4 单链表的建立2.3.4 双链表2.3.5 循环链…

React18+TS+NestJS+GraphQL 全栈开发在线教育平台

高质量平台级应用流行全栈技术实用职场技巧通用面试策略React18TSNestJSGraphQL 全栈开发在线教育平台(完结) 黑石老师,大厂技术专家,深耕前后端十多年。发现很多的前端同学都面临如下的职业困扰:没有能拿的出手的面试…

机器人系统ros2-开发实践07-将机器人的状态广播到 tf2(Python)

上个教程将静态坐标系广播到 tf2,基于这个基础原理这个教程将演示机器人的点位状态发布到tf2 1. 写入广播节点 我们首先创建源文件。转到learning_tf2_py我们在上一教程中创建的包。在src/learning_tf2_py/learning_tf2_py目录中输入以下命令来下载示例广播示例代码…

EXCEL数据快速上传至SAP透明表

文章目录 前言一、案例介绍/笔者需求二、备份数据三、数据处理转化 a.EXCEL转为TXT注意事项 b.EXCEL转为TXT 四、ABAP结合内表更新数据至透明表 a.代码实现 b.断点TXT上传至内表 c.查看上传结果 五、总结 前言 这篇文章…

OpenSPG docker 安装教程

文章目录 前言自述 一、OpenSPG1.介绍 二、安装步骤1.安装服务端2.客户端部署 前言 自述 我最近是想结合chatglm3-6b和知识图谱做一个垂直领域的技术规范的问答系统,过程中也遇到了很多困难,在模型微调上,在数据集收集整理上,在知…

【Qt 学习笔记】Qt常用控件 | 输入类控件 | Dial的使用及说明

博客主页:Duck Bro 博客主页系列专栏:Qt 专栏关注博主,后期持续更新系列文章如果有错误感谢请大家批评指出,及时修改感谢大家点赞👍收藏⭐评论✍ Qt常用控件 | 输入类控件 | Dial的使用及说明 文章编号:Qt…

【intro】GraphSAGE

论文 https://arxiv.org/pdf/1706.02216 abstract 大图中节点的低维embedding已经被证明在各种预测任务中非常有用,然而,大多数现有的方法要求在embedding训练期间图中的所有节点都存在;这些先前的方法属于直推式(transductive&#xff09…

女性名字有孤寡数,易离婚

丁老师:您好!我孩子(女孩)准备取名:周小程,宝宝出生于阳历2016年8月13号16时30分左右,准备给孩子取个名字,在网上查询了哈,这个名字的分数还蛮高的,99分&…

Mitmproxy 抓包工具安装使用

简介 Mitmproxy是一个使用python编写的中间人代理工具,跟Fiddle、Charles等等的抓包工具是差不多的,同样可以用于拦截、修改、保存http/https请求。比起Fiddle、Charles,mitmproxy有一个最大的特点是支持python自定义脚本。 安装 Win 官网…

【重塑世界的火种】制造业:从匠人之心到智能未来之旅

在人类文明的宏伟乐章中,有一段旋律始终激昂,它既古老又现代,既是力量的象征,也是智慧的结晶——这就是制造业,一个将梦想变为现实,将创意铸就为生活的神奇领域。今天,让我们一起走进这个塑造世…