0.前言
论文来自TOP期刊STROKE,使用AI方法分割CT影像中脑出血血肿,并测量体积。前不久分享一篇关于脑硬膜出血AI辅诊断的论文属于同一类论文(见链接
)。作者团队来自徐州中心医院和大连医科大学。
1.论文基本信息
A Robust Deep Learning Segmentation Method for Hematoma Volumetric Detection in Intracerebral Hemorrhage.
![图片](http://image109.360doc.com/DownloadImg/2023/07/0922/268904200_2_20230709102155650.png)
STROKE是经同行评审的传统订阅(non-OA)期刊,创刊于1970年,是美国卒中协会(American Stroke Association)的官方杂志。
2.论文简介
2.1基本介绍
基于Unet分割网络结构,开发了DR- UNet(dimension reduction UNet )模型,可以对脑出血 (ICH)患者CT影像进行分割,然后测量血肿体积(HV),作者从三个角度证明了自己算法是牛B的。
(1)内外部双数据集测试,指标牛
为了验证模型泛化性,采用两个时间段的数据分别进行训练、验证、内部测试和外部测试。内部和外部测试数据指标如下:
内部:Dice 为 0.861± 0.139
外部:Dice 为 0.87 4± 0.130
具体指标见下表,同时对了UNet、FCM、Active contour算法。
![图片](http://image109.360doc.com/DownloadImg/2023/07/0922/268904200_3_20230709102155822.png)
作者又用箱型图把评价指标展示了一下,如下图,值得学习,论文就要图文并茂,要多种方式呈现,显得高端。
![图片](http://image109.360doc.com/DownloadImg/2023/07/0922/268904200_4_2023070910215610.png)
有图有真相,红色线包围区域是真值,也就是标准答案,其他颜色线是每个模型给的分割效果,越贴近红色线越好。
从图中看出Unet算法还有漏掉的,大壮感觉第一列第三行这漏掉的红色区域很明显,模型训练充分的情况下不会漏掉的,这里主要是用来衬托出本文算法好。
图:不规则形状的血肿组
![图片](http://image109.360doc.com/DownloadImg/2023/07/0922/268904200_5_20230709102156307.png)
图:硬膜下和硬膜外血肿组
![图片](http://image109.360doc.com/DownloadImg/2023/07/0922/268904200_6_20230709102156713.png)
(2)专家对比,效果牛
DR- U N et 得到的 HV 测 量 值与手 工分割 得到 的 HV 测 量值 有很强的相关性 (R2 =0.9979;P < 0. 0 0 0 1 ),效果跟专家差不多。使用相关性来对比分割效果,是一种常用手段。
(分割网络并不能直接输出血肿的体积,而是对分割图像进一步处理后计算得到的)
1)血肿预测体积误差对比,从图中可以看绿色线是本文算法,与真值(ground truth)最接近。
![图片](http://image109.360doc.com/DownloadImg/2023/07/0922/268904200_7_20230709102156900.png)
2) DR-UNet、UNet和Coniglobus方法的误差曲线。
![图片](http://image109.360doc.com/DownloadImg/2023/07/0922/268904200_8_20230709102157119.png)
3)使用皮尔逊相关性曲线进一步说明自己的算法效果和真值(ground truth)很接近,如下图。
![图片](http://image109.360doc.com/DownloadImg/2023/07/0922/268904200_9_20230709102157291.png)
Pearson相关系数(Pearson Correlation Coefficient):是用来衡量两个数据集合是否在一条线上面,它用来衡量定距变量间的线性关系。
(3)难例测试,效果好
使用一些难例样本,分别和 UNet 和 Coniglobu算法对比HV(血肿体积)测量效果,不但效果好还耗时少,而且模型参数还比Unet少,你说气人不。
难例:是指一些测试、测量都比较复杂的样本。本文选择了13 例不规则血肿、 11 例硬膜下及 硬膜外血肿等不同类型 H V 样本(体积不同)
有图有真相,下图可以看出DR-UNet针对以下不规则、体积不同的血肿分割和体积测试效果也是棒棒哒。
![图片](http://image109.360doc.com/DownloadImg/2023/07/0922/268904200_10_20230709102157416.png)
DR-Unet时间上也比其他算法快,不信看下表,平均时间1.2s。
![图片](http://pubimage.360doc.com/wz/default.gif)
大家看完介绍会感觉这算法就是六边形战士,各方面很牛B。在有数据基础下,你写算法也能成为六边形战士,不过需要掌握套路。
作者团队开源自己数据和代码,我感觉这也是他们论文能中顶刊的原因。
他们的代码:GitHub - DR-UNet/dr-unet
![图片](http://pubimage.360doc.com/wz/default.gif)
2.2关于外部测试集
AI算法会存在过拟合情况,就是在某个数据集上表现很好,但是拿到别的数据集表现就很差,也就是模型泛化性差,就需要增加外部测试数据集,进一步验证模型性能。
使用的并不是严格的外部数据集,因为这个数据也是来自这同一家医院的,只是采集时间段不同,外部数据应该更严苛一些,来自不同医院甚至不同设备采集的影像数据。
3.数据介绍
(1)数据情况
数据来自徐州中心医院,挑选条件如下:
1) 患 者 被诊断为 ICH(脑出血)
(2)诊断与 C T 扫描吻合
(3)诊断为 IC H 后1周内进行非增强C T 扫描。
2017 年1月至2018 年12月收集512 例患者(男性 246 例,女性 266 例年龄(55.13±18.45)岁),主要用来训练和内部评估(retrospective dataset,回顾性数据集)。
对于2019年后采集数据做外部测试(prospective dataset,前瞻性数据集),有50 例 ICH 患者(男性 29例,女性 21 例;年龄(60.14±15.17)岁),验证深度学习模型的普适性(也叫泛化性)。
每 个 切 片厚度 为 4 ~ 5 m m 。 在 回 顾性 和 前 瞻性 数 据 集中 分别有12568、1257 片头部 CT 切片。
(2)血肿分割和标注
(1)由一名有 10 年工作经验的医师使用自行开发的标记平台(大家一般都是使用开源工具)标记血肿的轮廓、类别和位置。
(2)在(1)基础上,由一名高年资医师(22 年工作经验)对缺失和标记错误的血肿进行修改。
(3)3 位医生分别记录血肿最大层的最长直径、最短直径和血肿高度,并计算 HV 值(血肿体积)
人工智能,智能背后是大量人工,标注绝对是体力活。
4.算法介绍
(1)数据预处理
图像尺寸为256×256,换为灰度图像,然后进行归一化。应用几何变换(旋转、缩放和平移)来实现实时数据增强。都是常规操作。
(2)模型结构
相对于经典分割网络UNet没有太大的变化。在Encode(编码阶段),先将图像输入block 1(1*1卷积) 进 行 降维 , 然后 再输入块Block2(3*3卷积) 进行 恢 复。在Decode(解码阶段)操作相似。
使用1*1卷积代替原来的3*3卷积,所以模型参数量会少,运行时间也缩短了,虽然前期使用1*1卷积降维了,但是后面使用3*3卷积又进行恢复,所以模型特征提取能力也没下降。
总算法改进很简单,还可以各种魔改出N个版本,老铁们发刊的机会不就来了吗,改改网络。
![图片](http://pubimage.360doc.com/wz/default.gif)
(3)血肿体积计算
血肿分割的输出的是二值图像(血肿像素值为1,非血肿像素值为 0),所有非零像素的和就是出血区域的每一层的面积,面积乘切片高度就计算出一个切片血肿体积了,把所有切片体积加在一起就是总体积了。公式如下
![图片](http://pubimage.360doc.com/wz/default.gif)
其 中 T 为厚度,n是切片数,比Sn是血肿面积,从公式可知,切片越薄,体积计算的越准确。
体积并不是网络直接预测出来的呦,是根据切片分割结果后处理得到的
5.点评
(1)从算法角度看,本文创新性是不足,医工交叉研究,对算法创新要求相对较低,注重数据、实验对比以及研究方法。掌握套医学影像论文套路即可。
(2)论文数据工作扎实,且从不同角度对比突出自己算法效果好,图文并茂,而且代码和数据也开源了,这点很好。
(3)论文提出了模型泛化性问题,也就是模型有可能在一个数据集上因为过拟合表现的很好,在其他数据集上效果就不稳定了,然后提出使用外部数据集验证,但是不是真正意义的外部数据集,采用的是同一家医院不同时间段的数据。
(4)还有很多工作可以做,比如使用真正的外部数据集、使用3D分割,算法改进再大一些。感兴趣的朋友们可以跟大壮交流。
广告 ![图片](http://pubimage.360doc.com/wz/default.gif)
1.大壮开发了一个基于人工智能的临床数据分析和机器学习建模软件。
医学临床数据机器学习研究和实验指导服务
机器学习在临床医学研究中的应用套路
2.大壮提供医疗影像研究方向定制化服务,思路指导、算法实现、技术咨询服务,包括但不局限CT、MRI图像分割、图像生成、多模态等技术支持。
3.感觉有用,帮忙转发 ![图片](http://pubimage.360doc.com/wz/default.gif)
![图片](http://pubimage.360doc.com/wz/default.gif)
![图片](http://pubimage.360doc.com/wz/default.gif)