|
|
QB | 前沿研究:从医学影像中检测和诊断COVID-19的机器学习技术调查 |
|
论文标题:A survey of machine learning techniques for detecting and diagnosing COVID-19 from imaging(从医学影像中检测和诊断COVID-19的机器学习技术调查)
期刊:Quantitative Biology
作者:Aishwarza Panday, Muhammad Ashad Kabir, Nihad Karim Chowdhury
发表时间:07 Jul 2022
DOI:10.15302/J-QB-021-0274
微信链接:点击此处阅读微信文章
由于反转录聚合酶链式反应(RT- PCR)检测技术的可用性有限且成本较高,许多研究提出了将机器学习技术用于从医学影像中检测COVID-19。近日, 来自澳大利亚Charles Sturt University的Muhammad Ashad Kabir研究组系统地回顾、评估并综述了使用不同机器学习技术从胸部X光和CT扫描图像中检测和诊断COVID-19的研究文章。相关论文“A survey of machine learning techniques for detecting and diagnosing COVID-19 from imaging”(点击文末“阅读原文”下载PDF全文)发表在Quantitative Biology期刊上。
全文概要
新冠在全球范围内的传播已致14多亿人感染COVID-19并导致300多万人死亡。逆转录聚合酶链式反应(RT-PCR)检测技术是被广泛接受的标准诊断方法,但该方法存在一些缺点,如它需要从鼻咽拭子中提取病毒RNA为模板进行检测;RT-PCR检测技术比较耗时等。因此,世界各地的研究人员正在寻求一种快速、安全和自动化的方法来诊断COVID-19。由于X射线和CT扫描这两种医学成像技术在COVID-19等肺部炎症相关疾病上显示了优越性,所以研究人员考虑以这两种成像技术为基础,建立一个快速、准确并且自动化的COVID-19检测系统。武汉的一项研究表明,CT扫描对COVID-19的诊断具有比RT-PCR检测具有更高的敏感性。
自去年以来,有许多研究在COVID-19的诊断、治疗和随访中探索了基于机器学习(ML)的方法,其中深度学习(DL)相关的方法备受青睐。但从医学成像中诊断COVID-19仍然具有挑战性。更高的检测精度和确诊能力是COVID-19检测的首要任务。本文旨在揭示研究人员提出的基于DL的架构,以建立一个使用CT扫描和X射线的COVID-19自动诊断系统。作者总共将98篇相关领域的文章纳入了调查,与过去的类似领域的调查进行比较,并主要关注数据源和预处理策略,特征提取,分类,视觉解释技术,以及对比基于ML的模型和放射科医生的检测性能。
作者首先介绍了98篇文章中常用的数据来源,其中包括COVID-19 CT segmentation、COVID-CT等8个CT扫描数据集和Covid-chestxray-dataset、COVID-19 radiography database等13个胸部X光片图像数据集。作者列出了这些数据集的来源文献、下载网址和图像数量。这些数据集大部分是公开的,但也有一些不能通过公开途径获取。
接下来,作者介绍了针对CT和X光片图像数据的预处理方法,以及其调查的98篇工作分别使用了哪些方法及所占比例。涉及的方法包括调整大小、翻转、旋转等对图像的直接操作,也有少量工作使用了生成对抗网络来做图像预处理(图1)。
图1. 不同类型的预处理技术
(A) 224×224 重调整. (B) 亮度调节. (C) 生成对抗网络图解表示. (D) 垂直翻转
图像的特征提取通常是此类工作的核心步骤,作者同样是对CT数据和X光片数据的特征提取进行了分类讨论。在泛图像处理领域常用的特征提取神经网络模型也被广泛用于COVID-19检测工作中,其中包括ResNet、VGG、DenseNet、CapsNet等十多种网络,作者列出了使用每一种网络的文章。此外,针对CT和X光片数据的特殊性质,也有很多新的网络结构被提出,包括PDCOVIDNet、CovMUNET等9个针对X光的结构和DECAPS一个针对CT的结构。作者对每种网络的基本原理和得到的结果进行了简单介绍(表1)。
表1. COVID-19检测中常用的CNN架构
模型的最后一步是对提取的特征做分类,要实现分类,既可以直接在深度学习框架中用Logistic层或softmax层作为神经网络的最后一层,也可以将网络提取出的特征用SVM、KNN等传统分类方法进行分类。作者指出,在其调查的工作中,使用二分类的工作数量远远多于使用多分类的工作,然而,二元分类在检测COVID-19时可能会有歧义,因为它不能区分其他病毒性肺炎和COVID-19。
为了评估模型的检测性能,这些方法大多通过划分训练、验证、测试集的方法,计算模型在测试集上的正确率、准确率、灵敏度、特异性或F1分数等指标。作者整理了每篇文章划分数据集的方法、使用的评估指标和最后得到的分数,并根据模型对CT图像(表2)和X-光片(表3)的检测结果分别进行比较。
表2.CT图像处理中所用的模型及性能检测
表3. X-光片处理中所用的模型及性能检测
值得注意的是,不同模型的输出结果也不一样,一些模型只能判断图像中有没有COVID-19感染,但也有部分工作可以定位到图像异常区域,或是给出异常的解释,作者对98篇文章的这一区别也进行了分类、讨论和统计。在调查的文章中,有一些文章将自己的模型结果与放射科医生的诊断结果进行了比较。该调查也对这些比较结果进行了介绍,结论是基于ML的方法提供了比独立放射科医生更好的检测性能。
对结果的解释性较弱是深度学习方法的缺点,这也使得CNN架构不太适合用于医疗诊断系统。在调查的文章中,有一些工作尝试了对结果的解释,大多是通过可视化的方法,突出神经网络决策过程中重要图像区域。以前使用的一些可视化方法有:类激活图(CAM)、基于梯度的类激活图(Grad-CAM,Grad-CAM++)、分层相关性传播(LRP)和局部可解释模型-诊断解释(LIME)等。对于CT扫描和X光片,Grad-CAM是使用最多的可视化技术。
最后,作者讨论了本文调查的工作,指出其中的部分工作虽然准确率高,但仍有数据集小、类不平衡等问题,可能导致模型的过拟合。此外,这些研究没有包括临床症状信息(如发烧、咳嗽、疲劳)和人口统计信息(如年龄、性别、地点)。由于COVID-19有可能发生突变,冠状病毒的行为相对未知,所以使用这两类信息可以提升基于ML模型的性能。第三个限制是,以前的研究大多没有注意到对基础事实的验证。因此,需要记录RT-PCR跟踪和图像信息之间的时间,以建立一个基准,并促进有效的测试,这有助于使模型更加强大。另一个局限性与可视化技术(即CAM,Grad-CAM)有关,其中激活区域高度分散,并强调了不相关的区域,特别是X射线图像中的纵膈和肩部区域。
为了加快机器学习技术在大量医疗图像上的应用,世界各地都颁布了COVID-19的CT扫描和X射线图像的各种基准。但其中仍有许多挑战,包括图像的统一预处理、机器学习专家与放射科医生的合作模式、统一的基准和外部验证。模型的可解释功能也是一大挑战,以实现模型决策的公平性和问责制。
QB期刊介绍
Quantitative Biology (QB)期刊是由清华大学、北京大学、高教出版社联合创办的全英文学术期刊。QB主要刊登生物信息学、计算生物学、系统生物学、理论生物学和合成生物学的最新研究成果和前沿进展,并为 与计算机、数学、物理等交叉研究领域打造一个学术水平高、可读性强、具有全球影响力的交叉学科期刊品牌。
QB期刊目前已被ESCI, Scopus, CSCD等国内外重要数据库收录。Citescore2021=4.6,预计明年将获得第一个影响因子(IF)。
《前沿》系列英文学术期刊
由教育部主管、高等教育出版社主办的《前沿》(Frontiers)系列英文学术期刊,于2006年正式创刊,以网络版和印刷版向全球发行。系列期刊包括基础科学、 、工程技术和人文社会科学四个主题,是我国覆盖学科最广泛的英文学术期刊群,其中13种被SCI收录,其他也被A&HCI、Ei、MEDLINE或相应学科国际权威检索系统收录,具有一定的国际学术影响力。系列期刊采用在线优先出版方式,保证文章以最快速度发表。
中国学术前沿期刊网
http://journal.hep.com.cn
特别声明:本文转载仅仅是出于传播信息的需要,并不意味着代表本网站观点或证实其内容的真实性;如其他媒体、网站或个人从本网站转载使用,须保留本网站注明的“来源”,并自负版权等法律责任;作者如果不希望被转载或者联系转载稿费等事宜,请与我们接洽。