病理学是癌症等重大疾病诊断的“金标准”,也是揭示疾病发生、发展、变化和转归的关键,然而我国当前面临病理医生短缺、病理资源分配不均等现实问题。计算病理学是以计算机科学与技术方法论来研究一般病理学中的科研和临床流程,以期解答病理学中的科学和临床问题,成为提升我国提升病理诊断效率,降低地域偏差,推动病理学基础研究的重要技术。其中病理表型识别技术由于场景多样、层次不一、细粒度标注难获取等问题,限制了计算病理学的进一步发展与临床应用。
近日,电信学部计算机科学与技术学院李辰教授团队发明了一系列针对不同场景和层次的弱标注病理表型识别与量化方法,将病理学专业知识转化为计算机模型构建方法,实现了在该方向的多项突破性技术。(1)面向全视野数字切片分类,提出了一种基于最小点标注的半监督多任务学习框架,节约95%标注时间成本的同时,在肺癌、乳腺癌、肾癌等关键癌症种类上实现了90%以上的肿瘤区域和亚型识别准确率。此外,在陕西省人民医院和第一附属进行的应用验证,证明了该框架是一个低成本、高度可移植且鲁棒的全视野数字切片分类框架。(2)面向显微镜下图像分类,针对儿童白血病分层分类的特定场景,提出了信息瓶颈增强的分层多实例学习框架,通过将多实例学习与分层分类相结合,在患者级标签的监督下实现了从血液涂片图像到白血病诊断结果的映射。进而设计分层信息瓶颈,从信息论的角度解耦不同层级之间的表示,约束其最小充分性,实现模型精度和泛化性能的双重提升。在国家级儿科医疗机构——上海儿童医学中心和浙江省立育英医院的大规模多中心患者队列上验证了该框架优越的识别和泛化性能。(3)面向病理组织分割与分类,提出了一种基于多层级对比的无监督病理图像表示学习框架该框架基于人体组织的构成成分,设计了从图像级、超像素级到像素级的三个对比学习任务,分别用于编码组织成分、细粒度原型判别性和空间平滑度。通过在大规模无标注数据集上的预训练,模型捕获了大量与组织分割与分类相关的特征。在乳腺癌、胃癌等数据集上的实验表明,所提出的框架在保持有竞争力识别结果的同时有效的降低了深度学习模型对标注数据的需求。
最小点标注方法vs传统标注方法
基于最小点标注的半监督多任务学习框架
信息瓶颈增强的分层多实例学习框架
基于多层级对比的无监督病理图像表示学习框架
这些成果分别以《弱注释条件下用于全视野数字切片癌症分类的半监督多任务学习框架》(A Semi-Supervised Multi-Task Learning Framework for Cancer Classification with Weak Annotation in Whole-Slide Images),《用于儿童白血病分类的信息瓶颈增强分层多实例学习框架》(Childhood Leukemia Classification via Information Bottleneck Enhanced Hierarchical Multi-Instance Learning)和《用于组织病理图像组织级分割的无监督表示学习框架:全局到局部的对比学习》(Unsupervised Representation Learning for Tissue Segmentation in Histopathological Images: From Global to Local Contrast)为题发表在医学影像顶级期刊《医学影像分析》(影响因子13.828)和《IEEE医学影像汇刊》(影响因子11.037)上。计算机科学与技术学院李辰教授和高泽宇博士为这一系列论文的通讯和第一作者。论文的合作单位还包括第一附属医院、上海儿童医学中心及腾讯天衍实验室。这一系列论文获得了包括国家自然科学基金、陕西省重点研发计划等项目的资助。
电信学部计算机科学与技术学院陕西省大数据知识工程重点实验室李辰教授课题组长期从事生物医学大数据领域的智能应用研究。近年来在医学表型语义标准、病理图像分析、医学文本分析等方面取得了系列成果,研究论文已经发表于领域重点期刊和会议上,如科学数据、生物信息学简报、生物信息学、医学影像分析、IEEE医学影像汇刊、生物医学与健康信息学杂志、IEEE情感计算汇刊、IEEE神经网络与学习系统汇刊、IEEE信号处理汇刊、国际先进人工智能会议(AAAI)、医学图像计算和计算机辅助干预会议(MICCAI)等。
论文链接:
https://www.sciencedirect.com/science/article/pii/S1361841522002808
https://ieeexplore.ieee.org/abstract/document/10050510/
https://ieeexplore.ieee.org/abstract/document/9830779