NPJ Digital Medicine | 深圳先进院实现轻量化AI赋能术中影像引导
近日,中国科学院深圳先进技术研究院(以下简称“深圳先进院”)医学成像科学与技术系统全国重点实验室、生物医学与健康工程研究所梁晓坤研究员等联合复旦大学附属华山医院吴劲松主任团队、襄阳市中心医院蔡强主任团队、澳门大学黄志文副教授团队及湖北文理学院晏涛副教授团队,在实时术中影像实例分割领域取得重要进展。
研究团队提出轻量化实时实例分割框架 EndoSeg-RT,可在复杂术中环境下实现关键解剖结构的精准识别与实时分割,为智能化微创手术导航与术中辅助决策提供了新方案,相关数据集与代码已公开。研究成果以"Deployable real-time spinal endoscopic instance segmentation with lightweight multi-scale attention mechanism"为题发表在数字医学领域知名期刊NPJ Digital Medicine(IF=15.1),深圳先进院赖琪博士为第一作者。
脊柱内镜技术因创伤小、恢复快等优势,已广泛应用于微创脊柱外科。然而,术中内镜视野狭窄,常伴随高光反射、烟雾、出血遮挡及组织边界模糊等复杂情况,医生需快速准确识别黄韧带、神经、骨组织及脂肪组织等关键结构,以降低术中风险。现有深度学习方法虽在医学影像分析中取得进展,但在脊柱内镜场景下仍面临实时性不足、小目标识别困难及部署成本高等问题。
针对上述挑战,研究团队提出了轻量化实时脊柱内镜实例分割框架 EndoSeg-RT(图2)。该框架从主干网络(Backbone)、特征融合颈部网络(Neck)以及分割头(Head)三个层面进行协同优化,通过引入重参数化卷积与高效多尺度注意力机制,在保证高精度的同时显著降低推理延迟;同时设计双分支特征融合模块,强化跨尺度信息交互与边界细节表达,提升对细小神经结构及复杂组织边界的识别能力,更适用于真实术中实时部署场景。
为验证模型性能,研究团队构建了临床标注的 PELD 脊柱内镜实例分割数据集(图3)。该数据集来源于襄阳市中心医院61例经皮椎间孔镜腰椎间盘切除术患者,共包含610张1080×720分辨率的脊柱内镜图像,并对脂肪组织、骨组织、黄韧带和神经结构进行了像素级实例标注。数据标注由具有丰富经验的脊柱外科医生共同完成,并经过专家审核,保证了数据质量和临床可靠性。
实验结果表明,EndoSeg-RT 在保持极低计算复杂度的同时,实现了优异的分割性能(图4)。在 PELD 数据集上,该方法仅使用 1.8M 参数量和 8.8 GFLOPs,即可达到约189 FPS 的实时推理速度,在 Dice、IoU 和精度等指标上优于或接近当前主流实例分割模型,包括 Mask R-CNN、SOLOv2、Mask2Former 和 YOLO 系列方法。相比传统两阶段模型,EndoSeg-RT 在保持高精度的同时大幅降低了模型规模与计算开销,更适合部署于术中工作站或边缘设备。
本研究获得国家重点研发计划(BTIT专项)、澳门科学发展基金及深圳市面上项目等支持。

EndoSeg-RT框架概览

数据集标注案例与每张图像的每类像素占用率(%)。带有抖动点的方框图和须状图总结了骨骼、韧带、脂肪和神经的掩模面积占图像面积的百分比分布。

EndoSeg-RT在PELD 数据集上的分割表现。
附件下载: