ICRA 2026 | EndoDDC：擴散模型賦能稀疏到稠密深度重建

本文作者：陳淑瑜

2026-05-27 18:49

導語：EndoDDC方法，為內鏡機器人導航的深度估計難題提供了創(chuàng)新解決方案。

來源：公眾號“l(fā)abren”

原文鏈接：https://mp.weixin.qq.com/s/97_CzzOnRfXvVUV_q30wKQ?scene=1

香港中文大學任洪亮教授團隊論文《EndoDDC：通過擴散深度補全學習稀疏到密集重建用于內窺鏡機器人導航》被機器人領域頂會 IEEE International Conference on Robotics and Automation (ICRA 2026) 錄用！

論文題目：EndoDDC: Learning Sparse to Dense Reconstruction for Endoscopic Robotic Navigation via Diffusion Depth Completion

論文作者：林胤恒?（香港中文大學），黃一鳴?（香港中文大學），崔貝雷（香港中文大學），白龍（阿里巴巴達摩院，香港中文大學），高滬昕（香港中文大學），任洪亮（香港中文大學）, 賴捷文*（香港中文大學）

論文簡介：

在微創(chuàng)外科手術中，內鏡機器人的精準導航是提升手術精度、保障患者安全的核心。而精準導航的關鍵，在于獲取可靠的三維深度信息 —— 但內鏡環(huán)境下的弱紋理組織、鏡面反射等問題，一直讓深度估計成為技術難題。現有方法要么依賴難以獲取的稠密標注數據，要么在復雜內鏡場景中魯棒性不足，稀疏深度重建的有效性大打折扣。

我們提出的EndoDDC方法，為內鏡機器人導航的深度估計難題提供了創(chuàng)新解決方案。該方法通過融合圖像、稀疏深度信息與深度梯度特征，借助擴散模型優(yōu)化深度圖，成功攻克弱紋理、光反射帶來的技術痛點。

主要貢獻：

EndoDDC針對內鏡場景量身設計稀疏到稠密重建框架，有效解決傳統(tǒng)微調方法對標注數據的依賴，以及自監(jiān)督學習的尺度模糊問題，僅通過 RGB 圖像和稀疏深度圖即可輸出精準稠密深度圖。
創(chuàng)新引入深度梯度融合模塊，通過卷積門控循環(huán)單元（ConvGRU）迭代處理深度值與梯度信息，為重建過程提供精準幾何引導，大幅提升弱紋理區(qū)域的重建精度。
提出基于深度梯度的條件擴散模型，以初始粗深度圖為起點，利用深度梯度特征約束去噪過程，迭代優(yōu)化深度值，確保重建結果的全局一致性與物理合理性。
在 C3VD 和 StereoMIS 兩大公開內鏡數據集上完成全面驗證，所有評估指標（RMSE、MAE、REL、δ 準確率）均超越當前 SOTA 方法。相較于最優(yōu)深度補全模型 OGNI-DC，C3VD 數據集上 RMSE 降低 5.28%、MAE 降低 7.84%；即使面對 50~50000 不同稀疏度的輸入，仍能穩(wěn)定輸出高質量稠密深度圖。

EndoDDC方法概覽和可視化樣例

EndoDDC 概述：在從 RGB 圖像和稀疏深度圖提取特征后，Depth Grad Fusion 模塊會基于深度和梯度特征迭代地更新狀態(tài)隱藏網絡。然后，將該輸出輸入到 Depth Diffusion 模型進行條件引導下的補全。

在 C3VD 和 STEREOMIS 數據集上與SOTA方法的深度補全結果比較。

在 C3VD 和 StereoMIS 數據集上的比較。我們將 EndoDDC 與最先進的深度估計和深度補全方法進行比較；我們的方法在組織細節(jié)方面產生的誤差更少。

參考文獻：

Lin, Y., Huang, Y., Cui, B., Bai, L., Gao, H., Ren, H. & Lai, J. (2026). EndoDDC: Learning Sparse to Dense Reconstruction for Endoscopic Robotic Navigation via Diffusion Depth Completion. ICRA 2026.

0人收藏

專題

ICRA 國際機器人與自動化會議

本專題其他文章

陳淑瑜

編輯

發(fā)私信

當月熱門文章