0
| 本文作者: 陳淑瑜 | 2026-05-27 18:49 | 專題:ICRA 國際機器人與自動化會議 |
來源:公眾號“l(fā)abren”
原文鏈接:https://mp.weixin.qq.com/s/97_CzzOnRfXvVUV_q30wKQ?scene=1
香港中文大學任洪亮教授團隊論文《EndoDDC:通過擴散深度補全學習稀疏到密集重建用于內窺鏡機器人導航》被機器人領域頂會 IEEE International Conference on Robotics and Automation (ICRA 2026) 錄用!

論文題目:EndoDDC: Learning Sparse to Dense Reconstruction for Endoscopic Robotic Navigation via Diffusion Depth Completion
論文作者:林胤恒?(香港中文大學),黃一鳴?(香港中文大學),崔貝雷(香港中文大學), 白龍(阿里巴巴達摩院,香港中文大學), 高滬昕(香港中文大學),任洪亮(香港中文大學), 賴捷文*(香港中文大學)
論文簡介:
在微創(chuàng)外科手術中,內鏡機器人的精準導航是提升手術精度、保障患者安全的核心。而精準導航的關鍵,在于獲取可靠的三維深度信息 —— 但內鏡環(huán)境下的弱紋理組織、鏡面反射等問題,一直讓深度估計成為技術難題。現有方法要么依賴難以獲取的稠密標注數據,要么在復雜內鏡場景中魯棒性不足,稀疏深度重建的有效性大打折扣。
我們提出的EndoDDC方法,為內鏡機器人導航的深度估計難題提供了創(chuàng)新解決方案。該方法通過融合圖像、稀疏深度信息與深度梯度特征,借助擴散模型優(yōu)化深度圖,成功攻克弱紋理、光反射帶來的技術痛點。
主要貢獻:
EndoDDC針對內鏡場景量身設計稀疏到稠密重建框架,有效解決傳統(tǒng)微調方法對標注數據的依賴,以及自監(jiān)督學習的尺度模糊問題,僅通過 RGB 圖像和稀疏深度圖即可輸出精準稠密深度圖。
創(chuàng)新引入深度梯度融合模塊,通過卷積門控循環(huán)單元(ConvGRU)迭代處理深度值與梯度信息,為重建過程提供精準幾何引導,大幅提升弱紋理區(qū)域的重建精度。
提出基于深度梯度的條件擴散模型,以初始粗深度圖為起點,利用深度梯度特征約束去噪過程,迭代優(yōu)化深度值,確保重建結果的全局一致性與物理合理性。
在 C3VD 和 StereoMIS 兩大公開內鏡數據集上完成全面驗證,所有評估指標(RMSE、MAE、REL、δ 準確率)均超越當前 SOTA 方法。相較于最優(yōu)深度補全模型 OGNI-DC,C3VD 數據集上 RMSE 降低 5.28%、MAE 降低 7.84%;即使面對 50~50000 不同稀疏度的輸入,仍能穩(wěn)定輸出高質量稠密深度圖。

EndoDDC方法概覽和可視化樣例

EndoDDC 概述:在從 RGB 圖像和稀疏深度圖提取特征后,Depth Grad Fusion 模塊會基于深度和梯度特征迭代地更新狀態(tài)隱藏網絡。然后,將該輸出輸入到 Depth Diffusion 模型進行條件引導下的補全。

在 C3VD 和 STEREOMIS 數據集上與SOTA方法的深度補全結果比較。

在 C3VD 和 StereoMIS 數據集上的比較。我們將 EndoDDC 與最先進的深度估計和深度補全方法進行比較;我們的方法在組織細節(jié)方面產生的誤差更少。
參考文獻:
Lin, Y., Huang, Y., Cui, B., Bai, L., Gao, H., Ren, H. & Lai, J. (2026). EndoDDC: Learning Sparse to Dense Reconstruction for Endoscopic Robotic Navigation via Diffusion Depth Completion. ICRA 2026.
本專題其他文章