2
| 本文作者: 何忞 | 2016-10-13 16:50 |
完善對象分割方法(Learning to Refine Object Segments)

論文摘要
要實現對象分割,需要獲得兩方面的信息,一是目標層級的信息,二是更低級別即像素級別的信息。這就為前饋網絡提出了挑戰:卷積網絡中的底層獲取了大量的空間信息,而更高層則需要目標層級的信息,無法隨著對象的造型及外觀變化進行調整,效果不佳。本次研究中,我們為目標分隔的前饋網絡提出了一種新的自上而下的改善方法。這種由頂層到底層的結構能夠有效地做出高保真目標圖像。該方法與跳接相比,相同點是都在網絡各層級中放大了圖像特征,不同點在于,我們的方法不在每層中輸出獨立的預測,而是先在前饋過程中輸出一個粗略的圖像編碼,然后再在由上至下的過程中,用底層的圖像特征依次向上完善該編碼。這種方法更加簡單、快捷和有效。在最近流行的 DeepMask 網絡中做出圖像指令,我們的方法將圖像精確度平均提升了 10-20%。另外,在總體網絡結構的最優化問題中,我們采用了 SharpMask,與原有的 DeepMask 網絡相比,速度提升了50%(8 秒/圖)。
作者簡介
Pedro O. Pinheiro,供職于 Idiap Research Institute 和 Ecole Polytechnique Federale de Lausanne(EPFL)。
Tsung-Yi Lin 來自康奈爾大學康奈爾技術研究院。
結論和場景應用
本文針對快速對象分割任務發展了一種新的網絡結構,對前饋網絡進行自上而下通路的完善。文中的模型使目標圖像無論是在處理速度還是在質量方面都有了大的提升。該方法可以廣泛應用在各種像素標注的任務中。
PS:本文由雷鋒網(搜索“雷鋒網”公眾號關注)獨家編譯,未經許可不得轉載!
可在此處進行原論文下載。
推薦閱讀:
論文精選 | 實現城市設備智能規劃?——具有可選偏好的設施選址游戲
深度 | 計算機如何從樂盲到作曲家?建 28 層神經網絡,聽 8000 個 MIDI 樂章
雷峰網原創文章,未經授權禁止轉載。詳情見轉載須知。