0
| 本文作者: 陳淑瑜 | 2026-05-29 16:23 | 專題:CVPR 計算機視覺與模式識別會議 |
來源:公眾號“CV實驗室”
原文鏈接:https://mp.weixin.qq.com/s/65JSJhgEB_O_2epsG0pfIw?scene=1&click_id=51
在計算機視覺領域,目標追蹤(Visual Tracking)一直需要在“高精度”和“低功耗”之間尋找平衡。SNN(脈沖神經網絡)因其生物仿真特性和極高的能源效率被寄予厚望,但在處理復雜的RGB視覺追蹤任務時,往往難以兼顧精度。
今天介紹的這篇 CVPR 2026 論文 SpikeTrack,提出了一種全新的全脈沖驅動框架。它不僅在SNN追蹤器中達到了SOTA(目前最佳)水平,更在保證精度的前提下,將能耗降低至傳統ANN追蹤器的幾十分之一。

論文標題: SpikeTrack: A Spike-driven Framework for Efficient Visual Tracking
論文鏈接: https://arxiv.org/pdf/2602.23963
代碼倉庫: https://github.com/faicaiwawa/SpikeTrack (已開源)
現有的SNN追蹤框架主要面臨兩個問題:
SpikeTrack 的解決方案:非對稱孿生架構
作者沒有照搬ANN的交互模式,而是設計了一種非對稱(Asymmetric)的設計:

SpikeTrack 的架構主要由三個部分組成:共享權重的脈沖主干網絡(Backbone)、用于信息交互的記憶檢索模塊(MRM)、以及預測頭。

為了保證真正的脈沖驅動,論文采用了 NI-LIF (Normalized Integer Leaky Integrate-and-Fire) 神經元。它在推理時將膜電位轉換為整數脈沖,實現了稀疏的加法計算,替代了高能耗的浮點乘法。
其動力學方程如下:
其中, 是膜電位, 是輸出脈沖, 是可學習的衰減因子。可學習的衰減因子允許網絡自適應地調節對歷史信息的遺忘程度。
這是SpikeTrack最核心的創新點。為了實現“模板”到“搜索”的高效信息傳遞,作者借鑒了大腦皮層(V1 L2/3區域)的神經推理機制:通過循環連接(Recurrent Connectivity)來完善感知。
在SpikeTrack中,模板特征被初始化為“記憶庫(Memory Bank)”。搜索分支在推理時,并不直接與模板拼接,而是通過MRM模塊去“查詢”記憶庫,逐步提取目標線索。
MRM 的工作流程包含三個階段的循環(Recurrent Process):

最終,通過多次循環檢索(實驗中1次循環效果最佳),搜索分支能精準地“想起來”目標長什么樣,并定位目標。
在LaSOT數據集上,SpikeTrack展現了驚人的能效比。

MRM模塊到底學到了什么?可視化結果顯示,隨著層級加深,網絡能夠從通過檢索記憶庫,在復雜的遮擋、背景干擾下,逐漸聚焦于目標物體。

SpikeTrack 的成功證明了 SNN 在復雜視覺任務中的潛力。其核心貢獻在于跳出了“一味模仿 ANN 架構”的誤區,結合了 SNN 特有的時空計算特性:
這項工作不僅刷新了 SNN 追蹤的 SOTA,也為在極低功耗設備(如微型無人機、邊緣計算芯片)上部署高精度視覺追蹤算法提供了切實可行的方案。
本專題其他文章