CVPR2026 | F2Net: 悉尼大學等提出自適應頻率分解用于高分辨率遙感影像語義分割

本文作者：陳淑瑜

2026-06-03 18:48

導語：基于自適應頻率分解的多分支網絡 F2Net，將超高分辨率遙感圖像分解為高頻與低頻分量分別處理，兼顧細節保留與語義建模

來源：公眾號“遙感與深度學習“
原文鏈接：https://mp.weixin.qq.com/s/2bONrB7za70sCN9b43H-ig?scene=1&click_id=34

題目：F2Net: A Frequency-Fused Network for Ultra-High Resolution Remote Sensing Segmentation
會議： The IEEE/CVF Conference on Computer Vision and Pattern Recognition 2026
論文： https://arxiv.org/abs/2506.07847
數據： DeepGlobe、Inria Aerial
年份： 2026 (本篇基于2025年6月arxiv版)
單位： 悉尼大學、阿德萊德大學、清華大學、埃迪斯科文大學

CVPR2026 遙感AI方向合集：CVPR2026

CVPR2026 | F2Net: 悉尼大學等提出自適應頻率分解用于高分辨率遙感影像語義分割

創新點

提出基于自適應頻率分解的多分支網絡 F2Net，將超高分辨率遙感圖像分解為高頻與低頻分量分別處理，兼顧細節保留與語義建模
設計混合頻率融合模塊（HFF），通過跨分支通道注意力實現高、低頻特征的層次化自適應聚合
提出跨頻率對齊損失（CFAL），利用對稱 KL 散度約束高低頻分支在語義層面保持一致性
提出跨頻率平衡損失（CFBL），顯式正則化各分支梯度范數，解決多分支聯合訓練中的梯度失衡問題

背景

超高分辨率（UHR）遙感圖像語義分割在城市規劃、環境監測等領域具有重要應用價值，但其極大的圖像尺寸給現有分割網絡帶來嚴峻的計算挑戰。傳統方法通常采用下采樣或裁塊兩種策略適配網絡輸入，前者丟失細粒度邊界細節，后者破壞全局上下文一致性。

為此，學界提出多分支架構（如 GLNet、ISDNet）以同時保留局部細節與全局語義，但這類方法存在兩個核心問題：一是分支內部計算效率低（如反復裁塊推理），二是多分支并行訓練引發梯度競爭，導致收斂不穩定與特征對齊困難。本文從頻率域視角出發，通過將圖像分解為高低頻分量并為各分量設計專屬分支，同時引入專用損失函數，系統性地解決上述問題。