0
| 本文作者: 吳思夢 | 2026-05-27 18:28 | 專題:ICRA 國際機器人與自動化會議 |
來源:公眾號“香港中文大學通信工程碩士”
原文鏈接:https://mp.weixin.qq.com/s/sOd2aYDff6OcDRWX4Z5p9g
論文第一作者:王浩丞
合作作者:林天麟
通訊作者:高源
近日,IEEE國際機器人與自動化會議(IEEE International Conference on Robotics and Automation,ICRA 2026)公布論文接收結果,香港中文大學(深圳)理工學院高源教授、林天麟教授團隊的論文“Emergent Co-Adaptive Strategies in Heterogeneous Multi-Robot Systems via Meta-Learning(基于元學習的異構多機器人系統自發共適應策略)”被大會收錄。
論文簡介:
該論文提出了一種面向異構多機器人系統的社會化共適應框架,旨在應對真實人群環境中動態變化的挑戰。在該框架下,不同類型的機器人(如任務執行機器人、補給站機器人和社交交互機器人)能夠根據人群狀態自主調整行為,實現人與機器人之間的雙向適應。核心技術包括元學習驅動的策略快速調整、多機器人協作機制以及社會行為建模,使系統在不同人群狀態下能夠自發生成合理的協作策略。通過在真實機器人平臺上開展大規模人機實驗,結果表明該方法能夠顯著提升任務完成效率與人群引導效果:在緊張與放松兩種人群狀態下,人群引導成功率提升約21%,人類參與者的物理和時間負擔分別降低約39%,人類對機器人的信任度和擬人化感知分別提升約16%和21%,有效增強了人機互動體驗,為未來社會化多機器人系統在復雜環境中的應用提供了新的實踐路徑。

圖1:異構多機器人系統在協同適應框架下的適應性行為
該異構多機器人系統(HMRS)由具有不同功能的機器人組成:包括負責區域覆蓋的工作機器人、提供實時能源補給的站點機器人,以及用于與人類進行交互的社交機器人。整個團隊通過統一的策略結構進行協調,實現多機器人間的高效協作與任務分配。為了增強系統在動態社會環境中的適應能力,文章中設計了雙通道適應架構。一方面,元策略通過基于模型無關元學習(MAML)的方法,結合人類行為軌跡進行實時調整,使機器人能夠快速適應不同人群狀態。另一方面,大語言模型(LLM)實時評估人群的心理緊迫性,提供行為引導的認知信息。這兩條通道協同工作,使異構機器人能夠在復雜多變的社會場景中自發生成合理協作策略,并實現人與機器人之間的雙向適應。該架構不僅保證了多機器人系統的任務性能和安全性,也為機器人在真實社會環境中的高效部署和人機協作提供了堅實的技術基礎。

圖2:方法架構
為了驗證文章提出的社會化共適應策略,研究團隊在實驗室中構建了模擬機場人流環境。首先在Unity中設計了復雜的訓練場景和簡化的實驗場景,并將實驗場景部署在受控實驗室中。志愿者被引導進入“緊張趕往航班”或“輕松漫步”的行為狀態,以模擬真實機場的多樣人群行為。在第一輪實驗中,參與者與統一的元策略系統進行互動,其行為數據被記錄并用于生成狀態特定的自適應策略。在第二輪實驗中,既有新志愿者,也包括第一輪參與者,都在對應的“緊張適應”或“輕松適應”系統中進行測試,從而驗證了人群與異構多機器人系統之間的雙向共適應能力。

圖3:實驗設置
在實驗中,該研究從三個維度對系統進行了全面評估。首先,在任務執行方面,機器人團隊實現了對目標區域的全覆蓋,保證了高效完成任務;其次,在行為指標方面,系統能夠根據人群狀態在自我導向(egoistic)與利他導向(altruistic)策略之間靈活切換,使人群引導成功率提升了約21%;最后,在用戶體驗方面,該系統顯著降低了參與者的身體和時間負擔,分別減少約39%,同時顯著提升了對機器人的信任度和擬人化感知,信任度提高約32%,擬人化感知提高約21%。這些實驗結果充分證明了異構多機器人系統在人群環境中的雙向共適應能力是可行的,為未來能夠在復雜、人類中心化場景中高效運行的社會化智能機器人系統奠定了堅實基礎。

圖4:實驗結果
雷峰網(公眾號:雷峰網)
本專題其他文章