WAM世界行為模型+千億參數(shù)+1400TOPS算力：拆解吉利全域AI 2.0的技術底座

本文作者：新智駕

2026-04-21 21:33

導語：

一句話先說清楚

2026年1月CES上，吉利發(fā)布了汽車行業(yè)第一個全域AI技術體系2.0版本。這個體系的核心不在于某個單點功能有多炫酷，而在于它試圖解決一個行業(yè)根本性問題：智能座艙、智能駕駛、底盤控制、動力管理——這些域各自為政的割裂狀態(tài)，能不能被一個統(tǒng)一的"大腦"接管？

吉利的答案是WAM世界行為模型（World Action Model）。它不是一個大號語音助手，也不是一個單純的智駕算法——它是一套能讓汽車"理解→規(guī)劃→預演→判斷→修正"的完整智能閉環(huán)系統(tǒng)，首發(fā)搭載于極氪8X，由超級Eva智能體負責"想"、千里浩瀚G-ASD 4.0負責"動"，國內首個實現(xiàn)座艙與智駕原生融合的量產方案就此落地。

從1.0到2.0：不是升級，是換了一種思維方式

全域AI 1.0時代，汽車行業(yè)的主流做法是把AI拆成模塊：語音助手管交互，智駕系統(tǒng)管開車，底盤控制管懸架，動力系統(tǒng)管能耗。每個域都有自己的控制器、自己的算法、自己的供應商，互不干涉。這種架構的好處是工程上容易實現(xiàn)，壞處是用戶體驗是割裂的——你讓車打開空調、調低座椅、規(guī)劃一條不堵車的路去接人，這三件事需要分別操作，系統(tǒng)之間不會主動協(xié)作。

全域AI 2.0做了兩件事來打破這種割裂。

第一件叫"智能體化"。吉利設計了"1+2+N"全域多智能體協(xié)同框架——"1"是用戶，"2"是超級Eva和千里浩瀚G-ASD兩個核心智能體，"N"是座艙、底盤、動力等各域的子智能體。不同域的智能體可以相互對話、協(xié)商和協(xié)作。用戶只需要發(fā)出一個自然語言指令，系統(tǒng)會自動將任務分解給不同域的智能體，各域并行執(zhí)行并協(xié)調資源。

第二件叫"引擎化"。吉利把感知、記憶、認知、決策這四類基礎AI能力提煉為"全域感知引擎""全域記憶引擎""全域認知引擎""全域決策引擎"四個公共技術引擎，所有智能體都可以調用。這意味著任何一個域的AI能力提升，其他域都可以共享收益。

這種從"各管各的"到"一個大腦統(tǒng)籌全局"的轉變，不是功能上的修補，而是架構上的重構。

WAM世界行為模型：讓汽車擁有"世界觀"

WAM（World Action Model）是全域AI 2.0的底層技術基座。它的架構設計基于分層理念，分成上下兩層和一套價值體系。

上層是多模態(tài)大語言模型（MLLM），負責宏觀任務規(guī)劃。它接收用戶的自然語言輸入，理解意圖，將復雜任務拆解為可執(zhí)行的子任務序列。下層是"動作專家+世界模型"的組合，負責精細推演與決策——世界模型模擬環(huán)境變化和各種行動方案的后果，動作專家根據模擬結果選擇最優(yōu)執(zhí)行路徑。

關鍵創(chuàng)新在于"人類在環(huán)"（Human-in-the-loop）的價值函數(shù)體系。傳統(tǒng)的自動駕駛系統(tǒng)用固定規(guī)則判斷行為是否合理，WAM引入了基于人類反饋的價值函數(shù)，系統(tǒng)會根據用戶的實際駕駛行為和反饋持續(xù)調整決策權重。簡單說，這輛車會越開越懂你的風格。

在實際應用中，WAM驅動的千里浩瀚G-ASD 4.0具備三道技術護城河。

其一是超高含模量。云端多模態(tài)大模型與世界模型的參數(shù)規(guī)模達到千億級別。作為參照，當前多數(shù)主流智駕端到端模型的參數(shù)規(guī)模集中在十億到百億量級。更重要的是，G-ASD 4.0融入了國賓級司機的駕駛行為數(shù)據，在擬人性、安全性、舒適性和通行效率四個維度上均實現(xiàn)了提升。

其二是超大數(shù)據集。吉利旗下累計850萬輛車的輔助駕駛數(shù)據、百億公里智駕里程、2500萬個模型訓練片段，以及沃爾沃55年的事故數(shù)據庫——這些數(shù)據構成了G-ASD訓練的數(shù)據底座。智駕系統(tǒng)的核心壁壘從來不在算法結構，而在數(shù)據質量和數(shù)據規(guī)模。數(shù)據決定了模型的上限，算法只是逼近這個上限的工具。吉利作為年產超過300萬輛的頭部車企，在數(shù)據積累上的優(yōu)勢是絕大多數(shù)新勢力和科技公司難以在短期內追平的。

其三是硬件天花板。H9方案搭載雙NVIDIA Thor芯片，算力達到1400TOPS，配合5顆激光雷達實現(xiàn)3重360度全維感知覆蓋，已具備L3級智能駕駛方案的落地能力。硬件冗余是L3自動駕駛的前置條件：當系統(tǒng)需要在特定場景下將駕駛權交給車輛時，必須有足夠的感知密度和算力帶寬來支撐實時決策。5顆激光雷達中的1顆為520線遠距激光雷達，負責前方200米以上的遠距感知，其余4顆為固態(tài)激光雷達，覆蓋車身兩側和后方的盲區(qū)——這種配置在當前量產車型中屬于最高規(guī)格。同時在GTC 2026上，吉利宣布與NVIDIA深度合作，將集成Alpamayo、Cosmos和NuRec三個平臺，進一步提升基于WAM的智駕開發(fā)、仿真與驗證效率。Alpamayo負責物理世界仿真，Cosmos提供生成式數(shù)據合成能力，NuRec則用于端到端模型的訓練優(yōu)化——三個平臺組合起來，可以在不依賴大量實車路測的情況下高效迭代算法。

超級Eva：從語音助手到整車智能體

如果說WAM是"大腦"，超級Eva就是這個大腦面向用戶的"人格"。

傳統(tǒng)的車載語音助手本質上是一個指令執(zhí)行器——你說"打開空調"，它執(zhí)行"打開空調"。超級Eva的設計邏輯完全不同。它基于WAM世界行為模型，與智能駕駛、底盤、動力等底層系統(tǒng)原生融合，而不是在傳統(tǒng)架構上外掛一個聊天機器人。這個區(qū)別至關重要：原生融合意味著Eva可以直接調用智駕系統(tǒng)的能力、操控底盤的響應、調整動力的輸出，而不需要經過中間層的協(xié)議轉換。

超級Eva由三個核心能力構成。

可聊性。Eva接入了階躍星辰的端到端語音語義一體化模型Step 3.5 Flash，拋棄了傳統(tǒng)"語音識別→大語言模型→語音合成"三段式架構的延遲和機械感。音頻信號直接輸入大模型，模型同時輸出意圖標簽和執(zhí)行參數(shù)。在單請求代碼類任務下，推理速度最高達350TPS。座艙芯片方面，吉利首發(fā)搭載NVIDIA與聯(lián)發(fā)科聯(lián)合開發(fā)的天璣汽車座艙平臺旗艦芯片C-X1，采用NVIDIA Blackwell GPU架構，支持第二代Transformer引擎和NVFP4，專門針對大語言模型和視覺語言模型的推理性能做了優(yōu)化。

深規(guī)劃。Eva具備多模態(tài)感知融合和動態(tài)任務規(guī)劃引擎。當用戶發(fā)出模糊指令時，比如"帶我去接孩子放學，順便幫我找一家麥當勞，5點我要到學校"，系統(tǒng)不會只規(guī)劃導航路線，而是會將這個指令拆解為一個并行的動作序列：啟動智駕導航到學校→途經點搜索麥當勞并預訂→評估到達時間是否滿足5點要求→到達后自主泊車。座艙配置、內容推薦、服務預訂、健康監(jiān)測——所有這些任務由不同域的智能體并行執(zhí)行，而不是排隊響應。

強記憶。Eva的短期記憶存儲對話中的實體信息與情感標簽——它不僅記住你說了什么，還記住你說話時的情緒狀態(tài)。長期記憶則構建關系圖譜（家庭成員、重要事件等）和偏好概率值。這意味著Eva的體驗會隨著使用時間的增長而持續(xù)個性化，從"通用AI"逐步進化為"個人AI"。

艙駕融合的真正含義：不是兩個系統(tǒng)"能對話"，是一個系統(tǒng)"能思考"

"艙駕融合"這個詞在2025-2026年幾乎每個車企都在講，但大多數(shù)的"融合"停留在功能聯(lián)動層面——導航到了充電站自動打開充電口，語音說完目的地自動開始智駕導航。這種融合本質上是兩個獨立系統(tǒng)通過API接口互相調用。

吉利的艙駕融合走了不同的路徑。WAM世界行為模型從架構層面打通了座艙域和智駕域的底層能力。Eva和G-ASD 4.0共享同一套感知引擎（都能"看見"車內外環(huán)境）、同一套記憶引擎（都知道用戶是誰、去過哪里）、同一套決策引擎（都遵循同一套價值函數(shù)）。

舉個具體例子來理解這種差異。在傳統(tǒng)架構下，用戶說"前面路太堵了，幫我換條路"，座艙系統(tǒng)需要把這句話轉成一條導航指令發(fā)給智駕系統(tǒng)，智駕系統(tǒng)重新規(guī)劃路線后再反饋給座艙系統(tǒng)展示。兩次通信、兩次解析、兩次決策，中間有延遲、有可能理解偏差。

在WAM架構下，這句話由同一個決策引擎處理。系統(tǒng)直接理解"堵"意味著什么（通過感知引擎實時獲取路況）、"換條路"意味著什么（通過認知引擎檢索替代路線）、"幫"意味著什么（需要自動執(zhí)行，不需要二次確認）。整個過程是一次決策、一次執(zhí)行，沒有中間環(huán)節(jié)。

這種架構上的統(tǒng)一，在實際體驗上的差異是顯著的。它讓汽車從一個"裝了很多智能模塊的交通工具"變成了一個"擁有統(tǒng)一智能的出行伙伴"。從工程角度看，艙駕融合的終極目標不是讓座艙"能控制"智駕，而是讓兩者"共享同一套對世界的理解"。當座艙系統(tǒng)和智駕系統(tǒng)對同一時刻的路況、用戶意圖和車輛狀態(tài)有一致的認知時，系統(tǒng)間的協(xié)作效率才能達到最優(yōu)。這也是為什么吉利將超級Eva定位為"國內首個實現(xiàn)類Grok+FSD原生AI體驗的量產方案"——特斯拉用Grok打通了AI與車輛控制的對話式交互，吉利在同樣的技術路線上實現(xiàn)了量產落地。

AI不只是產品，更是體系能力

討論吉利的AI戰(zhàn)略，不能只看車上的技術。全域AI 2.0的底層支撐，是吉利過去幾年在算力基礎設施和研發(fā)體系上的持續(xù)投入。

星睿智算中心是吉利智能化研發(fā)的核心基礎設施。這個中心早在2023年就已上線運營，是國內車企首個入選全球算力500強的智算平臺。依托星睿智算中心的云端算力，吉利可以在8小時內完成1000個以上智駕模型的訓練迭代。阿里云作為技術合作伙伴，為星睿智算中心提供了算力效率優(yōu)化支持。

在研發(fā)組織上，吉利在2025年與階躍星辰、千里科技、星紀魅族等生態(tài)合作伙伴成立了"物理AI聯(lián)合實驗室"，專注于將通用AI能力與汽車場景深度融合。這種"車企+AI公司+芯片公司"的聯(lián)合研發(fā)模式，在國內汽車行業(yè)中并不多見。

從數(shù)據角度來看，吉利2025年全年銷量突破302萬輛，其中新能源銷量近169萬輛，同比增長90%。2026年目標345萬輛，計劃推出約10款全新車型。300萬輛級的年銷量意味著每天有數(shù)百萬輛吉利車在路上行駛，每輛車都在持續(xù)產生駕駛數(shù)據、環(huán)境數(shù)據和用戶行為數(shù)據。這些數(shù)據通過WAM架構的價值函數(shù)體系反饋到模型訓練中，構成"數(shù)據飛輪"——車越賣越多，數(shù)據越積越多，AI越聰明，產品越好賣。

這套飛輪一旦轉起來，后來者追趕的難度不僅在于算法，更在于數(shù)據的規(guī)模和質量。這也是為什么吉利將全域AI定位為"集團級戰(zhàn)略"而不是"某個車型的賣點"——AI能力的建設周期以年為單位，數(shù)據的積累周期以百萬輛車為單位，這些都需要長期主義投入才能形成壁壘。

寫在最后

全域AI 2.0不是一個發(fā)布會上的概念，而是一套正在量產的技術體系。WAM世界行為模型提供了統(tǒng)一的"世界觀"，超級Eva提供了面向用戶的"人格"，千里浩瀚G-ASD 4.0提供了執(zhí)行層面的"肌肉"，星睿智算中心提供了持續(xù)進化的"燃料"。

從2024年1月發(fā)布星睿AI大模型，到2025年CES發(fā)布全域AI 1.0，到2026年CES進化到2.0，再到GTC 2026宣布超級Eva量產上車——吉利用兩年時間完成了從"AI應用"到"AI架構"的跨越。

對于用戶來說，最直觀的變化可能只是：以前你要分三步完成的事，現(xiàn)在一句話就夠了。但對于行業(yè)來說，這意味著智能汽車的競爭維度，正在從"誰的智駕更厲害"升級為"誰的AI體系更完整"。

三個值得關注的信號：第一，吉利的全域AI 2.0已經進入量產階段，不是概念演示，極氪8X是第一個載體，后續(xù)更多車型將陸續(xù)搭載；第二，WAM架構的開放性和可擴展性意味著這套系統(tǒng)能持續(xù)吸收新的AI能力，包括階躍星辰、千里科技等合作伙伴的最新模型迭代；第三，300萬輛年銷量帶來的數(shù)據飛輪效應已經開始轉動，這將持續(xù)擴大吉利在AI訓練數(shù)據方面的優(yōu)勢。

（雷峰網(公眾號：雷峰網)新智駕北京車展2026專題）

雷峰網原創(chuàng)文章，未經授權禁止轉載。詳情見轉載須知。

0人收藏

專題

吉利：多品牌矩陣+900V技術全家桶，吉利全面反攻

本專題其他文章

新智駕

編輯

發(fā)私信

當月熱門文章