0
| 本文作者: 新智駕 | 2026-04-21 21:33 | 專題:吉利:多品牌矩陣+900V技術全家桶,吉利全面反攻 |
2026年1月CES上,吉利發(fā)布了汽車行業(yè)第一個全域AI技術體系2.0版本。這個體系的核心不在于某個單點功能有多炫酷,而在于它試圖解決一個行業(yè)根本性問題:智能座艙、智能駕駛、底盤控制、動力管理——這些域各自為政的割裂狀態(tài),能不能被一個統(tǒng)一的"大腦"接管?
吉利的答案是WAM世界行為模型(World Action Model)。它不是一個大號語音助手,也不是一個單純的智駕算法——它是一套能讓汽車"理解→規(guī)劃→預演→判斷→修正"的完整智能閉環(huán)系統(tǒng),首發(fā)搭載于極氪8X,由超級Eva智能體負責"想"、千里浩瀚G-ASD 4.0負責"動",國內首個實現(xiàn)座艙與智駕原生融合的量產方案就此落地。
全域AI 1.0時代,汽車行業(yè)的主流做法是把AI拆成模塊:語音助手管交互,智駕系統(tǒng)管開車,底盤控制管懸架,動力系統(tǒng)管能耗。每個域都有自己的控制器、自己的算法、自己的供應商,互不干涉。這種架構的好處是工程上容易實現(xiàn),壞處是用戶體驗是割裂的——你讓車打開空調、調低座椅、規(guī)劃一條不堵車的路去接人,這三件事需要分別操作,系統(tǒng)之間不會主動協(xié)作。
全域AI 2.0做了兩件事來打破這種割裂。
第一件叫"智能體化"。吉利設計了"1+2+N"全域多智能體協(xié)同框架——"1"是用戶,"2"是超級Eva和千里浩瀚G-ASD兩個核心智能體,"N"是座艙、底盤、動力等各域的子智能體。不同域的智能體可以相互對話、協(xié)商和協(xié)作。用戶只需要發(fā)出一個自然語言指令,系統(tǒng)會自動將任務分解給不同域的智能體,各域并行執(zhí)行并協(xié)調資源。
第二件叫"引擎化"。吉利把感知、記憶、認知、決策這四類基礎AI能力提煉為"全域感知引擎""全域記憶引擎""全域認知引擎""全域決策引擎"四個公共技術引擎,所有智能體都可以調用。這意味著任何一個域的AI能力提升,其他域都可以共享收益。
這種從"各管各的"到"一個大腦統(tǒng)籌全局"的轉變,不是功能上的修補,而是架構上的重構。
WAM(World Action Model)是全域AI 2.0的底層技術基座。它的架構設計基于分層理念,分成上下兩層和一套價值體系。
上層是多模態(tài)大語言模型(MLLM),負責宏觀任務規(guī)劃。它接收用戶的自然語言輸入,理解意圖,將復雜任務拆解為可執(zhí)行的子任務序列。下層是"動作專家+世界模型"的組合,負責精細推演與決策——世界模型模擬環(huán)境變化和各種行動方案的后果,動作專家根據模擬結果選擇最優(yōu)執(zhí)行路徑。
關鍵創(chuàng)新在于"人類在環(huán)"(Human-in-the-loop)的價值函數(shù)體系。傳統(tǒng)的自動駕駛系統(tǒng)用固定規(guī)則判斷行為是否合理,WAM引入了基于人類反饋的價值函數(shù),系統(tǒng)會根據用戶的實際駕駛行為和反饋持續(xù)調整決策權重。簡單說,這輛車會越開越懂你的風格。
在實際應用中,WAM驅動的千里浩瀚G-ASD 4.0具備三道技術護城河。
其一是超高含模量。云端多模態(tài)大模型與世界模型的參數(shù)規(guī)模達到千億級別。作為參照,當前多數(shù)主流智駕端到端模型的參數(shù)規(guī)模集中在十億到百億量級。更重要的是,G-ASD 4.0融入了國賓級司機的駕駛行為數(shù)據,在擬人性、安全性、舒適性和通行效率四個維度上均實現(xiàn)了提升。
其二是超大數(shù)據集。吉利旗下累計850萬輛車的輔助駕駛數(shù)據、百億公里智駕里程、2500萬個模型訓練片段,以及沃爾沃55年的事故數(shù)據庫——這些數(shù)據構成了G-ASD訓練的數(shù)據底座。智駕系統(tǒng)的核心壁壘從來不在算法結構,而在數(shù)據質量和數(shù)據規(guī)模。數(shù)據決定了模型的上限,算法只是逼近這個上限的工具。吉利作為年產超過300萬輛的頭部車企,在數(shù)據積累上的優(yōu)勢是絕大多數(shù)新勢力和科技公司難以在短期內追平的。
其三是硬件天花板。H9方案搭載雙NVIDIA Thor芯片,算力達到1400TOPS,配合5顆激光雷達實現(xiàn)3重360度全維感知覆蓋,已具備L3級智能駕駛方案的落地能力。硬件冗余是L3自動駕駛的前置條件:當系統(tǒng)需要在特定場景下將駕駛權交給車輛時,必須有足夠的感知密度和算力帶寬來支撐實時決策。5顆激光雷達中的1顆為520線遠距激光雷達,負責前方200米以上的遠距感知,其余4顆為固態(tài)激光雷達,覆蓋車身兩側和后方的盲區(qū)——這種配置在當前量產車型中屬于最高規(guī)格。同時在GTC 2026上,吉利宣布與NVIDIA深度合作,將集成Alpamayo、Cosmos和NuRec三個平臺,進一步提升基于WAM的智駕開發(fā)、仿真與驗證效率。Alpamayo負責物理世界仿真,Cosmos提供生成式數(shù)據合成能力,NuRec則用于端到端模型的訓練優(yōu)化——三個平臺組合起來,可以在不依賴大量實車路測的情況下高效迭代算法。
如果說WAM是"大腦",超級Eva就是這個大腦面向用戶的"人格"。
傳統(tǒng)的車載語音助手本質上是一個指令執(zhí)行器——你說"打開空調",它執(zhí)行"打開空調"。超級Eva的設計邏輯完全不同。它基于WAM世界行為模型,與智能駕駛、底盤、動力等底層系統(tǒng)原生融合,而不是在傳統(tǒng)架構上外掛一個聊天機器人。這個區(qū)別至關重要:原生融合意味著Eva可以直接調用智駕系統(tǒng)的能力、操控底盤的響應、調整動力的輸出,而不需要經過中間層的協(xié)議轉換。
超級Eva由三個核心能力構成。
可聊性。Eva接入了階躍星辰的端到端語音語義一體化模型Step 3.5 Flash,拋棄了傳統(tǒng)"語音識別→大語言模型→語音合成"三段式架構的延遲和機械感。音頻信號直接輸入大模型,模型同時輸出意圖標簽和執(zhí)行參數(shù)。在單請求代碼類任務下,推理速度最高達350TPS。座艙芯片方面,吉利首發(fā)搭載NVIDIA與聯(lián)發(fā)科聯(lián)合開發(fā)的天璣汽車座艙平臺旗艦芯片C-X1,采用NVIDIA Blackwell GPU架構,支持第二代Transformer引擎和NVFP4,專門針對大語言模型和視覺語言模型的推理性能做了優(yōu)化。
深規(guī)劃。Eva具備多模態(tài)感知融合和動態(tài)任務規(guī)劃引擎。當用戶發(fā)出模糊指令時,比如"帶我去接孩子放學,順便幫我找一家麥當勞,5點我要到學校",系統(tǒng)不會只規(guī)劃導航路線,而是會將這個指令拆解為一個并行的動作序列:啟動智駕導航到學校→途經點搜索麥當勞并預訂→評估到達時間是否滿足5點要求→到達后自主泊車。座艙配置、內容推薦、服務預訂、健康監(jiān)測——所有這些任務由不同域的智能體并行執(zhí)行,而不是排隊響應。
強記憶。Eva的短期記憶存儲對話中的實體信息與情感標簽——它不僅記住你說了什么,還記住你說話時的情緒狀態(tài)。長期記憶則構建關系圖譜(家庭成員、重要事件等)和偏好概率值。這意味著Eva的體驗會隨著使用時間的增長而持續(xù)個性化,從"通用AI"逐步進化為"個人AI"。
"艙駕融合"這個詞在2025-2026年幾乎每個車企都在講,但大多數(shù)的"融合"停留在功能聯(lián)動層面——導航到了充電站自動打開充電口,語音說完目的地自動開始智駕導航。這種融合本質上是兩個獨立系統(tǒng)通過API接口互相調用。
吉利的艙駕融合走了不同的路徑。WAM世界行為模型從架構層面打通了座艙域和智駕域的底層能力。Eva和G-ASD 4.0共享同一套感知引擎(都能"看見"車內外環(huán)境)、同一套記憶引擎(都知道用戶是誰、去過哪里)、同一套決策引擎(都遵循同一套價值函數(shù))。
舉個具體例子來理解這種差異。在傳統(tǒng)架構下,用戶說"前面路太堵了,幫我換條路",座艙系統(tǒng)需要把這句話轉成一條導航指令發(fā)給智駕系統(tǒng),智駕系統(tǒng)重新規(guī)劃路線后再反饋給座艙系統(tǒng)展示。兩次通信、兩次解析、兩次決策,中間有延遲、有可能理解偏差。
在WAM架構下,這句話由同一個決策引擎處理。系統(tǒng)直接理解"堵"意味著什么(通過感知引擎實時獲取路況)、"換條路"意味著什么(通過認知引擎檢索替代路線)、"幫"意味著什么(需要自動執(zhí)行,不需要二次確認)。整個過程是一次決策、一次執(zhí)行,沒有中間環(huán)節(jié)。
這種架構上的統(tǒng)一,在實際體驗上的差異是顯著的。它讓汽車從一個"裝了很多智能模塊的交通工具"變成了一個"擁有統(tǒng)一智能的出行伙伴"。從工程角度看,艙駕融合的終極目標不是讓座艙"能控制"智駕,而是讓兩者"共享同一套對世界的理解"。當座艙系統(tǒng)和智駕系統(tǒng)對同一時刻的路況、用戶意圖和車輛狀態(tài)有一致的認知時,系統(tǒng)間的協(xié)作效率才能達到最優(yōu)。這也是為什么吉利將超級Eva定位為"國內首個實現(xiàn)類Grok+FSD原生AI體驗的量產方案"——特斯拉用Grok打通了AI與車輛控制的對話式交互,吉利在同樣的技術路線上實現(xiàn)了量產落地。
討論吉利的AI戰(zhàn)略,不能只看車上的技術。全域AI 2.0的底層支撐,是吉利過去幾年在算力基礎設施和研發(fā)體系上的持續(xù)投入。
星睿智算中心是吉利智能化研發(fā)的核心基礎設施。這個中心早在2023年就已上線運營,是國內車企首個入選全球算力500強的智算平臺。依托星睿智算中心的云端算力,吉利可以在8小時內完成1000個以上智駕模型的訓練迭代。阿里云作為技術合作伙伴,為星睿智算中心提供了算力效率優(yōu)化支持。
在研發(fā)組織上,吉利在2025年與階躍星辰、千里科技、星紀魅族等生態(tài)合作伙伴成立了"物理AI聯(lián)合實驗室",專注于將通用AI能力與汽車場景深度融合。這種"車企+AI公司+芯片公司"的聯(lián)合研發(fā)模式,在國內汽車行業(yè)中并不多見。
從數(shù)據角度來看,吉利2025年全年銷量突破302萬輛,其中新能源銷量近169萬輛,同比增長90%。2026年目標345萬輛,計劃推出約10款全新車型。300萬輛級的年銷量意味著每天有數(shù)百萬輛吉利車在路上行駛,每輛車都在持續(xù)產生駕駛數(shù)據、環(huán)境數(shù)據和用戶行為數(shù)據。這些數(shù)據通過WAM架構的價值函數(shù)體系反饋到模型訓練中,構成"數(shù)據飛輪"——車越賣越多,數(shù)據越積越多,AI越聰明,產品越好賣。
這套飛輪一旦轉起來,后來者追趕的難度不僅在于算法,更在于數(shù)據的規(guī)模和質量。這也是為什么吉利將全域AI定位為"集團級戰(zhàn)略"而不是"某個車型的賣點"——AI能力的建設周期以年為單位,數(shù)據的積累周期以百萬輛車為單位,這些都需要長期主義投入才能形成壁壘。
全域AI 2.0不是一個發(fā)布會上的概念,而是一套正在量產的技術體系。WAM世界行為模型提供了統(tǒng)一的"世界觀",超級Eva提供了面向用戶的"人格",千里浩瀚G-ASD 4.0提供了執(zhí)行層面的"肌肉",星睿智算中心提供了持續(xù)進化的"燃料"。
從2024年1月發(fā)布星睿AI大模型,到2025年CES發(fā)布全域AI 1.0,到2026年CES進化到2.0,再到GTC 2026宣布超級Eva量產上車——吉利用兩年時間完成了從"AI應用"到"AI架構"的跨越。
對于用戶來說,最直觀的變化可能只是:以前你要分三步完成的事,現(xiàn)在一句話就夠了。但對于行業(yè)來說,這意味著智能汽車的競爭維度,正在從"誰的智駕更厲害"升級為"誰的AI體系更完整"。
三個值得關注的信號:第一,吉利的全域AI 2.0已經進入量產階段,不是概念演示,極氪8X是第一個載體,后續(xù)更多車型將陸續(xù)搭載;第二,WAM架構的開放性和可擴展性意味著這套系統(tǒng)能持續(xù)吸收新的AI能力,包括階躍星辰、千里科技等合作伙伴的最新模型迭代;第三,300萬輛年銷量帶來的數(shù)據飛輪效應已經開始轉動,這將持續(xù)擴大吉利在AI訓練數(shù)據方面的優(yōu)勢。
(雷峰網(公眾號:雷峰網)新智駕北京車展2026專題)
雷峰網原創(chuàng)文章,未經授權禁止轉載。詳情見轉載須知。