0
作為理想首顆車規(guī)級自研高算力芯片,馬赫M100不僅是L9 Livis邁向“具身智能汽車”的核心硬件底座,也決定了這款車未來智能能力的上限與進(jìn)化速度。
馬赫M100僅有一個版本,不區(qū)分高低配,高端車型如L9 Livis將搭載2顆芯片。
馬赫M100量產(chǎn)后,理想仍將持續(xù)為老車型(如2022款理想L9)迭代模型,將通過蒸餾方法將大模型適配到算力更小的芯片上,保障老用戶的體驗(yàn)升級。
在理想內(nèi)部,馬赫M100不僅是一顆芯片的名字,也被視為公司AI戰(zhàn)略的重要象征。
理想最初曾將這顆自研芯片命名為“舒馬赫”,靈感部分來自傳奇賽車手舒馬赫,后來則進(jìn)一步簡化為“馬赫M100”,既保留了對速度的聯(lián)想,也借用了“馬赫”這一速度計量單位,寓意芯片擁有更快的計算速度與更強(qiáng)的AI推理能力。
從2021年開始決定自研芯片,到2022年11月正式立項(xiàng),再到2023年進(jìn)入大規(guī)模研發(fā)、2024年完成流片、2025年回片驗(yàn)證,最終于2026年隨全新一代理想L9 Livis正式上車,理想用了約3年半時間完成了馬赫M100的研發(fā)落地。
理想汽車CTO謝炎告訴雷峰網(wǎng),理想起步最晚,但最終完成節(jié)奏并沒有落后太多,這主要源于整體研發(fā)推進(jìn)速度相當(dāng)快,從一開始就規(guī)劃得非常精細(xì),需求也非常清晰。
蘋果公司一直是理想汽車看齊的目標(biāo),而蘋果最大的優(yōu)勢在于“操作系統(tǒng) + 芯片 + 軟件”的垂直整合,“蘋果的操作系統(tǒng)會告訴芯片該怎么設(shè)計,芯片又會反過來給系統(tǒng)提供差異化能力。”
這也是理想汽車自研芯片的出發(fā)點(diǎn)——通過大模型、星環(huán)OS、馬赫M100芯片、整車等硬件,逐步形成完整的自研技術(shù)閉環(huán)。
圖靈獎得主艾倫·凱曾經(jīng)說過:“真正認(rèn)真對待軟件的人,應(yīng)該自己制造硬件。”某種程度上,這句話解釋了理想為何會走向自研芯片之路。
供應(yīng)商路線圖與理想對AI算力的判斷存在差距,是促使理想加快自研節(jié)奏的客觀因素,但根本驅(qū)動力是對AI架構(gòu)演進(jìn)方向的主動判斷。
供應(yīng)鏈危機(jī)與芯片平臺的不確定性,是促使理想加快動作的客觀因素。讓理想下定決心走向芯片自研的核心因素,是對下一代AI技術(shù)演進(jìn)方向的判斷。
2022年“Scaling Law”還未成為共識時,理想團(tuán)隊(duì)意識到一組推導(dǎo)邏輯:大算力給算法更大的設(shè)計空間,更大的算力會帶來更高的性能,更高的性能帶來更好的體驗(yàn)。
他們的判斷依據(jù),某種程度上來自整個計算機(jī)產(chǎn)業(yè)的發(fā)展歷史。
回顧過去幾十年的技術(shù)演進(jìn),無論是算力還是內(nèi)存,人類對計算資源的需求從來沒有真正“夠用”過。上世紀(jì)七八十年代,幾十KB內(nèi)存、幾百KHz主頻就已經(jīng)屬于高性能計算機(jī)。而今天,這樣的性能幾乎難以支撐任何現(xiàn)代應(yīng)用。
計算需求永遠(yuǎn)在增長,這也是理想判斷AI時代算力需求會持續(xù)爆發(fā)的重要原因。
“如果AI能力持續(xù)增長,而現(xiàn)在距離自動駕駛真正實(shí)現(xiàn)L4、完全替代人類駕駛,還有很長的路要走,而這背后一定需要越來越高的算力支撐。技術(shù)迭代速度又非常快,如果長期依賴外部廠商,整體演進(jìn)速度會比較慢。”謝炎說道。
謝炎舉了一個案例:隨著Transformer架構(gòu)在AI領(lǐng)域迅速崛起,2024年初理想內(nèi)部很快識別到這一趨勢,決定對芯片優(yōu)化方向做臨時調(diào)整。結(jié)果如何?內(nèi)部團(tuán)隊(duì)一個月內(nèi)完成了新設(shè)計優(yōu)化。
“如果是外部供應(yīng)商,根本不會接這種需求,除非你給它一大筆錢,甚至還要迭代一年。”謝炎說,“甚至,很多芯片公司不會因?yàn)橐粋€客戶就改變自己的技術(shù)方案。”
理想自研芯片的第二個關(guān)鍵原因在于計算架構(gòu)正在進(jìn)入新一輪躍遷周期。
過去六七十年,計算機(jī)主要建立在馮·諾依曼架構(gòu)之上,CPU、GPU本質(zhì)上都是在這一體系上的優(yōu)化。但隨著AI快速發(fā)展,這一架構(gòu)開始顯現(xiàn)局限性,無法以最優(yōu)效率支撐大規(guī)模AI計算需求。
因此,謝炎判斷,行業(yè)有機(jī)會進(jìn)入“Native for AI”的新架構(gòu)階段,從軟件到硬件重新設(shè)計計算系統(tǒng)。
歷史上類似的變化曾多次發(fā)生,例如圖形計算興起時,英偉達(dá)判斷需要GPU專用架構(gòu),而英特爾則長期堅持CPU足夠應(yīng)對。最終GPU成為AI與圖形計算的核心平臺,這也導(dǎo)致兩家公司在市值與行業(yè)地位上發(fā)生逆轉(zhuǎn)。
理想據(jù)此判斷,未來AI計算將成為增長最快的計算形態(tài),而GPU并非終點(diǎn),因此需要面向AI重新設(shè)計計算架構(gòu),在軟件與硬件一體化中尋找更高效率的解決方案。從技術(shù)上來講,馬赫M100有創(chuàng)新的機(jī)會。
當(dāng)然,成本也是一個現(xiàn)實(shí)因素。“供應(yīng)商的芯片價格本身并不低,我們自己設(shè)計在規(guī)模上來之后,成本會更有優(yōu)勢,”謝炎坦言,“但這更多是第三層面的考慮,更核心的,還是在AI快速發(fā)展的階段,必須具備自主定義和掌控技術(shù)的能力。”
對于外界關(guān)注的“車企自研芯片是否真的更省錢”,謝炎給出的答案并不只是簡單的成本賬。
行業(yè)過去習(xí)慣用“多少顆芯片”衡量規(guī)模,但真正決定成本的,其實(shí)是“芯片面積 × 出貨量”。因?yàn)榫A廠的計價方式本質(zhì)上是按硅片面積計算,同樣一塊晶圓,可以切割成數(shù)千顆小芯片,也可以只切出數(shù)十顆大芯片,但核心成本差異來自面積,而非顆數(shù)。
在理想內(nèi)部的判斷中,未來汽車對于AI算力的需求會持續(xù)快速增長,而算力本質(zhì)上又對應(yīng)著更大的芯片面積需求。謝炎認(rèn)為,隨著智能化程度不斷提升,汽車行業(yè)未來消耗的AI計算硅片面積,甚至可能超過手機(jī)行業(yè),這意味著頭部車企已經(jīng)具備支撐自研AI芯片的產(chǎn)業(yè)規(guī)模。
謝炎本身從底層技術(shù)一路走來,本科學(xué)電子工程、研究生學(xué)計算機(jī)架構(gòu),先后做過編譯器、操作系統(tǒng),更早之前還做過計算機(jī)體系架構(gòu)相關(guān)工作。
“做了這么多年回過頭來看,有機(jī)會在軟件開發(fā)工作中參與到硬件與底層的聯(lián)合設(shè)計時,就本能想做出超越性的設(shè)計,而不再只是被動依賴供應(yīng)商。”謝炎說。
謝炎非常認(rèn)同艾倫·凱的觀點(diǎn):“真正認(rèn)真對待軟件的人,應(yīng)該自己制造硬件。”

這與理想的戰(zhàn)略相契合,理想的目標(biāo)并不僅是造車,而是構(gòu)建類似蘋果式的完整技術(shù)棧——從操作系統(tǒng)、推理框架、runtime,到硬件與芯片,形成全鏈路自研閉環(huán)。
事實(shí)上,蘋果與安卓的差異,本質(zhì)是“垂直整合能力”的差異:操作系統(tǒng)定義芯片能力,芯片反過來強(qiáng)化系統(tǒng)體驗(yàn),這種協(xié)同是外部供應(yīng)商無法提供的,也是構(gòu)建差異化價值所在。
謝炎判斷,未來汽車行業(yè)的競爭格局會逐漸呈現(xiàn)兩種模式,少部分企業(yè)會走向類似類似蘋果、華為的深度自研路線;大部分企業(yè)則會受限于研發(fā)成本,更多靠采購?fù)ㄓ梅桨福簇浖芊桨福ㄟ^集成與二次優(yōu)化來完成產(chǎn)品開發(fā)。
“理想希望成為前者,技術(shù)高壁壘、競爭高差異化、公司高利潤。”
當(dāng)然,不是所有的底層技術(shù)理想汽車都會選擇自研,只有那些仍處于高速演進(jìn)、持續(xù)變化,并且能夠在未來形成穩(wěn)定差異化優(yōu)勢的技術(shù),才會投入自研資源。
“對我們來說,并不是所有芯片都要做,而是聚焦AI芯片這一方向。如果一家公司以AI為核心競爭力,那么自研AI芯片是必須做的事。想要成為頭部公司,這件事是繞不開的。”謝炎表示。
小鵬圖靈芯片單顆算力達(dá)到750 TOPS;蔚來的神璣 NX9031單顆算力約為1000 TOPS。理想的馬赫M100有效算力更高,達(dá)到1280TOPS。
不過,這并不是它的關(guān)注重點(diǎn),比起市場上已有的芯片,馬赫M100重寫芯片架構(gòu),將軟件需求與硬件高度耦合。理想汽車認(rèn)為,比起堆砌TOPS數(shù)據(jù),激發(fā)有效算力更能提升智駕體驗(yàn)。
謝炎團(tuán)隊(duì)在研究中發(fā)現(xiàn),英偉達(dá)、高通這類芯片往往面向汽車、AI、PC、數(shù)據(jù)中心等跨行業(yè)通用場景,汽車廠商拿到芯片后,需要調(diào)試算法或壓縮模型智能,才能讓芯片在車內(nèi)正常運(yùn)轉(zhuǎn)。這個過程中,往往伴隨著70%的算力浪費(fèi)和模型智能的妥協(xié)。
因此,理想汽車不再是根據(jù)已有的芯片編寫軟件程序,或是拿著算法找芯片,而是將軟硬件的需求放在一起,共同開發(fā)芯片。
謝炎反復(fù)強(qiáng)調(diào)一個觀點(diǎn):“設(shè)計芯片最重要的不是設(shè)計,而是理解需求。”
在傳統(tǒng)模式下,芯片團(tuán)隊(duì)獨(dú)立完成設(shè)計,后期再由算法、模型團(tuán)隊(duì)適配。一旦需求理解偏差,后續(xù)全都會做偏,時間被大量浪費(fèi)。理想的打法則完全不同——芯片不是芯片團(tuán)隊(duì)單獨(dú)設(shè)計的。
從項(xiàng)目啟動之初,芯片團(tuán)隊(duì)、模型團(tuán)隊(duì)、自動駕駛團(tuán)隊(duì)、操作系統(tǒng)團(tuán)隊(duì)就坐在一起,共同定義需求。謝炎說:“沒有他們的輸入與認(rèn)知,沒有大家一起坐下來分析,就會做偏。而做偏就會帶來時間的浪費(fèi)。”
“我們大概有200人,人員規(guī)模會控制在一個精簡規(guī)模上,做最核心的事。”在芯片行業(yè),這并不是一支大規(guī)模的團(tuán)隊(duì)。作為對比,哲庫科技巔峰期3000人,華為海思超7000人,英偉達(dá)單芯片項(xiàng)目團(tuán)隊(duì)動輒數(shù)百人。
在聯(lián)合開發(fā)理念的加持下,馬赫M100的關(guān)鍵創(chuàng)新來自芯片架構(gòu)的重寫。
馬赫M100的理論基礎(chǔ)來自論文《M100: An Orchestrated Dataflow Architecture Powering General AI Computing》。
理想汽車團(tuán)隊(duì)在這篇論文中提出“周密編排數(shù)據(jù)流架構(gòu)”,讓數(shù)據(jù)像河流一樣在計算單元間流動,相比傳統(tǒng)GPU架構(gòu),理想的數(shù)據(jù)流架構(gòu)能夠減少緩存中的反復(fù)存取,釋放更多有效算力,提高AI的運(yùn)行效率。
謝炎用一句話點(diǎn)明了這一架構(gòu)的本質(zhì):“我們不需要讓數(shù)據(jù)頻繁去DDR走一圈。”在傳統(tǒng)架構(gòu)中,數(shù)據(jù)頻繁在片外DDR與片上計算單元之間搬運(yùn),成為性能瓶頸。而數(shù)據(jù)流架構(gòu)的核心目標(biāo),就是減少甚至避免DDR訪問。
為此,馬赫M100在芯片內(nèi)部配置了大量分布式SRAM,數(shù)據(jù)盡量在片上完成流轉(zhuǎn)。謝炎強(qiáng)調(diào):“一旦大量訪問DDR,性能和效率都會下降。”分布式SRAM的設(shè)計,使得數(shù)據(jù)流架構(gòu)的優(yōu)勢得以充分發(fā)揮——更低的延遲、更高的能效。
從芯片內(nèi)部布局來看,馬赫M100是一顆“AI優(yōu)先”的芯片。

周密編排數(shù)據(jù)流策略
馬赫M100芯片內(nèi)部一部分是CPU核,負(fù)責(zé)Linux與控制邏輯;而超過一半的芯片面積,完全用于AI計算。這一比例在同類芯片中相當(dāng)突出,直觀體現(xiàn)了理想對AI能力的極致追求。
AI計算部分采用數(shù)據(jù)流架構(gòu),配合大量分布式SRAM,使其特別適合大模型推理——無論是自動駕駛模型、語言模型,還是未來的機(jī)器人模型。
而引入MoE混合專家模型則更加放大了計算優(yōu)勢。傳統(tǒng)稠密模型處理輸入時,所有參數(shù)被激活,無論事件復(fù)雜或簡單,每一個神經(jīng)元都參與計算,導(dǎo)致算力浪費(fèi)。
MoE模型能夠根據(jù)輸入數(shù)據(jù),精準(zhǔn)選擇不同的專家子網(wǎng)絡(luò)處理特定任務(wù),從而避免冗余計算,降低資源消耗。
2023年,ChatGPT引發(fā)大模型的浪潮,MoE進(jìn)入主流視野,成為車端部署的又一選擇。基于數(shù)據(jù)流架構(gòu)的前瞻性設(shè)計,理想汽車擁抱了算法范式的演進(jìn)。
對于用戶來說,馬赫M100帶來的價值最終體現(xiàn)在智駕體驗(yàn)的提升。謝炎將其總結(jié)為三個維度:看得更遠(yuǎn)更準(zhǔn)、決策更絲滑、響應(yīng)更快。
看得更遠(yuǎn)更準(zhǔn)是指能更好地理解遠(yuǎn)距離場景及細(xì)節(jié),解決當(dāng)前自動駕駛遠(yuǎn)距離感知不足的問題。
決策更絲滑則是依托更大算力支撐的更優(yōu)模型,決策更接近人類習(xí)慣,避免急剎、急頓等突兀操作。
響應(yīng)更快是綜合優(yōu)化推理速度、線控響應(yīng)、操作系統(tǒng)損耗,縮短從傳感器輸入到控制輸出的時間,同時頻率縮短后還能以15幀、20幀甚至更高速度處理傳感器信號,兼顧絲滑與安全。
安心感則是長期目標(biāo)——逐步讓智駕系統(tǒng)的決策習(xí)慣與大部分人類駕駛認(rèn)知匹配,減少因操作邏輯差異帶來的用戶顧慮(如避免類似賽車手駕駛的激進(jìn)風(fēng)格)。
“有點(diǎn)像你讓一個賽車手給你當(dāng)司機(jī),你不舒服,因?yàn)樗恼J(rèn)知跟你的認(rèn)知差別很大。”謝炎描述,馬赫M100的目標(biāo),是要在體驗(yàn)上接近一個更像人的司機(jī)。”
此前,理想汽車的電子電氣架構(gòu)中共有三大核心控制器:中央域控制器XCU、座艙域控制器以及智駕控制器。但隨著馬赫M100芯片與星環(huán)OS正式落地,從L9 Livis開始,理想首次完成了中央域控制器與智駕控制器的融合。
謝炎表示,現(xiàn)在車輛中已經(jīng)不再單獨(dú)存在XCU控制器,而是通過虛擬化技術(shù),在一顆芯片上同時運(yùn)行不同系統(tǒng)。表面上看,輔助駕駛控制與XCU依然是兩個系統(tǒng),但底層算力已經(jīng)實(shí)現(xiàn)統(tǒng)一調(diào)度。
這也是L9 Livis與傳統(tǒng)智能汽車的重要區(qū)別。
在理想內(nèi)部,馬赫M100并不只是被定義為一顆輔助駕駛芯片,而是整車AI能力的底層平臺。謝炎表示,理想并不希望它只服務(wù)輔助駕駛,而是能夠支持更多AI模型運(yùn)行。因此,L9 Livis的定位,也不僅是智能汽車,而是“具身智能汽車”。
所謂具身智能,本質(zhì)上是讓AI擁有在物理世界中的感知、決策與行動能力。而汽車天然具備成為具身智能載體的基礎(chǔ)。
相比從零開始打造機(jī)器人,汽車本身已經(jīng)具備了完整的“身體”基礎(chǔ):動力系統(tǒng)、主動懸架、線控底盤、攝像頭、傳感器以及高算力平臺都已經(jīng)成熟存在,天然擁有感知與行動能力。
“買下一輛車,它已經(jīng)有輪子、有動力、有算力和攝像頭,缺少的只是把這些能力真正連接起來,形成一個具身智能體。馬赫M100的作用,本質(zhì)上就是把這些分散能力連接起來。”謝炎表示,這相比重新組裝一套機(jī)器人系統(tǒng),技術(shù)路徑更現(xiàn)實(shí),也更容易率先實(shí)現(xiàn)商業(yè)化。
更重要的是,汽車產(chǎn)業(yè)龐大的規(guī)模效應(yīng),是具身智能快速進(jìn)化的重要基礎(chǔ)——汽車行業(yè)擁有上千億級市場規(guī)模,可以持續(xù)推動傳感器、AI算力、線控底盤和動力系統(tǒng)快速迭代,并通過大規(guī)模量產(chǎn)不斷降低成本、提升成熟度。
當(dāng)這些核心技術(shù)被充分驗(yàn)證后,再向機(jī)器人等其他具身智能形態(tài)遷移,難度會明顯降低。
謝炎將這一過程類比為PC與智能手機(jī)的演進(jìn)關(guān)系。在他看來,智能手機(jī)并非憑空誕生,而是在PC產(chǎn)業(yè)長期發(fā)展后,芯片、操作系統(tǒng)與計算能力逐漸成熟,最終完成的小型化與移動化。
具身智能的發(fā)展路徑也類似,汽車有望成為率先規(guī)模化落地的物理AI。
而在理想看來,馬赫M100承擔(dān)的角色,也不僅是提升算力。

謝炎將其類比為蘋果的垂直整合模式,蘋果并不會單獨(dú)售賣處理器,但芯片與操作系統(tǒng)結(jié)合后,能夠提供遠(yuǎn)超行業(yè)平均水平的體驗(yàn)。理想希望馬赫M100也能承擔(dān)類似角色,通過更高算力與自研模型結(jié)合,形成差異化競爭能力。
“自動駕駛會成為用戶選擇汽車的關(guān)鍵因素。”謝炎表示,如果AI不能真正改變用戶體驗(yàn),那么投入AI也失去了意義。
據(jù)了解,馬赫M100并不是傳統(tǒng)意義上只服務(wù)自動駕駛的ASIC專用芯片,而是一顆相對通用的AI處理器。除了輔助駕駛,它還能夠支持更多AI模型運(yùn)行,這也是理想將L9 Livis定義為“具身智能汽車”的原因之一。
在理想的設(shè)想中,未來汽車不只是完成駕駛?cè)蝿?wù),而是會逐漸具備類似機(jī)器人的能力,可以主動完成更多現(xiàn)實(shí)世界中的工作。
與此同時,隨著AI能力不斷提升,理想對于傳感器路線的思考也在發(fā)生變化。
針對華為此前發(fā)布的896線激光雷達(dá),謝炎認(rèn)為,高線數(shù)激光雷達(dá)本質(zhì)上是在不斷逼近攝像頭的分辨率,其核心目標(biāo)是提升三維世界的感知精度。
謝炎表示,僅依賴攝像頭,系統(tǒng)仍然缺少準(zhǔn)確的深度信息,而深度感知對于高階智能駕駛至關(guān)重要。因此,理想會繼續(xù)堅持“激光雷達(dá) + 視覺融合”路線,通過激光雷達(dá)提供高精度距離信息,再結(jié)合視覺系統(tǒng)構(gòu)建完整的三維世界模型。
理想目前正在通過3D ViT三維視覺模型,將點(diǎn)云、語義與像素信息進(jìn)行統(tǒng)一融合,還原更完整的三維空間認(rèn)知能力。在這一體系中,激光雷達(dá)與視覺不再是彼此替代關(guān)系,而是共同組成具身智能時代的“眼睛”。
而在軟件層面,L9 Livis也正在從“功能集合”走向“角色化”。
過去的軟件邏輯更像App,每個功能對應(yīng)一個應(yīng)用;但在AI時代,理想更傾向于將汽車視為“司機(jī)”“助手”甚至“管家”式的智能角色。車輛不只是響應(yīng)指令,而是開始具備主動理解需求、執(zhí)行任務(wù)的能力。
雷峰網(wǎng)(公眾號:雷峰網(wǎng))認(rèn)為,某種程度上,馬赫M100對于L9 Livis的意義,并不只是提升了一輛車的算力,而是讓理想開始嘗試用AI重新定義汽車。
自2021年末啟動自研計劃,理想用時3年半完成了初步的芯片布局和技術(shù)探索,嘗試掌握芯片定義的主導(dǎo)權(quán),向著蘋果、特斯拉這些依靠軟硬件一體化的巨頭看齊。
但成為頭部公司的路從來陡峭,前期研發(fā)投入后,芯片造出來只是開始。接下來要通過量產(chǎn)、大規(guī)模上車分擔(dān)研發(fā)成本,為后續(xù)的芯片開發(fā)和投入鋪墊方向。而車企需要在這個過程中持續(xù)加碼,才能蹚出一條商業(yè)閉環(huán)的自研之路。
與此同時,芯片競爭仍然激烈。英偉達(dá)、高通、以及國內(nèi)廠商地平線正在加速迭代芯片產(chǎn)品,特斯拉的FSD芯片已迭代至第四代,華為昇騰的產(chǎn)能限制正在緩解,馬赫M100需要在算力效率、成本控制、產(chǎn)能保障三個維度同時取勝,才能證明自研的價值。
(作者長期關(guān)注蔚小理和智能駕駛的技術(shù)與人事動態(tài),歡迎添加微信 ColombaHere 交流討論)
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。