今年春節,余承東和絕大多數車主一樣,準備自駕返程也全程使用智駕功能,可以說,2025年的春運,關鍵字已經不是堵車、搶充電樁或者續航焦慮了,畢竟,過去的一年,動力電池基本已經實現了包括優化電解液配方,正負極材料,成組形態在內的新技術,加碼高倍率充電能力后,10分鐘充200km變成了常態,插混發動機和增程器,也卷了將近一年的熱效率,上千公里的綜合續航和5升內的饋電油耗,也不是稀奇的事了,所以,今年的關鍵詞,就是端到端在春運的實測效果,問題來了,全程開智駕返鄉,你一共接管了幾次?到了明年春節,還用自己開車嗎?
之所以說春節是車企端到端效果的一次大考,說白了,是因為春運期間車主自駕的距離長短不一,高快城區路況復雜,平時碰不到的corner case大概率都會集中遇到,再進一步講,就是考驗不同端到端技術方案的實際接管表現了,就目前整個智駕領域來說,還是多傳感器融合方案的效果更好一些。
Bsports必一體育
所謂的多傳感器融合,其實就是帶激光雷達的端到端,前面我們也從技術角度分析過,激光雷達在構造上就和毫米波雷達不同,其更像是一組把數據處理芯片、激光探測發射器、接收器全部集成在一塊的高精度傳感系統,所以復雜的結構特性就決定了其職能,即通過掃圖識別障礙物從而構建3D環境數據,比肉眼或傳統異目攝像頭架構“看”得更仔細,這也是大多主機廠認為激光雷達方案是兜底智駕安全的重要一環。
當然了,選擇純視覺端到端路線,重頭戲也是在升級感知硬件體系上,比如去年小鵬提出的Lofic攝像頭架構,強化了光環境的數據采集能力,至于沒選擇純視覺方案的小米汽車,其提出的可變焦BEV技術,本質上也是基于攝像頭,對探測性能的精化,所以,從感知硬件層面上看,激光雷達能發射的線束越多,就越能獲取到更準確的數據,所對應的,是給端到端模型整個數據分析上的提升。
重點再來聊軟件層面,事實上,基于目前兩種智駕方案來看,以transformer為主干網絡的BEV感知架構,已經是推進端到端技術的基礎,這也是行業內的技術共識了,自注意力機制的優勢,就在于能將大量的視頻或圖像信號轉成規模級的數據信號,而端到端的本質,就是在感知和規控之間不再需要人工書寫規則,數據量的提升,賦予了端到端模型生成式的分析和學習能力,所以,是否能給出類人的駕駛邏輯,是和數據投喂量直接相關的,再延展一句,市場基盤越大,理論上就越容易迭代整個模型的推理能力,所以,我們可以期待一下,比亞迪在今年的端到端效果。
拿目前比較主流的兩類端到端技術來說,華為的GOD大網架構和理想的E2E+VLM,其實基本上已經是今年非常接近類似L3效果的方案了,具體來說的話,是整套系統的接管率實現了大幅降低,華為ADS 3.2和兩年前的ADS2.0相比,百公里接管次數差不多從4-6次降到了1-2次,理想也是如此,甚至從官方給出的數據來看,接管效果更激進一些。
從軟件的底層邏輯來看,華為的方案屬于分段式端到端,但和理想一樣都有兩套系統打底,華為GOD在并入BEV之后,感知拿到數據后GOD網會直接給出執行邏輯,PDP網絡更多的是在進行深度分析學習后,給出偏激進的執行方案,理想所謂的“快系統”就是E2E,給出的執行策略是之前的訓練學習后的結果,“慢系統”是視覺語言模型VLM,主線任務是學習復雜場景,另外云端世界模型則是整套架構的兜底機制,通過數據還原黑盒子并嘗試理解和學習,所以在某種程度上講,這兩套方案,都能看出來有類似one model形態的技術趨勢,所以,不用再結合特定場景的記憶模式,也能實現自由車位到自由車位的效果,打通不限停車場且自主跨層漫游找空車位,大概率今年內就能實現。
話說回來,除了還沒來中國的FSD,和已經成絕版的極越,還有離不開車端高性能芯片的小鵬,卓馭的7V+32T低算力平臺,現在也實現了高快NOA和城區NOA,低價車也具備了高階智駕能力,但要說達到類似L3全程不碰方向盤和更極限的接管次數,這套方案更多提升的是短途智駕通勤體驗,當然了,我們也不排除corner case積累量足夠后,其模型也有類似視覺語言動作模型VLA的迭代能力,不出意外,2025年可能還是技術儲備期,最后拿出效果,最快也是在明年。
春節前的CES,差不多已經拔高了未來2-3年自動駕駛的能力下限,英偉達單顆Thor的750TOPS,是現在主流端到端方案用的Orin-X近3倍,若按照接著以2顆為智駕方案,1500TOPS的車端算力,基本上不會再出現復雜場景算不過而導致降級接管的情況,而且,從明年開始,包括蔚來、華為、小鵬、理想、比亞迪等多家國產企業,會集中量產自研高算力智駕芯片,所以就整個硬件體系里來講,明年超過今年的端到端效果,已是必然所在,這是不是就意味著,不論L3順利商業化與否,激光雷達和純視覺方案,是不是都有機會來一次大迭代?
答案是肯定的,而且,前者大概率還會因激光雷達技術的演變,讓整個端到端體系變得更加激進,華為的192線,現在就已經做到了自由車位到自由車位的全程智駕,禾賽的128線基本上也有類似的效果,速騰聚創在今年還把超過1000線束的激光雷達,成本控制在千元級,甚至還坐了更小的集成化,所以,有高算力車端智駕芯片打底,激光雷達不用高性能,端到端的自適應生成迭代能力也會有更進一步的表現。
不出意外,小米在引入VLM之后,大概率會是繼華為ADS 3.2和理想之后,最快趕上千公里零接管的端到端技術,本質也是需要高算力芯片提高模型的推理能力,可以給出的判斷是,這三家端到端技術架構,接下來都會圍繞視覺語言動作模型VLA展開做文章,不同之處,可能會在執行細節呈現的體驗維度上,偏激進的會更果斷,偏保守的也會演變成更接近人類駕駛員的駕駛習慣,所以,不用等L3量產落地,最快在明年春節的時候,全程用智駕回家不碰方向盤,實現起來基本不會是問題了,想象一下,當越來越多的高階智駕車出現,春運高峰還會像之前那樣,在高速上動輒堵上數小時嗎?