DeepSeek-V3訓練過程算力消耗僅ChatGPT-4的16%,實際成本僅557.6萬美元,展現出強大的技術優勢。
2.然而,在智能駕駛行業,數據成為決定競爭力的關鍵,頭部企業通過大量真實路況數據形成壁壘。
必一運動官網
3.由于DeepSeek的崛起,智駕行業競爭加劇,二線企業面臨出局風險。
4.事實上,資本和人才已經開始向頭部五強企業流動,數據寡頭時代即將來臨。
5.對于落伍者,只剩下資本市場雪崩般的估值重構和全新警示,技術可以彎道超車,但產業生態的進化從不等待遲到者。
“我甚至說所有行業、所有應用、所有軟件、所有服務都值得基于新型人工智能技術、基于AIGC各方面技術支撐、大模型支撐重做一遍……”
2023年4月中旬,張勇在阿里云峰會上如此暢言。這番講話的背景,正是當時風頭正勁的ChatGPT大語言模型。
張勇口中的“所有行業、所有應用、所有軟件”,自然也包含了當時正陷入理論和落地泥潭的智能駕駛概念。并非沒有企業對此躍躍欲試,然而算力的制約卻也是顯而易見的。
以目前的視角看,OpenAI采用“從人類反饋中強化學習”訓練方式,實際上頗有幾分日常大家戲謔那種“力大磚飛”的味道。
通過堆砌大量算力不惜能耗去訓練大模型,最終受益了能源企業,以及英偉達這種算力芯片供應商。直到DeepSeek-V3的橫空出世。
與ChatGPT-4相比,DeepSeek-V3的訓練過程,算力消耗僅前者的16%,實際成本僅557.6萬美元,折合前者(7800萬美元)的區區7%。但兩個大模型在實際部署運用上,能力卻是近似的。
站在2025年初這個時間節點,值此國內乃至全球智駕行業進入收束狀態迎接收官階段的關鍵時刻,這是否意味著新的變數?
延續自本世紀第二個十年中期的自動駕駛技術,已經明確了依賴深度神經網絡(DNNs)來處理特定任務,如感知、預測和規劃等。這些系統一般采用模塊化設計——每個模塊負責解決一個特定的問題,例如物體檢測、路徑規劃或速度控制。
這種架構的優點在于它允許工程師針對每一個子任務進行優化,并且便于調試和驗證。同樣的邏輯也體現在智駕系統的傳感器系統設計上,而前述優點也是少部分企業堅決反對激光雷達,一直堅持所謂“純視覺路線”的根本原因。
然而,隨著大模型——即使用Transformer架構構建的模型的流行,尤其是那些具有大量參數的大規模預訓練模型,自動駕駛技術迎來了新的可能性。
大模型的基本特性之一,是能夠捕捉數據中的復雜模式,并通過大規模的數據集進行訓練,從而在多種任務上展現出強大的泛化能力,可以被用來增強系統的感知能力和決策制定過程。
在感知能力方面,能夠充分融合與處理更復雜的圖像、雷達和激光雷達數據,識別行人、車輛、道路標志等。傳統多傳感器融合所面臨的難題,在大模型面前得到了很好地解決,而且可以提升系統在極端天氣或復雜路況下的魯棒性。
此外,大模型在持續學習能力方面的優勢,這意味著其可以根據新收集的數據不斷改進自身的性能,適應不同的駕駛條件和環境變化。
更因為大模型明文羅列邏輯推導過程的特性,使得開發人員在分析系統決策時,徹底告別了以往的黑箱狀態。
通過透明化決策邏輯幫助調試和優化,并引入冗余系統和風險預測機制,確保在突發情況下的安全性。
▲2023年初ChatGPT的橫空出世,可以被視為AI技術的一次重要突破。盡管其是一種“大語言模型”,但也啟發了相鄰的各賽道
然而在2023年,ChatGPT的出世,并沒有立即對智駕行業帶來特別的觸動。究其原因,若是以ChatGPT為模板來倒推的話,以Transformer架構把現有的智駕系統“重做一遍”,重新訓練的代價將會非常巨大。
英偉達配備80GB緩存的A100 GPU算力卡單卡的理論算力是 312TFLOPS,但考慮到tensor/pipeline parallel并行技術算力利用率僅略超過一半,則完成一個月訓練量需要接近千張80G內存規格A100算力卡。
而在2023年的時候,1000張80G A100的采購價格大約1.5億人民幣。
DeepSeek之所以被視為重大突破,乃是通過混合專家架構(MoE)與多頭潛在注意力(MLA)機制,不但提高預訓練中的算力利用率,還有效地降低了推理成本。
簡單粗暴描述大致可認為,是以OpenAI訓練ChatGPT所需代價的五分之一,實現了大致一樣效果。
必一運動官網
然而這一切發生在2024年末,資本密集投資智駕企業的機會窗口已經關閉,甚至整個市場也被初步瓜分。
幾天前,曾經被譽為國內智能駕駛第一股的圖森未來,在去年初宣布轉換娛樂以及影視制作賽道之后,終究是沒有能夠扛住壓力,企業因為“內訌”而解散。
往前推,在這個春節長假剛結束那會兒,2024年末已宣布進入“低功耗模式”的縱目科技,也傳出人去樓空的消息。
而僅僅兩年半之前,這家企業曾一度因為拿下問界M5/7智能泊車解決方案訂單,一時成為行業矚目的焦點。
往前追溯,去年的11月27日,成功登陸美國的小馬智行在首個交易日即跌破發行價。盡管這家企業在國內曾經有過“行業獨角獸”的光環,但在美譽之下卻是企業自2016年成立以來,已經連續虧損八年的事實。實際此番上市,多少也有點最后一搏的味道。
也是在去年的年末,曾經得到過長城汽車大力扶持的毫末智行,也傳出了裁員的消息。而若是追溯到2024年的年初,便是圖森未來從美股退市的大新聞——其市值最高時,曾經達到160億美元規模。
在2023年末,國內智駕行業有了所謂“地大華魔”的說法。并且在去年年末的時候,又進一步完善為頭部供應商的“華元魔大地”,外加自研整車廠的“蔚小理極米”之說。
在這個大趨勢下,DeepSeek的崛起如同給這股變革的浪潮注入了強大的動力。在訓練效率方面,經過其優化能進一步縮短推理響應時間。
這意味著在實際的智駕場景中,車輛對于各種復雜路況的判斷和決策速度會大大提高。
例如,當車輛在高速行駛中突然遇到前方有障礙物或者車輛變道時,能夠更迅速地作出反應,避免事故的發生。
另外,在數據標注這個環節,DeepSeek通過其獨特的跨模態遷移能力,有效地降低了訓練過程中對人工數據標注的依賴。
后者看似是對中小廠商的機遇,然而頭部企業憑借自身已經積累的大規模數據,仍然在這個領域形成了一定的壁壘。
例如,頭部企業可能已經擁有了海量的真實路況數據,這些數據經過長時間的積累和整理,包含了各種各樣的駕駛場景,這是中小廠商短期內難以企及的。
通過模型蒸餾這種技術手段,一些廠商有可能實現“彎道追趕”。但是這僅限于那些具有大量自主數據的廠商來說,畢竟對于這行來說,算法的性能不僅僅取決于模型本身,還與數據的質量和數量密切相關。
沒有足夠的自有數據,就很難對模型進行有效地優化和調整,從而導致在算法性能上與其他廠商存在差距。
這種差距在行業競爭日益激烈的今天,可能會進一步被拉大,使得這些廠商在市場競爭中處于更加不利的地位。
既然提到了數據對于當前智駕技術發展的重要性,相信大家也能理解車企直接入場的理由了。
特別是隨著DeepSeek的橫空出世,又進一步降低了門檻。而這種已經呈現大趨勢的發展狀況,進一步沖擊了第三方供應商模式,使得所有未能擠入頭部行列的二線企業面臨出局的風險。
實際上,整個趨勢在2024年就已經啟動,其集中體現在資本和人才的流動上。
據統計,去年在所有投向智駕供應商的融資中,有超過八成流向了上述提到的頭部五強企業。
世人將DeepSeek,視為一場算力的平權運動。然而這場始于2023年,爆發于2024年末,并于不久前廣為人知的技術革新,映射到智能駕駛行業,卻幾乎成為了產業的“陷阱”。
當新架構將訓練成本壓縮到不足頭部企業年度電費支出的零頭時,真正的戰場早已從算法研發轉向數據沉淀。
華為ADS積累的3000萬公里城區道路數據、小鵬汽車構建的3000小時極端天氣場景庫、比亞迪天神之眼系統背后200萬輛車的實時反饋,這些用真金白銀和時間壁壘堆砌的護城河,正在將后發者死死擋在門外。
即便有企業能通過開源框架快速搭建原型系統,缺乏實際道路數據的模型也終究是實驗室里的“電子游戲”。
產研閉環的碾壓優勢,使得博世、大陸等傳統Tier1供應商不得不將業務收縮至執行端,而曾經風光無限的算法公司則陷入是否要賣身甚至是賣身無門的窘境。
站在2025年的門檻回望,智駕行業的終局輪廓已然清晰:這注定是一場屬于數據寡頭的游戲。
當特斯拉宣布FSD北美訂閱成本降至每車99美元,當華為ADS3.0開始向第三方車企開放訂閱,當蔚小理的用戶每天持續貢獻的智駕里程突破八位數,那些曾以“顛覆者”自居的初創企業終于明白,真正的革命從來不會發生在聚光燈下,早已在數據洪流的奔涌中完成了對舊秩序的審判。
留給落伍者的,只剩下資本市場雪崩般的估值重構,以及可以被書寫進商業教科書的全新警示——