"里維安重磅推出VLA大模型,自動駕駛邁入'思維鏈'新時代"
**里維安重磅推出VLA大模型,自動駕駛邁入“思維鏈”新時代**
在自動駕駛技術(shù)經(jīng)歷規(guī)則驅(qū)動與端到端迭代后,行業(yè)正迎來一場由“思維鏈”引發(fā)的范式革命。2025年12月,里維安(RIVIAN)正式發(fā)布其Vision-Language-Action(VLA)駕駛大模型,通過模擬人類“觀察-推理-決策”的認知鏈條,首次讓機器具備類人的駕駛邏輯與泛化能力。這一突破不僅解決了傳統(tǒng)模塊化系統(tǒng)的長尾場景瓶頸,更將自動駕駛技術(shù)推向“主動思考”的新高度。
**從“條件反射”到“因果推理”的技術(shù)躍遷**
傳統(tǒng)自動駕駛系統(tǒng)依賴分層模塊的串聯(lián),感知、預測、規(guī)劃環(huán)節(jié)的信息衰減導致系統(tǒng)難以應(yīng)對突發(fā)狀況。而里維安VLA大模型通過多模態(tài)統(tǒng)一架構(gòu),將視覺輸入、語言語義與動作輸出編碼至同一空間,形成閉環(huán)的思維鏈條。例如,面對潮汐車道時,VLA能解析道路標志文本、結(jié)合實時車流狀態(tài),像人類司機一樣判斷車道是否可用,并通過轉(zhuǎn)向燈與其他車輛交互,最終完成變道。這種“理解-交互-執(zhí)行”的一體化流程,顯著提升了復雜場景的通過率。
**“快慢思考”雙系統(tǒng):效率與安全的平衡術(shù)**
里維安VLA的創(chuàng)新性在于其“快慢思考”雙模式設(shè)計?!翱焖伎肌蓖ㄟ^Action Token直接輸出基礎(chǔ)操控指令,確保實時響應(yīng);而“慢思考”則啟動精簡版思維鏈(CoT),模擬人類“邊駕駛邊規(guī)劃”的行為。例如,當檢測到前方有自行車突然變道時,“慢系統(tǒng)”會生成多條虛擬軌跡,動態(tài)評估風險后選擇最優(yōu)路徑。這種機制使MPI(每干預里程數(shù))較傳統(tǒng)端到端模型提升超40%,尤其在無保護左轉(zhuǎn)、施工路段等場景中表現(xiàn)突出。
**強化學習:用“人類標準”訓練AI司機**
為讓VLA更貼近真實駕駛習慣,里維安采用強化學習框架,以人類舒適度與合規(guī)性作為評價標準。模型在訓練中會因急剎或壓線被扣分,而平順的加減速和預判性變道則獲得獎勵。這種“以終為始”的訓練邏輯,使VLA逐漸掌握老司機的隱性經(jīng)驗,例如通過前車剎車燈亮度預判減速幅度,或根據(jù)天氣調(diào)整跟車距離。
**開源生態(tài)與行業(yè)協(xié)同**
值得關(guān)注的是,里維安宣布將部分VLA底層技術(shù)開源,推動行業(yè)共建“因果鏈”數(shù)據(jù)集(Chain of Causation)。此類數(shù)據(jù)不僅記錄車輛動作,更標注決策依據(jù)(如“因左側(cè)卡車盲區(qū)而延遲變道”),為行業(yè)提供可解釋的AI訓練范本。分析師指出,VLA的開放或加速L4級自動駕駛落地,尤其在貨運、共享出行等高頻長尾場景中潛力顯著。
隨著VLA大模型的普及,自動駕駛技術(shù)正從“機械執(zhí)行”邁向“認知智能”時代。里維安此次突破,不僅重新定義了“機器如何開車”,更揭示了AI與人類思維融合的無限可能。
最新問答




