特斯拉AI負(fù)責(zé)人揭秘FSD端到端方法論
10 月 25 日,特斯拉 AI 軟件副總裁阿肖克·埃盧斯瓦米在 X 上發(fā)布長(zhǎng)文,揭秘 FSD 端到端方法論,引發(fā)廣泛關(guān)注。
特斯拉采用端到端神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)自動(dòng)駕駛,此網(wǎng)絡(luò)接收多攝像頭像素、車輛運(yùn)動(dòng)學(xué)信號(hào)、音頻、地圖及導(dǎo)航信息,直接輸出駕駛指令。與傳統(tǒng)模塊化方法相比,優(yōu)勢(shì)明顯。傳統(tǒng)方法將感知、預(yù)測(cè)、規(guī)劃拆分,接口復(fù)雜且難優(yōu)化;端到端模型一步到位,能整體優(yōu)化。比如面對(duì)“是碾過水坑還是借道逆行”的情況,經(jīng)大量數(shù)據(jù)訓(xùn)練的 AI 能做出更合理決策。
不過,構(gòu)建端到端架構(gòu)面臨諸多挑戰(zhàn)。首先是數(shù)據(jù)處理,F(xiàn)SD 每秒要處理來自攝像頭、地圖、音頻等約 20 億個(gè)輸入信息,最終壓縮成轉(zhuǎn)向和加速 2 個(gè)指令。特斯拉憑借龐大車隊(duì),每日產(chǎn)生相當(dāng)于 500 年駕駛時(shí)長(zhǎng)的里程數(shù)據(jù),經(jīng)篩選提取有價(jià)值樣本,讓 AI 學(xué)習(xí)極端案例,如雨天路滑時(shí)提前 5 秒減速。
可解釋性與安全保證也是問題。調(diào)試端到端系統(tǒng)困難,為此特斯拉開發(fā)多項(xiàng)技術(shù)。生成式高斯濺射技術(shù),運(yùn)行時(shí)間約 220 毫秒,能生成高質(zhì)量 3D 幾何結(jié)構(gòu),輔助理解 AI 決策依據(jù);小型版本的推理模型在 FSD v14.x 版本運(yùn)行,結(jié)合視頻溯源,可用自然語言推理。
評(píng)估同樣是挑戰(zhàn)。特斯拉開發(fā)神經(jīng)世界模擬器,基于海量真實(shí)數(shù)據(jù)訓(xùn)練,能實(shí)時(shí)生成含 8 個(gè)攝像頭畫面的虛擬駕駛環(huán)境,可復(fù)現(xiàn)歷史事故、創(chuàng)造極端測(cè)試條件,對(duì) FSD 進(jìn)行壓力測(cè)試,還能調(diào)整計(jì)算資源實(shí)現(xiàn)每秒 24 幀高分辨率傳感器數(shù)據(jù)合成。
值得一提的是,特斯拉的這些技術(shù)不僅用于自動(dòng)駕駛,還能遷移到人形機(jī)器人擎天柱上。這一創(chuàng)新是否引領(lǐng)自動(dòng)駕駛潮流,又將如何影響未來,令人期待。
最新問答





