小米開(kāi)源跨域具身大模型MiMo-Embodied,打通自動(dòng)駕駛與家居智能
**小米開(kāi)源跨域具身大模型MiMo-Embodied,打通自動(dòng)駕駛與家居智能**
11月21日,小米集團(tuán)正式開(kāi)源其自主研發(fā)的跨域具身大模型MiMo-Embodied,標(biāo)志著人工智能技術(shù)在自動(dòng)駕駛與家居智能領(lǐng)域的深度融合邁入新階段。作為業(yè)界首個(gè)統(tǒng)一兩大領(lǐng)域核心任務(wù)的基座模型,MiMo-Embodied通過(guò)創(chuàng)新的架構(gòu)設(shè)計(jì)和訓(xùn)練策略,實(shí)現(xiàn)了從家庭場(chǎng)景到道路環(huán)境的全鏈路智能協(xié)同,為未來(lái)通用具身智能的發(fā)展提供了重要范式。
**跨域能力重構(gòu):打破場(chǎng)景邊界**
MiMo-Embodied的核心突破在于其跨域能力覆蓋。傳統(tǒng)具身智能模型通常局限于單一場(chǎng)景,而該模型通過(guò)同步支持具身智能三大任務(wù)(可供性推理、任務(wù)規(guī)劃、空間理解)與自動(dòng)駕駛?cè)箨P(guān)鍵模塊(環(huán)境感知、狀態(tài)預(yù)測(cè)、駕駛規(guī)劃),構(gòu)建了全場(chǎng)景智能支撐體系。例如,模型在家庭環(huán)境中對(duì)物體功能(如“杯子可用于倒水”)的推理能力,可遷移至自動(dòng)駕駛中對(duì)道路標(biāo)識(shí)(如“紅燈需停車”)的語(yǔ)義理解,顯著提升了復(fù)雜場(chǎng)景下的決策效率。
**雙向知識(shí)遷移:從家居到道路的智能閉環(huán)**
小米在技術(shù)驗(yàn)證中首次揭示了室內(nèi)交互與道路決策能力的協(xié)同效應(yīng)。模型通過(guò)共享底層視覺(jué)語(yǔ)言表征,實(shí)現(xiàn)了兩大領(lǐng)域知識(shí)的雙向遷移:家居場(chǎng)景中積累的空間布局理解能力可優(yōu)化自動(dòng)駕駛的路徑規(guī)劃,而車輛對(duì)動(dòng)態(tài)障礙物的預(yù)測(cè)經(jīng)驗(yàn)則能提升家庭服務(wù)機(jī)器人的避障效率。這種跨域協(xié)同效應(yīng)為智能終端的泛化部署提供了新思路,未來(lái)或可應(yīng)用于智能工廠、醫(yī)療護(hù)理等更多場(chǎng)景。
**全鏈優(yōu)化保障落地可靠性**
為確保模型在真實(shí)環(huán)境中的穩(wěn)定性,MiMo-Embodied采用多階段訓(xùn)練策略:先通過(guò)具身與自動(dòng)駕駛專用任務(wù)學(xué)習(xí)基礎(chǔ)能力,再引入思維鏈(CoT)推理增強(qiáng)復(fù)雜任務(wù)分解能力,最終結(jié)合強(qiáng)化學(xué)習(xí)(RL)進(jìn)行精細(xì)調(diào)優(yōu)。在29項(xiàng)國(guó)際基準(zhǔn)測(cè)試中,模型全面超越現(xiàn)有開(kāi)源與閉源方案——具身智能領(lǐng)域刷新17項(xiàng)SOTA記錄,自動(dòng)駕駛領(lǐng)域突破12項(xiàng)性能瓶頸,其通用視覺(jué)語(yǔ)言能力也在多項(xiàng)跨模態(tài)任務(wù)中展現(xiàn)顯著優(yōu)勢(shì)。
**開(kāi)源生態(tài)助推行業(yè)創(chuàng)新**
小米同步開(kāi)放了MiMo-Embodied的完整代碼與部分預(yù)訓(xùn)練權(quán)重,開(kāi)發(fā)者可基于該模型快速構(gòu)建跨場(chǎng)景智能應(yīng)用。業(yè)內(nèi)分析指出,此舉將加速自動(dòng)駕駛與智能家居的技術(shù)融合,推動(dòng)服務(wù)機(jī)器人、無(wú)人配送等產(chǎn)業(yè)的標(biāo)準(zhǔn)化進(jìn)程。隨著小米AIoT生態(tài)與造車業(yè)務(wù)的深度協(xié)同,MiMo-Embodied或成為連接“人-車-家”智能網(wǎng)絡(luò)的核心技術(shù)樞紐。
最新問(wèn)答





