小米開源跨域具身大模型MiMo-Embodied,打通自動駕駛與家居智能
**小米開源跨域具身大模型MiMo-Embodied,打通自動駕駛與家居智能**
11月21日,小米集團正式開源其自主研發(fā)的跨域具身大模型MiMo-Embodied,標志著人工智能技術(shù)在自動駕駛與家居智能領(lǐng)域的深度融合邁入新階段。作為業(yè)界首個統(tǒng)一兩大領(lǐng)域核心任務(wù)的基座模型,MiMo-Embodied通過創(chuàng)新的架構(gòu)設(shè)計和訓(xùn)練策略,實現(xiàn)了從家庭場景到道路環(huán)境的全鏈路智能協(xié)同,為未來通用具身智能的發(fā)展提供了重要范式。
**跨域能力重構(gòu):打破場景邊界**
MiMo-Embodied的核心突破在于其跨域能力覆蓋。傳統(tǒng)具身智能模型通常局限于單一場景,而該模型通過同步支持具身智能三大任務(wù)(可供性推理、任務(wù)規(guī)劃、空間理解)與自動駕駛?cè)箨P(guān)鍵模塊(環(huán)境感知、狀態(tài)預(yù)測、駕駛規(guī)劃),構(gòu)建了全場景智能支撐體系。例如,模型在家庭環(huán)境中對物體功能(如“杯子可用于倒水”)的推理能力,可遷移至自動駕駛中對道路標識(如“紅燈需停車”)的語義理解,顯著提升了復(fù)雜場景下的決策效率。
**雙向知識遷移:從家居到道路的智能閉環(huán)**
小米在技術(shù)驗證中首次揭示了室內(nèi)交互與道路決策能力的協(xié)同效應(yīng)。模型通過共享底層視覺語言表征,實現(xiàn)了兩大領(lǐng)域知識的雙向遷移:家居場景中積累的空間布局理解能力可優(yōu)化自動駕駛的路徑規(guī)劃,而車輛對動態(tài)障礙物的預(yù)測經(jīng)驗則能提升家庭服務(wù)機器人的避障效率。這種跨域協(xié)同效應(yīng)為智能終端的泛化部署提供了新思路,未來或可應(yīng)用于智能工廠、醫(yī)療護理等更多場景。
**全鏈優(yōu)化保障落地可靠性**
為確保模型在真實環(huán)境中的穩(wěn)定性,MiMo-Embodied采用多階段訓(xùn)練策略:先通過具身與自動駕駛專用任務(wù)學(xué)習(xí)基礎(chǔ)能力,再引入思維鏈(CoT)推理增強復(fù)雜任務(wù)分解能力,最終結(jié)合強化學(xué)習(xí)(RL)進行精細調(diào)優(yōu)。在29項國際基準測試中,模型全面超越現(xiàn)有開源與閉源方案——具身智能領(lǐng)域刷新17項SOTA記錄,自動駕駛領(lǐng)域突破12項性能瓶頸,其通用視覺語言能力也在多項跨模態(tài)任務(wù)中展現(xiàn)顯著優(yōu)勢。
**開源生態(tài)助推行業(yè)創(chuàng)新**
小米同步開放了MiMo-Embodied的完整代碼與部分預(yù)訓(xùn)練權(quán)重,開發(fā)者可基于該模型快速構(gòu)建跨場景智能應(yīng)用。業(yè)內(nèi)分析指出,此舉將加速自動駕駛與智能家居的技術(shù)融合,推動服務(wù)機器人、無人配送等產(chǎn)業(yè)的標準化進程。隨著小米AIoT生態(tài)與造車業(yè)務(wù)的深度協(xié)同,MiMo-Embodied或成為連接“人-車-家”智能網(wǎng)絡(luò)的核心技術(shù)樞紐。
最新問答





