小米開源跨域具身大模型MiMo-Embodied，打通自動駕駛與家居智能

諾修雅發(fā)表于2025-11-21 20:02:55

**小米開源跨域具身大模型MiMo-Embodied，打通自動駕駛與家居智能**

11月21日，小米集團正式開源其自主研發(fā)的跨域具身大模型MiMo-Embodied，標志著人工智能技術在自動駕駛與家居智能領域的深度融合邁入新階段。作為業(yè)界首個統(tǒng)一兩大領域核心任務的基座模型，MiMo-Embodied通過創(chuàng)新的架構設計和訓練策略，實現了從家庭場景到道路環(huán)境的全鏈路智能協(xié)同，為未來通用具身智能的發(fā)展提供了重要范式。

**跨域能力重構：打破場景邊界**

MiMo-Embodied的核心突破在于其跨域能力覆蓋。傳統(tǒng)具身智能模型通常局限于單一場景，而該模型通過同步支持具身智能三大任務（可供性推理、任務規(guī)劃、空間理解）與自動駕駛三大關鍵模塊（環(huán)境感知、狀態(tài)預測、駕駛規(guī)劃），構建了全場景智能支撐體系。例如，模型在家庭環(huán)境中對物體功能（如“杯子可用于倒水”）的推理能力，可遷移至自動駕駛中對道路標識（如“紅燈需停車”）的語義理解，顯著提升了復雜場景下的決策效率。

**雙向知識遷移：從家居到道路的智能閉環(huán)**

小米在技術驗證中首次揭示了室內交互與道路決策能力的協(xié)同效應。模型通過共享底層視覺語言表征，實現了兩大領域知識的雙向遷移：家居場景中積累的空間布局理解能力可優(yōu)化自動駕駛的路徑規(guī)劃，而車輛對動態(tài)障礙物的預測經驗則能提升家庭服務機器人的避障效率。這種跨域協(xié)同效應為智能終端的泛化部署提供了新思路，未來或可應用于智能工廠、醫(yī)療護理等更多場景。

**全鏈優(yōu)化保障落地可靠性**

為確保模型在真實環(huán)境中的穩(wěn)定性，MiMo-Embodied采用多階段訓練策略：先通過具身與自動駕駛專用任務學習基礎能力，再引入思維鏈（CoT）推理增強復雜任務分解能力，最終結合強化學習（RL）進行精細調優(yōu)。在29項國際基準測試中，模型全面超越現有開源與閉源方案——具身智能領域刷新17項SOTA記錄，自動駕駛領域突破12項性能瓶頸，其通用視覺語言能力也在多項跨模態(tài)任務中展現顯著優(yōu)勢。

**開源生態(tài)助推行業(yè)創(chuàng)新**

小米同步開放了MiMo-Embodied的完整代碼與部分預訓練權重，開發(fā)者可基于該模型快速構建跨場景智能應用。業(yè)內分析指出，此舉將加速自動駕駛與智能家居的技術融合，推動服務機器人、無人配送等產業(yè)的標準化進程。隨著小米AIoT生態(tài)與造車業(yè)務的深度協(xié)同，MiMo-Embodied或成為連接“人-車-家”智能網絡的核心技術樞紐。

特別聲明：本內容來自用戶發(fā)表，不代表太平洋汽車的觀點和立場。