汽車人工智能大會(huì) | 思必馳大模型塑造智能座艙場(chǎng)景大融合
4月17-18日,蓋世汽車2024第二屆汽車人工智能大會(huì)在上海國(guó)際汽車城舉行。大會(huì)圍繞大模型技術(shù)、汽車機(jī)器人、AI智艙等熱點(diǎn)話題展開(kāi)討論,共話AI如何重塑汽車行業(yè)。思必馳智能汽車事業(yè)部高級(jí)產(chǎn)品總監(jiān)曾春華出席會(huì)議并作《思必馳大模型塑造智能座艙場(chǎng)景大融合》的主題分享。
思必馳智能汽車事業(yè)部高級(jí)產(chǎn)品總監(jiān) 曾春華
基于對(duì)話式AI技術(shù) , 不斷升級(jí)基座模型,深入車載語(yǔ)音場(chǎng)景
曾春華表示,思必馳在智能汽車領(lǐng)域已有多年深耕與積累,截止到目前,已合作54家汽車品牌、160款量產(chǎn)車型、累計(jì)上車量超過(guò)1000萬(wàn)。據(jù)蓋世汽車研究院及佐思汽研對(duì)國(guó)內(nèi)語(yǔ)音供應(yīng)商市場(chǎng)搭載量排行統(tǒng)計(jì),思必馳排名前三。
在AI大模型領(lǐng)域,思必馳于2023年7月發(fā)布了針對(duì)垂域的、具有通用智能的行業(yè)語(yǔ)言大模型DFM-2,并針對(duì)通用模型事實(shí)不準(zhǔn)、私域知識(shí)無(wú)法包含、專用領(lǐng)域理解性能不足等問(wèn)題進(jìn)行了一系列技術(shù)改造,形成DFM-2行業(yè)大模型,具備場(chǎng)景專業(yè)化、模型專用化、體驗(yàn)專精化三大特點(diǎn)。
DFM-2大模型通過(guò)與思必馳語(yǔ)言計(jì)算平臺(tái)DUI 2.0相結(jié)合,基于對(duì)話式AI技術(shù)不斷升級(jí)基座模型,深入車載語(yǔ)音場(chǎng)景,重構(gòu)車載語(yǔ)音交互能力。目前,思必馳DFM-2大模型不僅成為江蘇省首個(gè)完成雙備案的行業(yè)大模型,更與多家車企達(dá)成合作,實(shí)現(xiàn)在汽車領(lǐng)域量產(chǎn)落地。
以融合架構(gòu)為核心的“中樞大模型”解決方案
縱觀國(guó)內(nèi)大模型市場(chǎng),截止到2024年第一季度,國(guó)內(nèi)共發(fā)布了243個(gè)人工智能大模型,AI大模型領(lǐng)域可謂百花齊放。思必馳在與車企合作伙伴的溝通中了解到,由于不同的大模型各有所長(zhǎng),車企伙伴在選擇大模型的時(shí)候往往難以取舍,不同的大模型之間也存在一定的融合難度。
針對(duì)市面上單點(diǎn)模型“孤島化”、無(wú)法與座艙深度融合的情況,思必馳基于自研全鏈路智能語(yǔ)音語(yǔ)言交互技術(shù)、DFM大模型以及大數(shù)據(jù)構(gòu)建“中樞大模型”架構(gòu),打造“1+ N”模式,即“1”個(gè)百模中臺(tái)(中樞大模型)與“N”個(gè)專業(yè)大模型組合上車,打通前端語(yǔ)言處理、用車場(chǎng)景與后端模型生態(tài),形成車載垂域的生態(tài)圈,使車載AI體驗(yàn)從“語(yǔ)音指令”邁向“語(yǔ)言智能”+“工具智能”。
思必馳“中樞大模型”方案改變了單一大模型模式,升級(jí)為以中樞大模型為底座的多模型融合車載Agent框架,支持端側(cè)與云側(cè)分布式部署、支持解耦,便于后續(xù)輕量化升級(jí)。通過(guò)新的大模型云端框架,可支持垂域模型實(shí)現(xiàn)插拔式靈活升級(jí),打造更加開(kāi)放的垂域生態(tài)。
通過(guò)對(duì)出行高頻應(yīng)用場(chǎng)景進(jìn)行分析,思必馳發(fā)現(xiàn)座艙用戶的語(yǔ)音請(qǐng)求主要集中在導(dǎo)航、車控、多媒體等場(chǎng)景。曾春華表示,大模型的賦能需圍繞用戶需求,基于用戶的高頻使用場(chǎng)景有的放矢。為此,思必馳中樞大模型方案將以全面賦能出行最高頻應(yīng)用場(chǎng)景為目標(biāo),通過(guò)融合大模型的方式對(duì)智能座艙語(yǔ)音交互全技能、全場(chǎng)景進(jìn)行重構(gòu)升級(jí)。
目前,基于多模融合大模型方案打造的天琴語(yǔ)音助手7.0版本已可實(shí)現(xiàn)多人設(shè)自由切換、大模型行程規(guī)劃、跨域上下文意圖理解、一句話百變壁紙等多個(gè)首創(chuàng)式落地應(yīng)用。全域端到端速度以及多輪對(duì)話語(yǔ)音合成速度均可控制在3s以內(nèi),引領(lǐng)行業(yè)標(biāo)準(zhǔn)。與此同時(shí),拒識(shí)+響應(yīng)的整體準(zhǔn)確率在92.7%,其中非閑聊類準(zhǔn)確率可達(dá)98%以上,大大降低用戶閑聊聲音對(duì)座艙交互的影響,讓用戶感受更加自由自在的座艙語(yǔ)音交互體驗(yàn)。
從2022年思必馳DFM-1大模型應(yīng)用,在智能汽車領(lǐng)域打造了基于限定任務(wù)的規(guī)則對(duì)話、全時(shí)全雙工對(duì)話、全場(chǎng)景可見(jiàn)即可說(shuō)、多路同時(shí)交互等經(jīng)典應(yīng)用;到2024年基于多模融合大模型方案的天琴語(yǔ)音助手7.0版本的推出,思必馳從未停止在智能汽車領(lǐng)域的研發(fā)與創(chuàng)新的腳步。曾春華表示,未來(lái),隨著DFM-3多模融合大模型的發(fā)展,多模態(tài)跨領(lǐng)域交互、類人交互,以及終端車載家庭互聯(lián)場(chǎng)景融合的時(shí)代終將到來(lái),“大模型+大融合”將重新定義人機(jī)交互。
>>點(diǎn)擊查看今日優(yōu)惠<<