亚欧洲精品在线视频免费观看,国产成人精品本亚洲,校园春色综合网,国产91极品福利手机观看,99久久99久久精品国产片果冻,亚洲精品911,91视频一88av

“有事兒直說”體驗(yàn)科大訊飛3.5版助手

2025-02-19 01:59:23 作者:資訊小編

本屆廣州車展期間,科大訊飛展出了其最新版本的3.5語音交互助手:科大訊飛智能語音助手3.5。據(jù)悉,該版本顯著提升了系統(tǒng)降噪和交互體驗(yàn)。簡而言之,它可以讓你與車和機(jī)器之間的對話和互動體驗(yàn)更加接地氣,而不是像以前那樣“相互適應(yīng)”“相互包容”。它的實(shí)際表現(xiàn)如何?我們在車?yán)镎劙桑?/p>

識別/降噪

說到語音識別,識別、定位和理解在我看來是最核心也是最關(guān)鍵的體驗(yàn)。如果這三個步驟都做不好,就更不用說下面的擴(kuò)展了。汽車的行駛環(huán)境非常復(fù)雜,包括輪胎噪聲、風(fēng)噪聲、發(fā)動機(jī)噪聲、空音調(diào)噪聲和人聲干擾。這些噪聲會隨著說話人的有效音頻一起被發(fā)送到語音識別系統(tǒng),嚴(yán)重影響識別效果,因此需要降低噪聲。

這次3.5版本采用的窄波束技術(shù)就是為了解決這個問題而誕生的。通過將兩個麥克風(fēng)信號輸入麥克風(fēng)模塊,并預(yù)先預(yù)設(shè)其有效區(qū)域,只拾取有效區(qū)域內(nèi)的聲音,同時抑制噪聲,同時抑制非有效區(qū)域內(nèi)說話人的聲音和環(huán)境噪聲,從而提高有效區(qū)域內(nèi)的清晰度,降低有效區(qū)域外的噪聲和環(huán)境影響。怎么樣,聽起來和主動降噪耳機(jī)有點(diǎn)不一樣嗎?

此外,結(jié)合相應(yīng)的降噪技術(shù),3.5版本還實(shí)現(xiàn)了更精準(zhǔn)的控制,支持前排駕駛員和副駕駛操作,誰醒了誰說了算,比如副駕駛醒了,那么后續(xù)對話僅限于車與副駕駛之間,副駕駛中斷?沒用!并且不同喚醒位置對應(yīng)的功能也不同,從而達(dá)到不同的需求。

喚醒詞

喚醒詞有哪些場景讓你印象深刻?當(dāng)著我媽的面在屏幕前喊XXX,結(jié)果是一副驚呆的表情?不管你想做什么,你都要喊你好。對于喚醒詞,3.5版本也有自己的改動。一句話,可以直接說點(diǎn)什么!

在3.5版本中,你只需要喚醒系統(tǒng)一次,就可以繼續(xù)對它大吼一段時間,這樣就不用說你好XX,你好XX了,就這么絮叨吧。值得一提的是,短期免喚醒支持全場景模式,可在云端或本地離線環(huán)境下運(yùn)行。這個設(shè)計(jì)的初衷很簡單:它讓你感覺更像是在和一個人說話,而不是冰冷的機(jī)器。

另外,在3.5版本中,你還是可以叫它的,不需要說hello XXX兩個字以上就可以叫醒它,直接說hello!“XXX幫我打開車窗”“XXX在車?yán)锾珶崃恕薄癤XX彈了一首歌……”感覺輕松多了嗎?

語境理解

在語音交互中,很多時候我們會有潛在的需求,而不僅僅是讓系統(tǒng)一句一句地為你服務(wù),比如天氣、行程或者就餐等。3.5版本為我們提供了更流暢的“對話可能性”。第一次語音交互完成后,可以繼續(xù)進(jìn)行下一步的提問或請求,以及人與人的對話:之前提到或涉及到的事情,往往會成為后續(xù)對話中需要參考的具體術(shù)語。

明天北京的天氣怎么樣?→“有去那里的火車票嗎?”?→“給我訂一個”。3.5版本的語音系統(tǒng)會記錄語音對話的歷史,并根據(jù)后續(xù)的引用或缺失的信息對歷史信息進(jìn)行關(guān)聯(lián)和完善,使整個對話具有深厚的歷史邏輯。這是什么目的?每個人都有記憶,對吧?

多輪互動/所見即所得

即使在語音交互時代,也不是所有的操作都能一步到位。這時,你需要與車機(jī)進(jìn)行多輪交互和確認(rèn)。在3.5版本中,多輪交互變得更加流暢,可以像和朋友聊天一樣直接一步一步確認(rèn),整個過程可以隨時中斷。只要看到想要的結(jié)果或者需求,隨時可以來回,直接說就行了,不需要額外的操作和廢話。

你看到的是你得到的,也是基于上述結(jié)構(gòu)的服務(wù)。在交互中,你經(jīng)常需要過濾掉很多類似的結(jié)果,尤其是電話號碼或者道路。你不用說哪些,甚至可以說“尾號135的那個”、“尾號7907的那個”。“選擇路怒”的患者現(xiàn)在可以鼓掌了!

一次性信息點(diǎn)交互

最后我們再來看看這個3.5版本的另一個“實(shí)用技巧”:跨場景的信息點(diǎn)交互,聽起來很費(fèi)力?你可以理解為:支持你基于POI位置信息進(jìn)行各種混合形式的交互,比如:我在哪里?→現(xiàn)在這條街是什么?→如何到達(dá)下一個路口?

還是泰豐大廈附近有韓國燒烤?出門要帶傘嗎?→最近污染嚴(yán)重嗎?→最近的洗車場在哪里?→這附近有吃的嗎?

你也可以這樣做:最近北京的天氣怎么樣?→我想去那邊的歡樂谷?!浇械胤娇梢宰∷迒??

總結(jié):越來越個人化。

從當(dāng)年的多媒體大屏到如今的車載電腦互聯(lián),這塊屏幕的角度和屬性也隨著硬件快速迭代變化。隨著自然語義和云技術(shù)的介入,我們越來越希望眼前的這個屏幕不只是一臺只會用條目敷衍你的機(jī)器。要是一個人就好了。

顯然,在3.5版本的體驗(yàn)中,科大訊飛給了我們想要看到的答案,或者說趨勢和方向。來自源頭的干預(yù)是3.5版本助手的核心。識別能力和降噪能力的大幅提升,直接提升了它對你的感知。借助云技術(shù),3.5版本還實(shí)現(xiàn)了對上下文的理解、多輪對話以及POI信息的全面交互等。雖然我們在人機(jī)交互的道路上還有很長的路要走,但至少在今天,你終于愿意和它進(jìn)行交互了。

>>點(diǎn)擊查看今日優(yōu)惠<<

    本文導(dǎo)航
    熱門文章
    TOP推薦
    相關(guān)閱讀
    點(diǎn)擊加載更多