奇瑞的多媒體系統(tǒng)用起來(lái)不用動(dòng)手?
說(shuō)到車(chē)載多媒體系統(tǒng)的語(yǔ)音識(shí)別功能,我想大部分用戶(hù)都會(huì)覺(jué)得很尷尬。難怪目前車(chē)載多媒體系統(tǒng)的語(yǔ)音識(shí)別功能大多只停留在語(yǔ)音指令識(shí)別階段。使用車(chē)載多媒體系統(tǒng)時(shí),用戶(hù)必須通過(guò)按鍵啟動(dòng)語(yǔ)音識(shí)別程序,然后說(shuō)出命令,命令的發(fā)音和詞匯必須準(zhǔn)確,否則識(shí)別效果差,無(wú)法獲得更好的用戶(hù)體驗(yàn)。為了讓奇瑞用戶(hù)更方便、更好地使用語(yǔ)音識(shí)別功能,聯(lián)合國(guó)語(yǔ)音識(shí)別技術(shù)領(lǐng)導(dǎo)者科大訊飛研發(fā)了Cloudrive2.0智能云互聯(lián)駕駛系統(tǒng)。該系統(tǒng)的自然語(yǔ)言處理技術(shù)讓用戶(hù)只需通過(guò)口說(shuō)就可以操作多媒體系統(tǒng)的大部分常用功能,識(shí)別率可達(dá)90%以上。讓我們來(lái)看看這個(gè)多媒體系統(tǒng)有多有用。
科大訊飛到底是誰(shuí)?
科大訊飛,由中國(guó)科學(xué)技術(shù)大學(xué)優(yōu)秀博士生劉慶峰于2021年創(chuàng)立,是一家專(zhuān)門(mén)從事語(yǔ)音技術(shù)研發(fā)的公司。語(yǔ)音技術(shù)包括語(yǔ)音合成技術(shù)和語(yǔ)音識(shí)別技術(shù)。讓機(jī)器說(shuō)話(huà),使用語(yǔ)音合成技術(shù);讓機(jī)器理解人的語(yǔ)音,利用語(yǔ)音識(shí)別技術(shù)。成立17年來(lái),科大訊飛一直從事語(yǔ)音相關(guān)領(lǐng)域的研究,積累了豐富的經(jīng)驗(yàn)。公司的技術(shù)實(shí)力也通過(guò)多年在語(yǔ)音技術(shù)領(lǐng)域獲得國(guó)內(nèi)外獎(jiǎng)項(xiàng)得到了證明。
2010年,當(dāng)科大訊飛推出“訊飛語(yǔ)音云”技術(shù)時(shí),科大訊飛進(jìn)入了普通大眾的視野。這項(xiàng)技術(shù)可以為很多互聯(lián)網(wǎng)應(yīng)用提供實(shí)時(shí)語(yǔ)音識(shí)別支持,例如,QQ、短信、微博等內(nèi)容都可以通過(guò)語(yǔ)音輸入。識(shí)別率高,使用方便,在業(yè)界引起了不小的波瀾。
今年10月18日,羅永浩在錘子M1/M1L系列手機(jī)發(fā)布會(huì)上宣布,這兩款產(chǎn)品將支持訊飛語(yǔ)音輸入法,識(shí)別率達(dá)到97%,基本解決了移動(dòng)設(shè)備的語(yǔ)音輸入問(wèn)題。
在訊飛語(yǔ)音輸入法的演示中,羅永浩以很快的速度進(jìn)行了隨機(jī)語(yǔ)音輸入,手機(jī)屏幕立刻生成了準(zhǔn)確的文字信息。這瞬間讓科大訊飛成為了新錘子產(chǎn)品發(fā)布會(huì)的主角,也讓此前默默無(wú)聞的科技企業(yè)科大訊飛一夜之間成為“線(xiàn)上名人”。
●是什么催生了具有強(qiáng)大語(yǔ)音識(shí)別功能的多媒體系統(tǒng)?
我想用過(guò)老式語(yǔ)音識(shí)別系統(tǒng)的朋友會(huì)抱怨識(shí)別率低。除非你用的是發(fā)音清晰、聲音圓潤(rùn)的標(biāo)準(zhǔn)普通話(huà),語(yǔ)速不能太快也不能太慢,否則就是“日常”。開(kāi)發(fā)人員和用戶(hù)都知道問(wèn)題出在哪里,但是兼容不同地區(qū)用戶(hù)口音的差異,讓計(jì)算機(jī)“讀懂”人類(lèi)平時(shí)說(shuō)的自然語(yǔ)言,最終提高識(shí)別率,有多容易呢?科大訊飛用了17年的時(shí)間積累技術(shù),最終實(shí)現(xiàn)了改革,使機(jī)器更好地識(shí)別自然語(yǔ)音,識(shí)別率提高到97%。
同樣促成這一變化的還有性能更強(qiáng)、集成度更高的電腦芯片,它可以讓具有復(fù)雜語(yǔ)音識(shí)別功能的車(chē)載多媒體系統(tǒng)小到可以安裝在汽車(chē)中控臺(tái)內(nèi)部,同時(shí)強(qiáng)大的計(jì)算能力可以讓語(yǔ)音識(shí)別的等待時(shí)間達(dá)到普通用戶(hù)可以接受的水平。
4G網(wǎng)絡(luò)的普及也是變革過(guò)程背后的驅(qū)動(dòng)力。通過(guò)4G網(wǎng)絡(luò),語(yǔ)音識(shí)別系統(tǒng)可以隨時(shí)更新語(yǔ)音庫(kù),當(dāng)本地出現(xiàn)無(wú)法識(shí)別的單詞時(shí),可以通過(guò)云服務(wù)器進(jìn)行識(shí)別,保證語(yǔ)音識(shí)別系統(tǒng)能夠識(shí)別出目前最新的單詞。
●不僅僅是在多媒體系統(tǒng)上安裝一個(gè)“牛逼”的語(yǔ)音識(shí)別軟件那么簡(jiǎn)單。
屏幕前,你可能以為奇瑞的Cloudrive2.0智云互聯(lián)駕駛系統(tǒng)只是在普通的多媒體系統(tǒng)中安裝了一個(gè)“牛逼”的語(yǔ)音識(shí)別軟件。全濕了。實(shí)驗(yàn)室里識(shí)別率97%的語(yǔ)音識(shí)別系統(tǒng)應(yīng)用到高速公路上行駛的汽車(chē)上,識(shí)別率可能會(huì)下降到50%甚至更低。因?yàn)轱L(fēng)噪、胎噪等噪聲會(huì)極大影響語(yǔ)音識(shí)別率。
為了滿(mǎn)足奇瑞的高要求,科大訊飛作為多媒體系統(tǒng)的提供商,必須對(duì)整個(gè)系統(tǒng)的硬件進(jìn)行各種耐久性測(cè)試,以確保系統(tǒng)在不同的溫度和振動(dòng)環(huán)境下具有良好的穩(wěn)定性。
●語(yǔ)音識(shí)別與車(chē)載應(yīng)用的互聯(lián)互通,給用戶(hù)帶來(lái)了便利。
車(chē)載多媒體系統(tǒng)空的語(yǔ)音識(shí)別率很高,但是如果不能實(shí)現(xiàn)任何功能也沒(méi)用。科大訊飛通過(guò)入股地圖引擎公司——美星科技,獲取了豐富準(zhǔn)確的地圖信息和數(shù)千萬(wàn)的興趣點(diǎn)信息。通過(guò)開(kāi)啟語(yǔ)音識(shí)別和導(dǎo)航系統(tǒng),多媒體系統(tǒng)可以通過(guò)說(shuō)“我想吃火鍋”來(lái)自動(dòng)找到導(dǎo)航目的地,然后通過(guò)語(yǔ)音確定目的地就可以輕松實(shí)現(xiàn)導(dǎo)航。
目前,科大訊飛已與30多家內(nèi)容提供商合作,熟悉的喜馬拉雅FM、網(wǎng)易新聞、大眾點(diǎn)評(píng)、美團(tuán)等應(yīng)用均可與科大訊飛的車(chē)載多媒體系統(tǒng)互聯(lián),以最簡(jiǎn)單、最直接的方式實(shí)現(xiàn)語(yǔ)音操作。
●科大訊飛的理想——實(shí)現(xiàn)人與機(jī)器的無(wú)障礙交流。
科大訊飛成功開(kāi)發(fā)了一套名為AIUI的人工智能交互界面。通過(guò)融合雙工技術(shù)、麥克風(fēng)陣列技術(shù)、聲紋識(shí)別技術(shù)、方言識(shí)別、語(yǔ)義理解技術(shù)和內(nèi)容服務(wù),人機(jī)交流可以像人與人之間的交流一樣輕松。
●真的好用嗎?試著去了解。
在實(shí)際介紹試用流程之前,我們先來(lái)介紹一下這個(gè)系統(tǒng)目前在科大訊飛奇瑞的裝車(chē)情況。搭載Cloudrive2.0智能云互聯(lián)驅(qū)動(dòng)系統(tǒng)的首款車(chē)型是今年3月上市的奇瑞Ariza 5,搭載相同系統(tǒng)的奇瑞Tiggo 3X也將于11月15日正式上市。新車(chē)將提供一年的免費(fèi)流量,以支持多媒體系統(tǒng)上的各種車(chē)載應(yīng)用。如果流量超過(guò),也可以通過(guò)銀聯(lián)、微信、支付寶等支付平臺(tái)掃碼支付流量。價(jià)格10元100MB。按照目前用戶(hù)的使用情況,大部分用戶(hù)的月流量不會(huì)超過(guò)500MB。
以下視頻演示了奇瑞Tiggo 3X多媒體系統(tǒng)的語(yǔ)音識(shí)別功能。從視頻演示中我們可以看到,測(cè)試人員可以以正常甚至略快的語(yǔ)速輸入自然語(yǔ)言語(yǔ)音,甚至可以中斷系統(tǒng)正在播放的語(yǔ)音來(lái)輸入語(yǔ)音命令。語(yǔ)音識(shí)別率高,導(dǎo)航、音樂(lè)播放、電話(huà)測(cè)試等功能不需要用戶(hù)按鍵或觸摸屏幕,實(shí)現(xiàn)了多媒體系統(tǒng)的操作體驗(yàn)。
更多精彩視頻可在視頻頻道“奇瑞Cloudrive2.0智云互聯(lián)駕駛系統(tǒng)語(yǔ)音識(shí)別演示”中找到
據(jù)現(xiàn)場(chǎng)技術(shù)人員介紹,奇瑞Cloudrive2.0智云互聯(lián)駕駛系統(tǒng)應(yīng)用的語(yǔ)音識(shí)別功能不包含方言識(shí)別,但對(duì)于帶有方言口音的普通話(huà)可以達(dá)到較高的識(shí)別率。
全文摘要:
科大訊飛的語(yǔ)音識(shí)別技術(shù)確實(shí)走在世界前列。奇瑞Cloudrive2.0智云互聯(lián)駕駛系統(tǒng)的語(yǔ)音識(shí)別功能在自然語(yǔ)言識(shí)別率方面已經(jīng)達(dá)到了很高的水平,一些常用的功能基本上可以通過(guò)語(yǔ)音人機(jī)交互實(shí)現(xiàn)1-2次,大大提高了使用的便利性。駕駛員不用看屏幕,也不用按按鈕,就能實(shí)現(xiàn)各種多媒體系統(tǒng)功能,更能用心觀察路況,提高行車(chē)安全性。
通過(guò)技術(shù)整合,科大訊飛完成了從語(yǔ)音技術(shù)提供商到語(yǔ)音服務(wù)提供商的轉(zhuǎn)型。科大訊飛提供的車(chē)載多媒體系統(tǒng)配備了國(guó)際領(lǐng)先的語(yǔ)音識(shí)別系統(tǒng),體驗(yàn)水平很高。相比蘋(píng)果CarPlay功能的語(yǔ)音識(shí)別,由于科大訊飛與車(chē)企的深度合作,其多媒體系統(tǒng)可以實(shí)現(xiàn)與汽車(chē)更深層次的互聯(lián),未來(lái)還可以通過(guò)語(yǔ)音實(shí)現(xiàn)控制車(chē)內(nèi)燈光開(kāi)關(guān)、調(diào)節(jié)空音調(diào)等多種功能。作為科大訊飛的合作伙伴,奇瑞也有望成為首批在科大訊飛安裝下一代多媒體系統(tǒng)的廠(chǎng)商之一。更先進(jìn)的AIUI將使其多媒體系統(tǒng)體驗(yàn)上升到更高的水平,值得期待。
>>點(diǎn)擊查看今日優(yōu)惠<<
-
1直降5萬(wàn)元 全新寶馬X3長(zhǎng)軸距版售34.99萬(wàn)起 軸距2975mm/動(dòng)力提升
- 2限時(shí)售20.98萬(wàn)起 傳祺E8 Pro+上市 搭載2.0L插混/續(xù)航1200km
- 3吉利銀河翼真L380陸地空客系列官圖發(fā)布 將于2月下旬開(kāi)啟預(yù)售
- 4售價(jià)12.99-15.99萬(wàn)元 捷途自由者開(kāi)啟預(yù)售
- 5東風(fēng)納米06預(yù)告官圖發(fā)布 或搭載大疆智駕?
- 6與DeepSeek深度融合 領(lǐng)克900將于今年二季度上市
- 7大空間側(cè)滑門(mén)+純電201km續(xù)航 五菱之光EV上市 售4.78萬(wàn)元起
- 8全新嵐圖夢(mèng)想家新車(chē)色發(fā)布 全系搭載華為高階智駕
TOP推薦相關(guān)閱讀點(diǎn)擊加載更多熱門(mén)搜索 熱門(mén)IT產(chǎn)品 最新車(chē)系 - 2限時(shí)售20.98萬(wàn)起 傳祺E8 Pro+上市 搭載2.0L插混/續(xù)航1200km