微軟展示詭異的Silent Voice無(wú)聲語(yǔ)音通信技術(shù)演示
編輯:xiaoling
閱讀:13
時(shí)間:2018-10-30 11:56:03
微軟致力于開(kāi)發(fā)一種新的語(yǔ)音輸入接口,允許用戶在沒(méi)有聲音出現(xiàn)的情況下進(jìn)行說(shuō)話和錄音。該研究由微軟研究院進(jìn)行,并在ACM CHI 2018中進(jìn)行了介紹。這種技術(shù)被稱為SilentVoice通過(guò)錄制呼吸時(shí)發(fā)出的聲音來(lái)實(shí)現(xiàn)通信,這種允許類似耳語(yǔ)的聲音就足夠讓麥克風(fēng)錄制語(yǔ)音而不會(huì)打擾周圍的人。此外,該模塊還將過(guò)濾周圍的語(yǔ)音,因此即使有外界干擾,用戶也可以捕獲清晰的語(yǔ)音。
通過(guò)測(cè)量氣流方向,SilentVoice可以輕松地讓外部聲音與正常話語(yǔ)分離,準(zhǔn)確度達(dá)98.8%,在語(yǔ)音通信啟動(dòng)前不需要念激活詞。它還可以配合帶有經(jīng)過(guò)專門(mén)訓(xùn)練的語(yǔ)音識(shí)別器的語(yǔ)音激活系統(tǒng),評(píng)估結(jié)果產(chǎn)生的單詞錯(cuò)誤率(WERs)為1.8%(說(shuō)話者依賴條件),7.0%(說(shuō)話者無(wú)條件),包含有85個(gè)命令句,這意味著類似耳語(yǔ)的自然語(yǔ)音也可用于實(shí)時(shí)語(yǔ)音通信。
該技術(shù)仍處于研究階段,但肯定會(huì)幫助那些喜歡使用語(yǔ)音命令但喜歡在不打擾周圍人的情況下工作的人。