語音識(shí)別(AutomaticSpeechRecognition)是以語音為研究對(duì)象,通過信號(hào)處理和識(shí)別技術(shù)讓機(jī)器自動(dòng)識(shí)別和理解人類口述的語言后,將語音信號(hào)轉(zhuǎn)換為相應(yīng)的文本或命令的一門技術(shù)。由語音識(shí)別和語音合成、自然語言理解、語義網(wǎng)絡(luò)等技術(shù)相結(jié)合的語音交互正在逐步成為當(dāng)前多通道、多媒體智能人機(jī)交互的主要方式。
1. 語音識(shí)別的流程
語音信號(hào)經(jīng)過前端信號(hào)處理、端點(diǎn)檢測等預(yù)處理后,逐幀提取語音特征,傳統(tǒng)的特征類型包括有MFCC、PLP、FBANK等特征,提取好的特征會(huì)送到解碼器,在訓(xùn)練好的聲學(xué)模型、語言模型之下,找到最為匹配的此序列作為識(shí)別結(jié)果輸出。
2. 分形科技解決方案中對(duì)語音識(shí)別的應(yīng)用
北京分形科技在智慧公園解決方案中應(yīng)用了語音識(shí)別的技術(shù),如智能語音亭解決方案、智能家居解決方案。
智能語音亭:智能語音亭借助了語音交互、自然語言處理,聊天技能。能夠讓亭子陪公眾聊天,聽歌,聽?wèi)颍犗嗦暎徊樵兲鞖猓煌ǎ善毙畔ⅲ宦爟焊琛⒅v故事、學(xué)知識(shí)等等,讓文物會(huì)說話了。
智能家居控制:通過語音控制和物聯(lián)網(wǎng)技術(shù)實(shí)現(xiàn)了窗簾自動(dòng)打開、關(guān)閉;燈光的打開,關(guān)閉和亮度調(diào)節(jié);電視的打開,關(guān)閉等。以及聯(lián)動(dòng)控制公眾可通過語音控制比如說“我回來了”,智能家居可以自動(dòng)關(guān)閉窗簾,自動(dòng)打開燈,自動(dòng)打開電視。感受人工智能帶來的生活便利。