TensorFlow發(fā)布語音識別入門教程助力初學(xué)者入門
雖然有一些偉大的開源語音識別系統(tǒng),如Kaldi可以使用神經(jīng)網(wǎng)絡(luò)作為一個組件,但它們的復(fù)雜性,使得它們難以被用來作簡單任務(wù)的指南。
目前,找不到免費且公開的數(shù)據(jù)集及教程,讓初學(xué)者入門(許多需要在神經(jīng)網(wǎng)絡(luò)模型可以構(gòu)建之前進行預(yù)處理),或者非常適合簡單的關(guān)鍵字檢測。
為了解決這個問題,TensorFlow和AIY團隊創(chuàng)建了語音命令數(shù)據(jù)集,并用于將訓(xùn)練*和推理示例代碼在TensorFlow中運行。(https://aiyprojects.withgoogle.com/)
該數(shù)據(jù)集在AIY網(wǎng)站,由成千上萬的用戶,上傳了包含30個詞的65000條語音數(shù)據(jù),每條數(shù)據(jù)長度為一秒。數(shù)據(jù)集可以為應(yīng)用程序構(gòu)建基本但有用的語音界面,其中包含“yes”、“no”,“up”和“l(fā)eft”等常用單詞。
想要練手的雞友,要下載預(yù)先構(gòu)建的TensorFlow Android應(yīng)用程序演示,并開啟“TF語音”。你將被要求訪問麥克風(fēng)的權(quán)限,然后查看一個十個單詞的列表,每個單詞應(yīng)該對應(yīng)你說的話。
非常好我支持^.^
(0) 0%
不好我反對
(0) 0%