0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

開(kāi)發(fā)者說(shuō) | 手語(yǔ)翻譯系統(tǒng)系列之使用旭日X3派實(shí)現(xiàn)實(shí)時(shí)語(yǔ)音轉(zhuǎn)寫

地瓜機(jī)器人 ? 2023-01-05 14:06 ? 次閱讀

準(zhǔn)備工作

  • 硬件部分:旭日X3派,USB免驅(qū)攝像頭,電源適配器,燒錄Ubuntu系統(tǒng)的SD卡,USB揚(yáng)聲器,顯示屏(或者VNC/SSH遠(yuǎn)程連接)

  • 軟件部分:Thonny IDE集成開(kāi)發(fā)環(huán)境
2.jfif

注意:購(gòu)買麥克風(fēng)時(shí)要購(gòu)買二合一的USB麥克風(fēng),切勿購(gòu)買3.5mm耳機(jī)接口傳輸?shù)柠溈孙L(fēng)。

首先更新軟件源和所有軟件,只需要使用快捷鍵ctrl+alt+T打開(kāi)命令行,輸入以下命令,耐心等待即可。

# 更新軟件源 apt-get update # 更新升級(jí)所有軟件 apt-get upgrade

開(kāi)發(fā)工具依然是沿用Thonny,作為一款輕量化的python集成開(kāi)發(fā)環(huán)境,對(duì)新手十分友好,簡(jiǎn)單易上手,后續(xù)安裝各種python依賴庫(kù)也相當(dāng)方便。安裝完成后同樣是使用快捷鍵ctrl+alt+T打開(kāi)命令行,輸入Thonny啟動(dòng),然后開(kāi)始項(xiàng)目的重頭戲——安裝項(xiàng)目依賴庫(kù),需要用到的第三方庫(kù)和版本如下,大家可以根據(jù)這個(gè)順序進(jìn)行安裝,以免遺漏(也可以復(fù)制到一個(gè)新的txt文件利用pip一次性安裝)。

cffi==1.12.3 gevent==1.4.0 greenlet==0.4.15 pycparser==2.19 six==1.12.0 websocket==0.2.1 websocket-client==0.56.0

注意:有些庫(kù)安裝失敗的話代碼可能不會(huì)有高亮提示,但運(yùn)行時(shí)會(huì)報(bào)錯(cuò),所以,出現(xiàn)報(bào)錯(cuò)第一時(shí)間檢查第三方庫(kù)是否成功安裝。

本文著重介紹需要用到的Python標(biāo)準(zhǔn)GUI庫(kù)——Tkinter。

在Python程序中,Tkinter是Python的一個(gè)模塊,它可以像其他模塊一樣在Python交互式shell中(或者“.py”程序中)導(dǎo)入,導(dǎo)入Tkinter模塊后,就可使用Tkinter模塊中的函數(shù)、方法等進(jìn)行GUI編程。同時(shí),開(kāi)發(fā)者也可以使用Tkinter庫(kù)中的文本框、按鈕、標(biāo)簽等組件實(shí)現(xiàn)GUI開(kāi)發(fā)。

首先,需檢查Tkinter是否成功導(dǎo)入,如運(yùn)行無(wú)誤則說(shuō)明導(dǎo)入成功,否之,則需要重新安裝Tkinter庫(kù)。

import tkinter

接著創(chuàng)建一個(gè)窗口,先使用http://tkinter.Tk生成一個(gè)主窗口對(duì)象,然后才能使用Tkinter模塊中其他的函數(shù)和方法等元素。生成主窗口以后才可以向里面添加組件,或者直接調(diào)用其mainloop()方法進(jìn)行消息循環(huán)。示例如下:

import tkinter #導(dǎo)入Tkinter模塊 top = tkinter.Tk()#生成一個(gè)主窗口對(duì)象 top.mainloop()#進(jìn)入消息循環(huán)

我們要有交互,就需要有組件。組件與窗口一樣,也是通過(guò)Tkinter模塊中相應(yīng)的組件函數(shù)生成的。在生成組件以后,就可以使用pack、grid或place等方法將它添加到窗口中,以下示例給窗口增添兩個(gè)按鈕:

import tkinter #導(dǎo)入Tkinter模塊 root = tkinter.Tk()#生成一個(gè)主窗口對(duì)象 label= tkinter.Label(root, text="Python, tkinter!") label.pack()#將標(biāo)簽添加到窗口中 button1 = tkinter.Button(root, text="按鈕1")#創(chuàng)建按鈕1 button1.pack(side=tkinter.LEFT)#將按鈕1添加到窗口中 button2 = tkinter.Button(root, text="按鈕2")#創(chuàng)建按鈕2 button2.pack(side=tkinter.RIGHT)#將按鈕2添加到窗口中 root.mainloop()#進(jìn)入消息循環(huán)

3.jfif

至此,用Tkinter庫(kù)創(chuàng)建一個(gè)帶交互功能的窗口已經(jīng)完成,大家感興趣可以繼續(xù)學(xué)習(xí)其他組件,這里就不再贅述。

接下來(lái)進(jìn)行云服務(wù)器部署,本項(xiàng)目選用云端語(yǔ)音平臺(tái),登錄平臺(tái)后,通過(guò)右上角「控制臺(tái)」,或右上角下拉菜單的「我的應(yīng)用」進(jìn)入控制臺(tái)。如果賬戶未曾創(chuàng)建過(guò)應(yīng)用,平臺(tái)會(huì)引導(dǎo)創(chuàng)建,創(chuàng)建完成后,便可通過(guò)左側(cè)的服務(wù)列表,選擇要使用的服務(wù)。

在服務(wù)管理面板中,將看到這個(gè)服務(wù)對(duì)應(yīng)的可用量、歷史用量、服務(wù)接口的驗(yàn)證信息,還有可以調(diào)用的API和SDK。值得注意的是,要將應(yīng)用創(chuàng)建后生成的APPID,APISecret和APIKey去替換代碼中的APPID,APISecret和APIKey一定要一一對(duì)應(yīng),否則會(huì)影響代碼的正常運(yùn)行!

def run(): global wsParam wsParam = Ws_Param(APPID='你的APPID', APIKey='你的APIKey',APISecret='你的APISecret') websocket.enableTrace(False) wsUrl = wsParam.create_url() ws = websocket.WebSocketApp(wsUrl, on_message=on_message, on_error=on_error, on_close=on_close) ws.on_open = on_open ws.run_forever(sslopt={"cert_reqs": ssl.CERT_NONE}, ping_timeout=2)

隨后選擇需要的語(yǔ)種和服務(wù)即可,支持除中文和英語(yǔ)外的51種外語(yǔ),24種方言和1種民族語(yǔ)言。

4.png

實(shí)現(xiàn)原理

本項(xiàng)目主要就是利用python程序錄制本地mp3格式的用戶音頻,并將音頻上傳到云端語(yǔ)音平臺(tái)進(jìn)行實(shí)時(shí)轉(zhuǎn)寫,最后利用GUI庫(kù)在屏幕上展示轉(zhuǎn)寫結(jié)果(云端語(yǔ)音平臺(tái)翻譯文本的方法和窗口的實(shí)現(xiàn),點(diǎn)擊文末閱讀原文即可獲取)。

效果展示

結(jié)果顯示,本項(xiàng)目對(duì)本地資源占用較小,得益于旭日X3派的高算力和高性能,溫度的控制讓人十分滿意(和上一個(gè)項(xiàng)目手語(yǔ)翻譯終端同時(shí)運(yùn)行也沒(méi)有問(wèn)題)。

5.jfif


6.jfif

性能測(cè)試

系統(tǒng)測(cè)試方案:將程序?qū)胄袢誜3派中,接入電源后等待初始化完成,在安靜的室內(nèi)環(huán)境下,在麥克風(fēng)前分別測(cè)試普通話,英語(yǔ),方言(東北話/四川話),將轉(zhuǎn)寫終端實(shí)時(shí)轉(zhuǎn)寫的準(zhǔn)確率記錄,同時(shí)將識(shí)別的總時(shí)長(zhǎng)記錄收集。

測(cè)試數(shù)據(jù)如下:

7.jfif


8.jfif

結(jié)果分析:接收到語(yǔ)音信息后到完成轉(zhuǎn)寫結(jié)果的顯示總時(shí)長(zhǎng)在0.5秒之內(nèi),可基本實(shí)現(xiàn)實(shí)時(shí)轉(zhuǎn)譯,對(duì)普通話和英文以及51種外語(yǔ),24種方言和1種民族語(yǔ)言的識(shí)別率在95%以上。

結(jié)論:實(shí)現(xiàn)語(yǔ)音轉(zhuǎn)寫除了支持普通話和英語(yǔ)外,支持51個(gè)外國(guó)語(yǔ)種(包括日語(yǔ)、俄語(yǔ)、泰語(yǔ)、捷克語(yǔ)等常用語(yǔ)種)、24種方言(包括四川話、廣東話、河南話、上海話,閩南語(yǔ)等常用方言),另外,還支持一種民族語(yǔ)言(彝語(yǔ)),真正做到無(wú)障礙溝通交流。

本文轉(zhuǎn)自地平線開(kāi)發(fā)者社區(qū)
原作者:鑫辰大海王

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 嵌入式
    +關(guān)注

    關(guān)注

    5046

    文章

    18817

    瀏覽量

    298563
  • 語(yǔ)音
    +關(guān)注

    關(guān)注

    3

    文章

    381

    瀏覽量

    37862
  • 人工智能
    +關(guān)注

    關(guān)注

    1787

    文章

    46061

    瀏覽量

    235018
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    開(kāi)發(fā)者空間實(shí)踐指導(dǎo):基于 3 大 PaaS 主流服務(wù)輕松實(shí)現(xiàn)文字轉(zhuǎn)換語(yǔ)音

    【摘要】 基于 CodeArts API 設(shè)計(jì)語(yǔ)音合成接口,基于 API Explorer 調(diào)試接口,并利用 CodeArts IDE 實(shí)現(xiàn)數(shù)據(jù)流轉(zhuǎn)換為音頻 案例簡(jiǎn)介 開(kāi)發(fā)者將在云主機(jī)中
    的頭像 發(fā)表于 09-13 16:25 ?183次閱讀
    <b class='flag-5'>開(kāi)發(fā)者</b>空間實(shí)踐指導(dǎo):基于 <b class='flag-5'>3</b> 大 PaaS 主流服務(wù)輕松<b class='flag-5'>實(shí)現(xiàn)</b>文字轉(zhuǎn)換<b class='flag-5'>語(yǔ)音</b>

    訊維智能語(yǔ)音轉(zhuǎn)寫系統(tǒng)確保企業(yè)數(shù)據(jù)的安全性

    隨著人工智能技術(shù)的飛速發(fā)展,智能語(yǔ)音轉(zhuǎn)寫系統(tǒng)逐漸走進(jìn)我們的日常生活和工作之中,成為提升工作效率、優(yōu)化信息處理的重要工具。訊維智能語(yǔ)音轉(zhuǎn)寫
    的頭像 發(fā)表于 08-02 15:53 ?327次閱讀

    開(kāi)源項(xiàng)目!設(shè)計(jì)一款智能手語(yǔ)翻譯眼鏡

    這個(gè)項(xiàng)目是一款創(chuàng)新的智能手語(yǔ)翻譯眼鏡,它能夠實(shí)時(shí)地將手語(yǔ)轉(zhuǎn)換為聽(tīng)得見(jiàn)的語(yǔ)音。這款眼鏡采用了VIAM平臺(tái)和樹(shù)莓
    發(fā)表于 05-20 15:59

    鴻蒙開(kāi)發(fā)者預(yù)覽版如何?

    在24年的華為鴻蒙發(fā)布會(huì)中表示。預(yù)覽版已經(jīng)向開(kāi)發(fā)者開(kāi)放申請(qǐng),首批支持的機(jī)型有三款分別為華為 Mate 60、華為Mate 60 Pro、華為Mate X5。 其HarmonyOS NEXT去除
    發(fā)表于 02-17 21:54

    鴻蒙系統(tǒng)優(yōu)缺點(diǎn),能否作為開(kāi)發(fā)者選擇

    星河版已經(jīng)是純血鴻蒙,但是它的發(fā)展一些周期。生態(tài)圈的建立難度大,各大廠商加入鴻蒙原生開(kāi)發(fā)需要時(shí)間累積。 鴻蒙開(kāi)發(fā)人才空缺,由于鴻蒙作為一款新型的系統(tǒng),程序員們都是從0學(xué)起。所以市面上很少有鴻蒙
    發(fā)表于 02-16 21:00

    【飛騰4G版免費(fèi)試用】大家來(lái)了解飛騰4G版開(kāi)發(fā)

    、RT-Thread等國(guó)產(chǎn)操作系統(tǒng)。 在飛騰在電子發(fā)燒友論壇構(gòu)建了在飛騰開(kāi)發(fā)者社區(qū),大家也可以通過(guò)社區(qū)資料更多的了解飛騰4G版開(kāi)發(fā)
    發(fā)表于 01-02 22:43

    開(kāi)發(fā)者說(shuō)】HarmonyOS實(shí)踐應(yīng)用狀態(tài)變量共享

    # 開(kāi)發(fā)者說(shuō) # 【開(kāi)發(fā)者說(shuō)】欄目是為HarmonyOS開(kāi)發(fā)者提供的展示和分享平臺(tái),在這里,大家可以發(fā)表自己的技術(shù)洞察和見(jiàn)解,也可以展示自己
    的頭像 發(fā)表于 12-26 21:20 ?661次閱讀
    【<b class='flag-5'>開(kāi)發(fā)者</b><b class='flag-5'>說(shuō)</b>】HarmonyOS實(shí)踐<b class='flag-5'>之</b>應(yīng)用狀態(tài)變量共享

    開(kāi)發(fā)者說(shuō)開(kāi)發(fā)案例:使用canvas實(shí)現(xiàn)圖表系列折線圖

    # 開(kāi)發(fā)者說(shuō) # 【開(kāi)發(fā)者說(shuō)】欄目是為HarmonyOS開(kāi)發(fā)者提供的展示和分享平臺(tái),在這里,大家可以發(fā)表自己的技術(shù)洞察和見(jiàn)解,也可以展示自己
    的頭像 發(fā)表于 12-13 16:05 ?482次閱讀
    【<b class='flag-5'>開(kāi)發(fā)者</b><b class='flag-5'>說(shuō)</b>】<b class='flag-5'>開(kāi)發(fā)</b>案例:使用canvas<b class='flag-5'>實(shí)現(xiàn)</b>圖表<b class='flag-5'>系列</b><b class='flag-5'>之</b>折線圖

    歡迎加入飛騰開(kāi)發(fā)者社區(qū),感謝每一位開(kāi)發(fā)者!

    今年10月,飛騰聯(lián)合電子發(fā)燒友論壇一起策劃了飛騰開(kāi)發(fā)板測(cè)評(píng)活動(dòng),受到了廣大開(kāi)發(fā)者的喜愛(ài)。
    的頭像 發(fā)表于 12-11 17:39 ?1211次閱讀
    歡迎加入飛騰<b class='flag-5'>派</b><b class='flag-5'>開(kāi)發(fā)者</b>社區(qū),感謝每一位<b class='flag-5'>開(kāi)發(fā)者</b>!

    歡迎加入飛騰開(kāi)發(fā)者社區(qū),感謝每一位開(kāi)發(fā)者!

    ://bbs.elecfans.com/group_1708 飛騰開(kāi)發(fā)者社區(qū)部分內(nèi)容截圖 回顧合作歷程,從2023年開(kāi)始,華秋 · 電子發(fā)燒友就與飛騰建立了密切的合作關(guān)系,雙方團(tuán)隊(duì)共同努力,實(shí)現(xiàn)了許多
    發(fā)表于 12-11 16:11

    開(kāi)發(fā)者說(shuō)開(kāi)發(fā)案例分享:萬(wàn)能卡片也能用來(lái)玩游戲

    # 開(kāi)發(fā)者說(shuō) # 【開(kāi)發(fā)者說(shuō)】欄目是為HarmonyOS開(kāi)發(fā)者提供的展示和分享平臺(tái),在這里,大家可以發(fā)表自己的技術(shù)洞察和見(jiàn)解,也可以展示自己
    的頭像 發(fā)表于 11-30 21:15 ?407次閱讀
    【<b class='flag-5'>開(kāi)發(fā)者</b><b class='flag-5'>說(shuō)</b>】<b class='flag-5'>開(kāi)發(fā)</b>案例分享:萬(wàn)能卡片也能用來(lái)玩游戲

    地平線機(jī)器人開(kāi)發(fā)UART串口通信程序

    運(yùn)行示例程序 接下來(lái)就可以運(yùn)行串口通信的例程了。 $ sudo python3 test_serial.py 實(shí)物接線完成后,在旭日X3的終端中輸入指令啟動(dòng)例程,很快就可以在終端中看
    的頭像 發(fā)表于 11-27 10:55 ?317次閱讀

    開(kāi)發(fā)者自制載板令樹(shù)莓 5“變身”CM5 計(jì)算模塊

    然而,制造商們?nèi)栽诘却龢?shù)莓 cm5計(jì)算模塊, Arturo182的開(kāi)發(fā)者開(kāi)發(fā)了一個(gè)投手踏板,可以將樹(shù)莓5轉(zhuǎn)換成“樹(shù)莓cm5計(jì)算模塊”,
    的頭像 發(fā)表于 11-12 15:01 ?969次閱讀

    【悟空H3開(kāi)發(fā)板免費(fèi)體驗(yàn)】基于ROS系統(tǒng)的全向輪小車

    開(kāi)發(fā)板。 悟空是一款開(kāi)源的單板卡片電腦,新一代的Linux開(kāi)發(fā)板,它可以運(yùn)行Linux、Ubuntu和 Debian 等操作系統(tǒng)。悟空H
    發(fā)表于 11-12 01:00

    【悟空H3開(kāi)發(fā)板免費(fèi)體驗(yàn)】基于悟空H3開(kāi)發(fā)板實(shí)現(xiàn):三全向輪小車速度控制、里程反饋

    產(chǎn)品試用報(bào)告 - 悟空H3開(kāi)發(fā)板 產(chǎn)品概述 產(chǎn)品名稱:悟空H3開(kāi)發(fā)板 試用項(xiàng)目:ROS
    發(fā)表于 11-02 01:37