0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

江智機(jī)器人人機(jī)語音交互技術(shù)核心功能點(diǎn)探索

深圳市江智工業(yè)技術(shù)有限公司 ? 2023-03-06 14:51 ? 次閱讀

江智機(jī)器人人機(jī)語音交互技術(shù)核心功能點(diǎn)探索

無疑機(jī)器人人機(jī)語音交互技能是人工智能機(jī)器人必須具有的核心功能點(diǎn)之一。國內(nèi)的科大訊飛,百度等為代表的一些已在人機(jī)語音技術(shù)方面耕耘了多年,且取得了較大的發(fā)展。國內(nèi)相關(guān)的機(jī)器人公司,科研院所等也不斷的在此基礎(chǔ)上結(jié)合市場場景進(jìn)行嘗試等。到現(xiàn)在依然還沒看到人機(jī)語音交互技能能夠支持市場場景可靠性實(shí)際使用的案例。

直到微軟強(qiáng)力支持的OPEN AI多提出的Chat GPT給世界帶來了期待。Chat GPT目前的人機(jī)語音交互技能已有明顯的提升。可以說是一場變革?;旧夏軌蜃龅奖容^準(zhǔn)確的判斷人們所要表達(dá)的主要用意,并會(huì)進(jìn)一步判斷人們將下一句可能所要表達(dá)的內(nèi)容。

但是當(dāng)我們再冷靜下來進(jìn)一步思考:如果有了Chat GPT,我們就一定能像人與人一樣,很好的進(jìn)行人機(jī)語音交互嗎?達(dá)到人與人交流的效果嗎?

給你的答案 一定是 還不能夠!原因就是訊飛的語音交互還是Chat GPT,其他們主要方法以及主要方向是基于大數(shù)據(jù)的訓(xùn)練深度學(xué)習(xí)。對于公共場景 大的基本面的有一定邏輯關(guān)系等內(nèi)容一定會(huì)越做越好,甚至以后比人的反應(yīng)回答還要快 還要準(zhǔn)。

可是我們仔細(xì)想想:我們大家平時(shí)交流的內(nèi)容有多少是“大事”?應(yīng)該是更多的就是“家?!?或者生意上往來的事情等。甚至都不能對外公開的話題。還有就是臨時(shí)性決定的都有可能等。而且這方面的交談內(nèi)容所占的比重更大。就目前而言Chat GPT技能還不能做到把這些內(nèi)容實(shí)時(shí)采集進(jìn)行模型訓(xùn)練。也就是說Chat GPT對這樣的內(nèi)容的人機(jī)語音交互,就不是他們研發(fā)的方向與目的。

我們江智機(jī)器人公司通過對市場的深入的了解分析;這幾年腳踏實(shí)地的努力,現(xiàn)在已經(jīng)把這方面訊飛以及Chat GPT所欠缺的語音交互場景所需要的技能不斷的補(bǔ)充起來。而且這些內(nèi)容也只能交給使用者或者可以依靠的人來完成。我們只是提供了具體的操作處理方法。而且這些方法僅具有高中文化程度,具有電腦基本操作能力的人都可完成。同時(shí)對昨天交互所出錯(cuò)的內(nèi)容,隨后可精準(zhǔn)的完善訓(xùn)練之后,明天在問這個(gè)問題就不會(huì)再出錯(cuò)。

我們按照這樣的方法思路所開發(fā)的軟件通過這半年多的用戶體驗(yàn)測試,已日漸顯出實(shí)際交互效果優(yōu)勢。在不斷的持續(xù)的改進(jìn)下一定可以實(shí)現(xiàn)專業(yè)場景的語音交互,達(dá)到人與人交互的效果程度等。

深圳市江智工業(yè)技術(shù)有限公司

2023年3月5日

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 機(jī)器人
    +關(guān)注

    關(guān)注

    210

    文章

    28103

    瀏覽量

    205852
  • 人機(jī)
    +關(guān)注

    關(guān)注

    0

    文章

    27

    瀏覽量

    12694
  • 語音交互
    +關(guān)注

    關(guān)注

    3

    文章

    282

    瀏覽量

    27963
收藏 人收藏

    評論

    相關(guān)推薦

    圖紙代碼完全開源!稚暉君:人人都能造人形機(jī)器人!

    SDK“開源”而大肆宣傳不同,智元機(jī)器人開源的內(nèi)容包括硬件和軟件的“一站式”技術(shù)資源,資料包大小超過1.2GB,完全可以通過圖紙和代碼自行復(fù)現(xiàn)靈犀X1機(jī)器人。 靈犀X1:人形機(jī)器人人人
    的頭像 發(fā)表于 10-28 06:10 ?3526次閱讀
    圖紙代碼完全開源!稚暉君:<b class='flag-5'>人人</b>都能造人形<b class='flag-5'>機(jī)器人</b>!

    “0元購”智元靈犀X1機(jī)器人,軟硬件全套圖紙和代碼全公開!資料免費(fèi)下載!

    和開發(fā)指南分別上線GitHub和智元機(jī)器人官網(wǎng),“一站式”開源軟硬件全套圖紙和代碼,大幅降低了機(jī)器人技術(shù)開發(fā)的門檻,推動(dòng)了全球機(jī)器人技術(shù)的普
    發(fā)表于 10-25 15:20

    PCS儲能變流器工作原理與核心功能

    PCS儲能變流器是一種雙向電流可控轉(zhuǎn)換裝置,它能夠連接儲能電池系統(tǒng)與電網(wǎng)或負(fù)荷。這種裝置的核心功能是控制儲能電池的充電和放電過程,實(shí)現(xiàn)交直流電能的變換。在無電網(wǎng)情況下,PCS儲能變流器甚至可以直接為
    的頭像 發(fā)表于 09-17 17:03 ?584次閱讀

    [天拓四方]工業(yè)邊緣網(wǎng)關(guān)的核心功能、應(yīng)用場景和實(shí)施策略

    重要支持。本文將重點(diǎn)介紹工業(yè)邊緣網(wǎng)關(guān)的核心功能、應(yīng)用場景和實(shí)施策略,以展示其在工業(yè)自動(dòng)化領(lǐng)域的專業(yè)性和實(shí)用性。 一、工業(yè)邊緣網(wǎng)關(guān)的核心功能 工業(yè)邊緣網(wǎng)關(guān)的核心功能包括: 數(shù)據(jù)采集與集成:邊緣網(wǎng)關(guān)能夠?qū)崟r(shí)采集來自各種工業(yè)設(shè)
    的頭像 發(fā)表于 05-23 16:29 ?331次閱讀

    智能語音交互技術(shù)如何助力設(shè)備實(shí)現(xiàn)人機(jī)自然對話

    智能語音交互技術(shù)是指通過語音識別、語音合成和自然語言理解等技術(shù),實(shí)現(xiàn)人與
    的頭像 發(fā)表于 05-23 15:14 ?346次閱讀

    基于飛凌嵌入式RK3568J核心板的工業(yè)機(jī)器人控制器應(yīng)用方案

    加強(qiáng)和擴(kuò)大現(xiàn)有市場份額,更要在細(xì)分市場中發(fā)掘新的增長動(dòng)力,以適應(yīng)更加激烈的市場競爭環(huán)境。 飛凌嵌入式作為一家專注嵌入式核心控制系統(tǒng)研發(fā)與制造的高新技術(shù)企業(yè),經(jīng)過多年的研發(fā)與積累,產(chǎn)品已廣泛應(yīng)用于機(jī)器人
    發(fā)表于 05-11 09:40

    機(jī)器人產(chǎn)品實(shí)地場景推進(jìn)報(bào)告

    此文章是機(jī)器人公司多年來實(shí)地開發(fā)生產(chǎn)的機(jī)器人系列報(bào)告
    發(fā)表于 02-19 09:32 ?0次下載

    人機(jī)交互技術(shù)有哪幾種 人機(jī)交互技術(shù)的發(fā)展趨勢

    的幾種形式: 圖形用戶界面(GUI):圖形用戶界面是目前最為常見的人機(jī)交互技術(shù)形式。它通過圖形化的方式展示信息,用戶可通過鼠標(biāo)、鍵盤等設(shè)備進(jìn)行操作。GUI簡單直觀,易于學(xué)習(xí)使用,適用于大眾用戶。 語音
    的頭像 發(fā)表于 01-22 17:47 ?3304次閱讀

    機(jī)器視覺的四大核心功能

    機(jī)器視覺的四大核心功能? 機(jī)器視覺是一種通過電子系統(tǒng)和計(jì)算機(jī)軟件實(shí)現(xiàn)人類視覺功能技術(shù)。它運(yùn)用計(jì)算機(jī)視覺、模式識別、圖像處理和
    的頭像 發(fā)表于 12-25 11:15 ?919次閱讀

    離線語音識別技術(shù):掌控未來的語音交互

    離線語音識別技術(shù)核心優(yōu)勢在于其獨(dú)立性和實(shí)時(shí)性。在沒有網(wǎng)絡(luò)連接的情況下,設(shè)備依然能夠迅速識別用戶的語音指令,實(shí)現(xiàn)各種功能。這使得
    的頭像 發(fā)表于 12-13 11:12 ?539次閱讀
    離線<b class='flag-5'>語音</b>識別<b class='flag-5'>技術(shù)</b>:掌控未來的<b class='flag-5'>語音</b><b class='flag-5'>交互</b>

    語音數(shù)據(jù)集:推動(dòng)AI語音技術(shù)核心力量

    一、引言 隨著人工智能的快速發(fā)展,語音技術(shù)作為人機(jī)交互的重要手段,正發(fā)揮著越來越重要的作用。而語音數(shù)據(jù)集則是推動(dòng)AI語音
    的頭像 發(fā)表于 12-12 11:32 ?655次閱讀

    交互的藝術(shù):協(xié)作機(jī)器人如何定義新一代的人機(jī)關(guān)系?

    。雖然他們的構(gòu)想因當(dāng)時(shí)的技術(shù)局限性未能實(shí)現(xiàn),但這種人機(jī)協(xié)作的理念將人機(jī)交互推向了機(jī)器人技術(shù)發(fā)展的前沿。 經(jīng)過多年的
    的頭像 發(fā)表于 11-29 08:10 ?944次閱讀
    <b class='flag-5'>交互</b>的藝術(shù):協(xié)作<b class='flag-5'>機(jī)器人</b>如何定義新一代的<b class='flag-5'>人機(jī)</b>關(guān)系?

    情感語音識別技術(shù)人機(jī)交互中的應(yīng)用與展望

    一、引言 隨著人工智能技術(shù)的不斷發(fā)展,人機(jī)交互已經(jīng)滲透到日常生活的方方面面。情感語音識別作為人機(jī)交互中的關(guān)鍵技術(shù)之一,能夠通過分析人類
    的頭像 發(fā)表于 11-22 10:40 ?714次閱讀

    情感語音識別在人機(jī)交互中的應(yīng)用與挑戰(zhàn)

    。 二、情感語音識別在人機(jī)交互中的應(yīng)用 智能客服:智能客服可以利用情感語音識別技術(shù),對用戶的語音情感進(jìn)行分析,從而提供更加貼心和個(gè)性化的服務(wù)
    的頭像 發(fā)表于 11-15 15:42 ?519次閱讀

    情感語音識別技術(shù)的應(yīng)用與未來發(fā)展

    一、引言 隨著科技的飛速發(fā)展,情感語音識別技術(shù)已經(jīng)成為人機(jī)交互的重要發(fā)展方向。情感語音識別技術(shù)能夠通過分析人類
    的頭像 發(fā)表于 11-12 17:30 ?752次閱讀