近日,美國著名人工智能研發(fā)機(jī)構(gòu)OpenAI正式宣布,自本周二(2022年7月30日)起,面向部分ChatGPT Plus用戶推出嶄新的GPT-4o語音模式產(chǎn)品。
據(jù)OpenAI詳細(xì)闡述,這款高級語音模式具備高度的實時性和互動性,支持用戶隨時隨地打斷對話過程,并且能夠敏銳察覺并反應(yīng)出用戶的情緒變化。實際上,實時交互及對話中斷兩大技術(shù)難題一直是語音助手領(lǐng)域面臨的挑戰(zhàn)。
早在今年五月份,OpenAI便成功推出了全新升級版的大型語言模型GPT-4o,并同步展示了其語音模式的強(qiáng)大功能。原本計劃在六月底逐步向廣大用戶開放此項服務(wù),然而經(jīng)過慎重考慮,OpenAI最終決定將其發(fā)布日期延至七月。預(yù)計在今年秋季,語音模式將全面覆蓋到所有ChatGPT Plus用戶群體中。
OpenAI在本周二明確指出:“我們采取逐步推廣策略,以便能夠密切關(guān)注用戶的使用體驗,并依據(jù)實際反饋持續(xù)提升模型的性能以及安全性。”此外,該公司還透露正在積極推進(jìn)五月份發(fā)布會上展示的視頻和屏幕分享功能的研發(fā)工作。至于這些功能的具體上線時間,目前尚無確切消息。
因此,在語音模式的初始階段,其功能可能相對較為單一。舉例來說,ChatGPT將暫時無法運(yùn)用計算機(jī)視覺功能,這項技術(shù)可以使聊天機(jī)器人借助智能手機(jī)的攝像頭,為用戶的舞蹈動作提供語音反饋。
現(xiàn)階段,GPT-4o語音模式已經(jīng)配備了四種預(yù)設(shè)聲音——Juniper、Breeze、Cove和Ember,這些聲音均由經(jīng)驗豐富的付費(fèi)配音演員精心打造而成。
值得一提的是,之前ChatGPT中的一位名為Sky的女性配音曾因與好萊塢巨星斯嘉麗·約翰遜的聲線極為相似而備受爭議。在接獲約翰遜團(tuán)隊的律師函之后,OpenAI不得不暫停使用Sky語音。
此外,OpenAI還特別強(qiáng)調(diào),他們已經(jīng)引入了全新的過濾機(jī)制,旨在確保軟件能夠準(zhǔn)確識別并拒絕任何試圖生成受版權(quán)保護(hù)的音樂或其他音頻內(nèi)容的請求。對于AI企業(yè)而言,如何規(guī)避潛在的法律風(fēng)險已然成為必須高度重視的問題。
-
語音
+關(guān)注
關(guān)注
3文章
381瀏覽量
37973 -
OpenAI
+關(guān)注
關(guān)注
9文章
1033瀏覽量
6378 -
ChatGPT
+關(guān)注
關(guān)注
29文章
1546瀏覽量
7358
發(fā)布評論請先 登錄
相關(guān)推薦
評論