0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

什么是query理解?query理解目前的主要作用

深度學(xué)習(xí)自然語言處理 ? 來源:CS的陋室 ? 2023-02-22 17:54 ? 次閱讀

什么是query理解

有關(guān)query理解的具體概念,我之前在串講對話系統(tǒng)的時候有專門講過,這里就不重復(fù)了。(前沿重器[23] | 聊聊對話系統(tǒng):query理解),還有這篇可以參考(心法利器[70] | 短文本理解的難點和解決方案)

query理解目前的主要作用

但需要強(qiáng)調(diào)的,是為什么我們要去做query理解,因為它存在的意義才是我們持續(xù)討論他在后續(xù)chatgpt下是否應(yīng)該存在空間的落腳點。

我們都知道,query理解后的下游內(nèi)容,是需要給下游使用的,同樣的,我們來想想幾個場景。

識別天氣意圖,并且提槽時間、地點信息。方便下游進(jìn)行查詢使用,和功能需求、工程架構(gòu)是綁定的,如“深圳明天的天氣”,我們需要知道天氣意圖,要去查的是天氣庫,然后查詢的是明天、深圳的天氣。

辱罵意圖。識別出來后,我們根據(jù)用戶的語氣,可以制定一定的安撫策略,或者引導(dǎo)用戶一起解決問題,這里,我們是需要根據(jù)意圖調(diào)整對話策略。

細(xì)粒度的數(shù)據(jù)分析。例如那些意圖或者實體是用戶高頻提到的,此時進(jìn)行針對性優(yōu)化能大大提升整體效率。

此時我們可以看到,其實query理解主要是在3個維度有很大作用:

下游的資源獲取的信息依據(jù)。

對話策略選擇的依據(jù)。

資源盤點和數(shù)據(jù)分析的依據(jù)。

這里,我們把query理解的作用放在一個系統(tǒng),甚至一個產(chǎn)品層面來看的,他所提取信息,是可以供多個對象使用的:

系統(tǒng)內(nèi)的其他組件,如下游的數(shù)據(jù)查詢、數(shù)據(jù)查詢。

用戶,理解用戶意圖后能給出更加精準(zhǔn)的回復(fù)信息。

系統(tǒng)內(nèi)其他人員,產(chǎn)品、運(yùn)營甚至數(shù)據(jù)分析同事。

目前query理解的系統(tǒng)問題

然而,我們?nèi)?gòu)造這個模塊專門解決這類問題,會不會出現(xiàn)什么問題,答案是肯定的,而且隨著技術(shù)逐漸迭代,這些問題會逐步明顯,甚至可以說是系統(tǒng)問題了,畢竟只要有這個模塊,問題就存在,無法解決:

維護(hù)成本問題。隨著意圖、實體的逐漸增加,系統(tǒng)壓力會變得非常零散而巨大,可維護(hù)性會大大降低,想象一下,當(dāng)我們要維護(hù)幾十上百甚至更多意圖時,人力、機(jī)器的安排安排都是絕大的。

誤差的疊加問題。技術(shù)上有個共識,我們總不能解決所有問題,我們拆解的步驟越多,中間損失的可能也會越多,最終反饋到端到端層面問題就會更嚴(yán)重,這也是為什么query理解的召準(zhǔn)要做的這么高的根本原因,高頻的意圖、NER都要在雙85、雙90甚至更高,加了權(quán)得奔著95/96去了。

query理解類目體系的模糊問題逐步凸顯。在項目初期,我們會關(guān)注的是高頻、典型的問題,但是隨著問題的逐漸深入,我們是需要去解決困難的、邊緣的問題的,但是隨著query理解而產(chǎn)生的意圖、實體體系,我們所關(guān)注的問題就會擴(kuò)展到這些邊緣地帶,百科和專項知識問答的交叉,多類型藝術(shù)作品的重合(如電影、小說)、導(dǎo)航和地點查詢的交叉等。

chatgpt內(nèi)部沒有顯式query理解

我們其實可以比較明顯的知道,chatgpt其實是一個端到端或者說很接近端到端的對話系統(tǒng)方案,在這個方案下,我們可以看到,他們根本不需要意圖識別,不需要提槽,就能夠給出非常精準(zhǔn)的回復(fù)(當(dāng)然,模型內(nèi)部可能有,但這種事情是隱式的,看不出來),因此很多人也可能會感覺到,模型很輕松地就能夠回復(fù)復(fù)雜多樣的問題嗎,別說意圖識別、提槽這中間基本的任務(wù),詞權(quán)重、糾錯、句法之類的query理解任務(wù)似乎都不需要了。

按照以為大佬的說法(張家?。篊hatGPT八個技術(shù)問題的猜想),應(yīng)該是instruct tuning等的技術(shù)手段,似乎讓模型產(chǎn)生了這種能力,針對絕大多數(shù)問題,模型能快速從這個系統(tǒng)里找到所需內(nèi)容并整合輸出,以前這種整合是需要人工拆解并逐步拼接處理的,但是現(xiàn)在,已經(jīng)能夠通過模型一步直達(dá)了。甚至,還能夠更好地解決我在上一節(jié)所提到的三個問題:

維護(hù)成本問題。雖說chatgpt是個巨型的模型,但是如果要和成熟、完整的對話、搜索系統(tǒng)比,可能不見得就那么大了,畢竟可能他一個就夠。

誤差疊加問題。一個模型,不存在疊加。

query理解類目體系的模糊問題逐步凸顯。連query理解都沒有,什么意圖類目體系之類的,根本就不存在,只要是問題,直接給出答案回答就是了。

所以,我們會發(fā)現(xiàn),從設(shè)計的角度,他沒有query理解,也能夠很好地回答問題,甚至解決了搭建query理解模塊所存在的固有的系統(tǒng)問題。

后續(xù)設(shè)計是否還要保留query理解

那么現(xiàn)在問題來了,后續(xù),我們是否還要考慮這個query理解問題呢。先擺出答案,在很多現(xiàn)有系統(tǒng)中或者是設(shè)計中,是不能把他放棄的,但是在迭代升級過程中可以把這個給考慮進(jìn)去。

首先,我們需要承認(rèn)的是,chatgpt確實能夠從系統(tǒng)層面解決了很多問題,很多功能可以逐步從零散非端到端的模塊過渡到chatgpt這種比較統(tǒng)一的模塊中的,一方面泛化性和總體效果應(yīng)該會有不曉得提升,另一方面是從維護(hù)和管理上,似乎有了一個更為統(tǒng)一的綜合模塊,這個角度看,維護(hù)成本是有所下降的。

但是,我們?nèi)耘f不可忽略的是,單獨的query理解模塊,在對話策略的靈活性、工程資源對接的便捷性以及產(chǎn)品數(shù)據(jù)分析的可得性上,仍舊有很突出的優(yōu)勢,產(chǎn)品終究是一個系統(tǒng),內(nèi)部需要解決的問題有很多,我們不能一概而落,激進(jìn)地直接把原來的放棄,而轉(zhuǎn)為用新的,目前chatgpt仍舊有很多問題。

因此應(yīng)該是基于每個業(yè)務(wù),甚至業(yè)務(wù)內(nèi)的多個功能模塊點來綜合設(shè)計,可以考慮把一些通用性的、開放域的,實時信息資源以來不緊密功能逐步向這里過度,此時意圖識別可能沒有那么的高優(yōu)了,但是對于特定的一些場景,例如前面提到的實時性很高的天氣,需要定制化的風(fēng)控安全場景,內(nèi)容需要頻繁更新的場景,則需要更加謹(jǐn)慎,甚至繼續(xù)走原來的技術(shù)路線,也并無不可。

不知道大家有沒有發(fā)現(xiàn)一個問題

在我寫這篇文章的過程中,突然發(fā)現(xiàn)一個有意思的事,本文里的chatgpt,把他換成bert,或者是端到端模型,似乎沒有很大的違和感,這兩個一定程度其實都能起到類似chatgpt的作用,或者說chatgpt的思路其實就是預(yù)訓(xùn)練模型的進(jìn)一步升級,效果提升量變到質(zhì)變的新的里程碑,這個新的里程碑一定程度讓我們對“端到端”方案產(chǎn)生信心,自己在分析時很多時候考慮到的就是端到端和非端到端的對抗,可能有些片面,但是隨著逐步分析,會發(fā)現(xiàn)其實除了效果體驗的好壞,剩下的因素都聚焦在了端到端和非端到端的問題上了,這次聊query理解,最終仍然落到了這個問題上。

拋開效果因素來,我們會發(fā)現(xiàn),chatgpt所代表的其實就是端到端方案目前已知的一個頂峰,它具備很高的泛化能力,同時在工程設(shè)計上也帶來了很大的便利,而與之對應(yīng)的就是目前工業(yè)界所廣泛使用的非端到端的方案,有關(guān)這兩者的對比和思考,可以看這篇文章:心法利器 | chatgpt下非端到端方案是否還有意義。

而回到效果因素上,毋庸置疑的是,在很多領(lǐng)域下,或者說高頻熱門的領(lǐng)域下,chatgpt似乎都有非常優(yōu)秀的效果,這也是讓外界恐慌NLP、搜索、對話系統(tǒng)的末日來臨的根本原因,沒錯,就是效果好,用戶體驗層面看,很多問題確實回復(fù)的很好,滿足用戶了。

但是把多個因素綜合在一起,作為實踐者的我們,更多應(yīng)該盡可能比對多種方案,因地制宜地選擇才是對的。






審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • Query
    +關(guān)注

    關(guān)注

    0

    文章

    11

    瀏覽量

    9319
  • NER
    NER
    +關(guān)注

    關(guān)注

    0

    文章

    7

    瀏覽量

    6197
  • ChatGPT
    +關(guān)注

    關(guān)注

    28

    文章

    1517

    瀏覽量

    6940

原文標(biāo)題:chatgpt下query理解是否還有意義

文章出處:【微信號:zenRRan,微信公眾號:深度學(xué)習(xí)自然語言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    LabVIEW后面板缺少MB Serial Master Query (poly).vi什么意思

    LabVIEW后面板缺少MB Serial Master Query (poly).vi,這個是少什么模塊還是少其他東西。
    發(fā)表于 05-08 14:35

    有知道MB Ethernet Master Query返回的簇數(shù)據(jù)是什么的嗎?

    有知道MB Ethernet Master Query返回的簇數(shù)據(jù)是什么的嗎?
    發(fā)表于 08-29 09:21

    如何在Query語法中指定這個器件上的焊盤?

    請教一下,我現(xiàn)在有一個臥式貼片的座子,需要放在板邊,這樣就跟keepout layer的track邊界沖突了,如何在Query語法中指定這個器件上的焊盤呢,IsPad好像不能帶參數(shù),IsComponentPad試過了也不行。
    發(fā)表于 09-19 03:23

    如何在PCB rules中的custom query設(shè)置命令?

    PCB rules中的custom query設(shè)置命令是什么
    發(fā)表于 09-25 00:26

    什么是Query

    什么是Query  英文縮寫: Query 中文譯名: 查詢 分  類: IP與多媒體 解  釋: 為了在數(shù)據(jù)庫中尋找某一特定
    發(fā)表于 02-23 09:32 ?807次閱讀

    Query_scripts

    Query scripts,好東西,喜歡的朋友可以下載來學(xué)習(xí)。
    發(fā)表于 02-18 16:20 ?0次下載

    pcb設(shè)計之Query語句的應(yīng)用

    本篇文章綜合介紹了Query語句的構(gòu)建和使用方法,并且采用兩個具體案例展示不同的Query表達(dá)式配置過程。內(nèi)容包括常規(guī)手動輸入查詢語句,采用Query Builder 和 Query
    發(fā)表于 06-19 10:17 ?2566次閱讀

    實現(xiàn)SQL Query項目的詳細(xì)資料總結(jié)

    本文檔的主要內(nèi)容詳細(xì)介紹的是實現(xiàn)SQL Query項目的詳細(xì)資料總結(jié)。
    發(fā)表于 09-25 11:10 ?2次下載

    Query是什么意思

    query是請求查詢的意思。
    的頭像 發(fā)表于 07-25 16:08 ?2w次閱讀

    Query軟件有什么用

    Query軟件能夠根據(jù)要求從MySql數(shù)據(jù)庫中去查找數(shù)據(jù),從而找到自己想要的信息。
    的頭像 發(fā)表于 07-25 16:19 ?3166次閱讀

    稠密向量檢索的Query深度交互的文檔多視角表征

    今天給大家?guī)硪黄焙胶臀④洺銎返某砻芟蛄繖z索模型Dual-Cross-Encoder,結(jié)合Query生成和對比學(xué)習(xí)技術(shù),將文檔與生成的不同偽query進(jìn)行深度交互學(xué)習(xí)構(gòu)建文檔的不同視角的表征向量,再與Query向量進(jìn)行稠密向量
    的頭像 發(fā)表于 08-18 15:37 ?1645次閱讀

    如何入門面向自動駕駛領(lǐng)域的視覺Transformer?

    理解Transformer背后的理論基礎(chǔ),比如自注意力機(jī)制(self-attention), 位置編碼(positional embedding),目標(biāo)查詢(object query)等等,網(wǎng)上的資料比較雜亂,不夠系統(tǒng),難以通過自學(xué)做到深入
    的頭像 發(fā)表于 07-09 14:35 ?494次閱讀
    如何入門面向自動駕駛領(lǐng)域的視覺Transformer?

    基于Transformer的目標(biāo)檢測算法難點

    理解Transformer背后的理論基礎(chǔ),比如自注意力機(jī)制(self-attention), 位置編碼(positional embedding),目標(biāo)查詢(object query)等等,網(wǎng)上的資料比較雜亂,不夠系統(tǒng),難以通過自學(xué)做到深入
    發(fā)表于 08-24 11:19 ?258次閱讀
    基于Transformer的目標(biāo)檢測算法難點

    理解KV cache的作用及優(yōu)化方法

    MQA (Multi Query Attention,多查詢注意力) 是多頭注意力的一種變體。其主要區(qū)別在于,在 MQA 中不同的注意力頭共享一個K和V的集合,每個頭只單獨保留了一份查詢參數(shù)。
    的頭像 發(fā)表于 12-04 15:24 ?5438次閱讀
    <b class='flag-5'>理解</b>KV cache的<b class='flag-5'>作用</b>及優(yōu)化方法

    php的mysqli_query的函數(shù)處理

    mysqli_query是PHP中用于執(zhí)行SQL查詢的函數(shù)。它允許我們將SQL語句發(fā)送到MySQL數(shù)據(jù)庫,并返回一個結(jié)果集(如果適用)。在本文中,我們將詳細(xì)介紹mysqli_query函數(shù)的使用,并
    的頭像 發(fā)表于 12-04 16:03 ?736次閱讀