0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

第二屆大會(huì)回顧第12期 | ClarifyGPT: 基于交互式需求澄清的大模型代碼生成框架

OpenHarmony TSC ? 來(lái)源:OpenHarmony TSC ? 作者:OpenHarmony TSC ? 2024-02-25 17:58 ? 次閱讀

演講嘉賓 | 石 琳

回顧整理 | 廖 濤

排版校對(duì) | 李萍萍

嘉賓介紹

開(kāi)發(fā)者工具分論壇

石琳,北京航空航天大學(xué)軟件學(xué)院教授,CCF高級(jí)會(huì)員,2022年度中國(guó)科學(xué)院軟件研究所杰出青年科技人才。研究方向?yàn)?a target="_blank">智能軟件工程,包括代碼智能、智能需求工程、經(jīng)驗(yàn)軟件工程、開(kāi)源軟件、可信AI等。曾在軟件工程、人工智能領(lǐng)域的高水平國(guó)際會(huì)議發(fā)表論文50余篇,三次獲得杰出論文獎(jiǎng);主持參與多項(xiàng)國(guó)家自然科學(xué)基金項(xiàng)目、國(guó)家重點(diǎn)研發(fā)項(xiàng)目等;擔(dān)任多個(gè)國(guó)際知名會(huì)議期刊審稿人。

視頻回顧

打開(kāi)嗶哩嗶哩APP,觀看更清晰視頻

正文內(nèi)容

隨著AI大模型能力的大幅提升,軟件開(kāi)發(fā)已經(jīng)逐步走向新智能化時(shí)代。然而,目前代碼大模型在可靠性、隱私和合規(guī)以及用戶意圖識(shí)別等方面仍存在一定局限性。如何基于交互式需求澄清方法,讓大模型更好地理解用戶意圖,并給出更準(zhǔn)確的答案?北京航空航天大學(xué)教授石琳在第二屆OpenHarmony技術(shù)大會(huì)上進(jìn)行了精彩分享。

72dbb404-cf89-11ee-b759-92fbcf53809c.png

2022年11月,OpenAI發(fā)布ChatGPT,利用GitHub數(shù)據(jù)與RLFH強(qiáng)化學(xué)習(xí)技術(shù),在輔助編程取得進(jìn)展;2023年1月,微軟Copilot平臺(tái)用戶超過(guò)1億,CEO表示Copilot很快就會(huì)替代程序員完成80%的代碼開(kāi)發(fā)。在GitHub的報(bào)告中,使用Copilot的開(kāi)發(fā)者的開(kāi)發(fā)效率幾乎提升了一倍,一個(gè)用Copilot的初學(xué)者就能夠像專業(yè)程序員一樣,從零開(kāi)始開(kāi)發(fā)出最小可行產(chǎn)品程序。此外,清華大學(xué)推出的ChatDev項(xiàng)目,支持多個(gè)智能體分工合作,能夠根據(jù)用戶指令生成休閑小游戲、效率管理工具、繪畫(huà)板、數(shù)學(xué)計(jì)算器、網(wǎng)絡(luò)爬蟲(chóng)等軟件。

通過(guò)前文可知,代碼大模型在軟件開(kāi)發(fā)方面“一鳴驚人”,給開(kāi)發(fā)者們帶來(lái)了極大的便利。但是,代碼大模型的快速發(fā)展同時(shí)也帶來(lái)了新的問(wèn)題,如:

模型問(wèn)題:可靠性、幻覺(jué)、更新、形式重于內(nèi)容

數(shù)據(jù)問(wèn)題:數(shù)據(jù)演化、質(zhì)量問(wèn)題、安全問(wèn)題、隱私和合規(guī)

應(yīng)用問(wèn)題:用戶意圖不明確、復(fù)雜問(wèn)題抽象和分解、項(xiàng)目上下文、領(lǐng)域?qū)I(yè)知識(shí)、遺留系統(tǒng)維護(hù)

7302e79a-cf89-11ee-b759-92fbcf53809c.png

其中,用戶的意圖表述不明確是代碼大模型在實(shí)踐中遇到的巨大阻礙。開(kāi)發(fā)者想寫(xiě)出一個(gè)清晰明確且全面的Prompt并不容易。既然開(kāi)發(fā)者寫(xiě)的Prompt不清晰,有沒(méi)有辦法讓大模型幫開(kāi)發(fā)者改寫(xiě)?目前,業(yè)界已經(jīng)有一些嘗試,例如GPT Engineer。GPT Engineer是一個(gè)基于需求描述自動(dòng)生成項(xiàng)目源碼的開(kāi)源項(xiàng)目,主打輕量,靈活生成項(xiàng)目源碼,可以在AI生成與人工生成之間進(jìn)行切換。在接收到Prompt時(shí),GPT Engineer不會(huì)直接生成代碼,而是先梳理有哪些事項(xiàng)需要用戶進(jìn)一步澄清,然后讓用戶把需要澄清的事項(xiàng)輸入后,再進(jìn)一步生成代碼。然而,GPT Engineer經(jīng)常會(huì)問(wèn)一些在Prompt中已經(jīng)提供了答案的問(wèn)題,對(duì)用戶造成困擾。

如何找到Prompt中“不清楚”的地方,從而進(jìn)行精準(zhǔn)提問(wèn)?石琳教授所在團(tuán)隊(duì)提出了ClarifyGPT工具。ClarifyGPT會(huì)先識(shí)別是否應(yīng)該提問(wèn),再利用大模型生成問(wèn)題。

ClarifyGPT的模塊1:基于測(cè)試結(jié)果的代碼多樣性評(píng)價(jià)模塊

如何判斷是否應(yīng)該向用戶做Prompt澄清呢?這里我們從代碼大模型的輸出結(jié)果出發(fā),提出一個(gè)基本假設(shè):如果Prompt清晰,大模型生成的代碼應(yīng)該行為一致;如果Prompt模糊,大模型生成的代碼可能五花八門(mén)。因此,ClarifyGPT會(huì)先通過(guò)種子輸入進(jìn)行代碼多樣性測(cè)試,并基于測(cè)試結(jié)果判斷是否要做向用戶做Prompt的澄清。

具體而言,(1)先進(jìn)行種子測(cè)試輸入初始化。構(gòu)建prompt用于生成種子輸入,Prompt包含三部分:Instruction,Demonstrations,Query。將Prompt輸入LLM中生成一些測(cè)試輸入,并用它們初始化一個(gè)種子池;(2)再進(jìn)行類(lèi)型感知的測(cè)試輸入變異(采用了標(biāo)準(zhǔn)的基于變異的模糊流程)。在每次迭代時(shí),從種子池中隨機(jī)選擇一個(gè)輸入;對(duì)于選定的輸入,我們檢查其數(shù)據(jù)類(lèi)型并執(zhí)行與其類(lèi)型一致的單個(gè)變異操作以創(chuàng)建新的測(cè)試用例;完成一輪突變后,我們將新生成的輸入添加到種子池中,并重復(fù)上述過(guò)程,直到獲得所需的生成輸入數(shù)量。

7318fa44-cf89-11ee-b759-92fbcf53809c.png

ClarifyGPT的模塊2:基于推理的LLM問(wèn)題生成模塊

在確定了需要向用戶做Prompt澄清后,應(yīng)該問(wèn)什么內(nèi)容呢?為了解決這個(gè)以問(wèn)題,ClarifyGPT會(huì)進(jìn)一步分析代碼的細(xì)節(jié)差異,區(qū)分不一致的代碼,比較solution的不同點(diǎn),再基于推理進(jìn)行LLM問(wèn)題生成。

具體而言,首先生成中間推理步驟(分析導(dǎo)致歧義的因素),然后基于這些中間推理步驟產(chǎn)生最終結(jié)果(有針對(duì)性的澄清問(wèn)題)。此外,ClarifyGPT鼓勵(lì)LLM進(jìn)行“超前規(guī)劃”,使他們能夠更好地利用他們的推理和理解能力來(lái)提高生成問(wèn)題的質(zhì)量。

73279cca-cf89-11ee-b759-92fbcf53809c.png

經(jīng)過(guò)評(píng)測(cè),ClarifyGPT將GPT-4在MBPP-sanitized上的表現(xiàn)(Pass@1)從70.96%提高到80.8%;將MBPP-ET的性能從51.52%提高到60.19%。相對(duì)改善平均為15.35%,優(yōu)于基線。且增加Prompt中示例的數(shù)量會(huì)帶來(lái)ClarifyGPT性能提升。

ClarifyGPT是一個(gè)交互式代碼生成框架,會(huì)引導(dǎo)用戶先澄清意圖,再利用大模型幫助用戶生成代碼。后續(xù),ClarifyGPT也會(huì)在其他生成類(lèi)任務(wù)上進(jìn)行進(jìn)一步的研究和探索。

大模型加速了研發(fā)人員的工作效率,但同時(shí)也提出了新的挑戰(zhàn)。我們必須大膽嘗試LLM在改進(jìn)軟件開(kāi)發(fā)方面的潛力,但同時(shí)也要謹(jǐn)慎行事,不要忘記工程思維、嚴(yán)謹(jǐn)性和經(jīng)驗(yàn)驗(yàn)證的基本原則。 【材料分享】 [1] 論文原文下載 http://arxiv.org/abs/2310.10996 [2] 開(kāi)源原型工具 https://github.com/ClarifyGPT/ClarifyGPT(點(diǎn)擊閱讀原文可跳轉(zhuǎn))

E N D

關(guān)注我們,獲取更多精彩。

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    28877

    瀏覽量

    266254
  • 代碼
    +關(guān)注

    關(guān)注

    30

    文章

    4671

    瀏覽量

    67772
  • OpenHarmony
    +關(guān)注

    關(guān)注

    25

    文章

    3548

    瀏覽量

    15746
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    2136

    瀏覽量

    1985
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    第二屆大會(huì)回顧24 | 面向OpenHarmony的軟件工程研究:機(jī)遇與挑戰(zhàn)

    隨著萬(wàn)物智聯(lián)時(shí)代的到來(lái),OpenHarmony作為一個(gè)開(kāi)源的智能終端設(shè)備操作系統(tǒng)的框架和平臺(tái),將會(huì)遇到哪些機(jī)遇和挑戰(zhàn)?北京航空航天大學(xué)教授、OpenHarmony技術(shù)俱樂(lè)部主任黎立在第二屆OpenHarmony技術(shù)大會(huì)上帶來(lái)了精
    的頭像 發(fā)表于 08-07 18:14 ?651次閱讀
    <b class='flag-5'>第二屆</b><b class='flag-5'>大會(huì)</b><b class='flag-5'>回顧</b><b class='flag-5'>第</b>24<b class='flag-5'>期</b> | 面向OpenHarmony的軟件工程研究:機(jī)遇與挑戰(zhàn)

    第二屆英飛凌汽車(chē)創(chuàng)新峰會(huì)IACE開(kāi)幕在即

    第二屆英飛凌汽車(chē)創(chuàng)新峰會(huì)IACE開(kāi)幕在即
    的頭像 發(fā)表于 05-20 11:42 ?423次閱讀
    <b class='flag-5'>第二屆</b>英飛凌汽車(chē)創(chuàng)新峰會(huì)IACE開(kāi)幕在即

    報(bào)名開(kāi)啟!第二屆OpenHarmony開(kāi)發(fā)者大會(huì)2024重磅來(lái)襲!

    /jishu_2429449_1_1.html 預(yù)約直播: 第二屆OpenHarmony開(kāi)發(fā)者大會(huì)主論壇 第二屆OpenHarmony開(kāi)發(fā)者大會(huì):設(shè)備開(kāi)發(fā)分論壇
    發(fā)表于 05-14 15:23

    ?Wolfspeed榮獲2023第二屆電源行業(yè)配套品牌大獎(jiǎng)

    由世紀(jì)電源網(wǎng)主辦的 2023 第二屆電源行業(yè)配套品牌頒獎(jiǎng)典禮于 12 月 23 日在深圳圓滿落幕。
    的頭像 發(fā)表于 12-26 09:24 ?434次閱讀

    近200人共聚第二屆華南工業(yè)特種線纜線纜大會(huì)!

    第二屆華南工業(yè)特種線纜大會(huì)(以下簡(jiǎn)稱“線纜大會(huì)”)在深圳龍華順利舉行! ▲第二屆華南工業(yè)特種線纜大會(huì)現(xiàn)場(chǎng) 會(huì)議伊始,深圳市龍華區(qū)政協(xié)副主席
    的頭像 發(fā)表于 12-15 10:16 ?564次閱讀
    近200人共聚<b class='flag-5'>第二屆</b>華南工業(yè)特種線纜線纜<b class='flag-5'>大會(huì)</b>!

    實(shí)地探展 | 別樣視角一站感受第二屆OpenHarmony技術(shù)大會(huì)

    OpenHarmony技術(shù)大會(huì) 感受技術(shù)融入生活的美好瞬間! 原文標(biāo)題:實(shí)地探展 | 別樣視角一站感受第二屆OpenHarmony技術(shù)大會(huì) 文章出處:【微信公眾號(hào):OpenAtom
    的頭像 發(fā)表于 11-14 15:10 ?226次閱讀

    亮點(diǎn)速遞 | 一圖看懂第二屆OpenHarmony技術(shù)大會(huì)

    點(diǎn)擊藍(lán)字 ╳ 關(guān)注我們 開(kāi)源項(xiàng)目 OpenHarmony 是每個(gè)人的 OpenHarmony 原文標(biāo)題:亮點(diǎn)速遞 | 一圖看懂第二屆OpenHarmony技術(shù)大會(huì) 文章出處:【微信公眾號(hào):OpenAtom OpenHarmony】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
    的頭像 發(fā)表于 11-06 19:40 ?345次閱讀

    大咖金句 | 第二屆OpenHarmony技術(shù)大會(huì)演講集錦

    點(diǎn)擊藍(lán)字 ╳ 關(guān)注我們 開(kāi)源項(xiàng)目 OpenHarmony 是每個(gè)人的 OpenHarmony 第二屆OpenHarmony技術(shù)大會(huì)圓滿結(jié)束 行業(yè)大咖與開(kāi)源生態(tài)伙伴們齊聚北京 共同見(jiàn)證思潮交相輝映
    的頭像 發(fā)表于 11-06 19:40 ?414次閱讀

    高能有料 | 第二屆OpenHarmony技術(shù)大會(huì)議程速遞

    第二屆開(kāi)放原子開(kāi)源基金會(huì)OpenHarmony技術(shù)大會(huì)如約而至 讓我們一起 開(kāi)封無(wú)限驚喜的技術(shù)成果 開(kāi)放無(wú)限前沿的議題干貨 開(kāi)啟無(wú)限可能的未來(lái)之門(mén) 點(diǎn)擊此處報(bào)名參會(huì)!
    發(fā)表于 11-02 17:07

    議程直擊 | 第二屆OpenHarmony技術(shù)大會(huì)——編程語(yǔ)言及開(kāi)發(fā)框架分論壇

    點(diǎn)擊藍(lán)字 ╳ 關(guān)注我們 開(kāi)源項(xiàng)目 OpenHarmony 是每個(gè)人的 OpenHarmony 原文標(biāo)題:議程直擊 | 第二屆OpenHarmony技術(shù)大會(huì)——編程語(yǔ)言及開(kāi)發(fā)框架分論壇 文章出處:【微信公眾號(hào):OpenAtom O
    的頭像 發(fā)表于 11-01 16:10 ?326次閱讀
    議程直擊 | <b class='flag-5'>第二屆</b>OpenHarmony技術(shù)<b class='flag-5'>大會(huì)</b>——編程語(yǔ)言及開(kāi)發(fā)<b class='flag-5'>框架</b>分論壇

    議程直擊 | 第二屆OpenHarmony技術(shù)大會(huì)——應(yīng)用(北向)生態(tài)分論壇

    點(diǎn)擊藍(lán)字 ╳ 關(guān)注我們 開(kāi)源項(xiàng)目 OpenHarmony 是每個(gè)人的 OpenHarmony 原文標(biāo)題:議程直擊 | 第二屆OpenHarmony技術(shù)大會(huì)——應(yīng)用(北向)生態(tài)分論壇 文章出處:【微信公眾號(hào):OpenAtom OpenHarmony】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)
    的頭像 發(fā)表于 11-01 16:10 ?343次閱讀

    高能有料 | 第二屆OpenHarmony技術(shù)大會(huì)議程速遞

    點(diǎn)擊藍(lán)字 ╳ 關(guān)注我們 開(kāi)源項(xiàng)目 OpenHarmony 是每個(gè)人的 OpenHarmony 第二屆開(kāi)放原子開(kāi)源基金會(huì)OpenHarmony技術(shù)大會(huì)如約而至 讓我們一起 開(kāi)封無(wú)限驚喜的技術(shù)成果 開(kāi)放
    的頭像 發(fā)表于 11-01 09:25 ?297次閱讀
    高能有料 | <b class='flag-5'>第二屆</b>OpenHarmony技術(shù)<b class='flag-5'>大會(huì)</b>議程速遞

    議程直擊 | 第二屆OpenHarmony技術(shù)大會(huì)——OS安全分論壇

    E N D ??? 關(guān)注我們,持續(xù)獲取OpenHarmony技術(shù)大會(huì)最新消息! 原文標(biāo)題:議程直擊 | 第二屆OpenHarmony技術(shù)大會(huì)——OS安全分論壇 文章出處:【微信公眾號(hào):OpenHarmony TSC】歡迎添加關(guān)注
    的頭像 發(fā)表于 11-01 08:44 ?309次閱讀
    議程直擊 | <b class='flag-5'>第二屆</b>OpenHarmony技術(shù)<b class='flag-5'>大會(huì)</b>——OS安全分論壇

    技術(shù)筑生態(tài),智聯(lián)贏未來(lái) 第二屆OpenHarmony技術(shù)大會(huì)即將在京啟幕

    2023年11月4日,第二屆開(kāi)放原子開(kāi)源基金會(huì)OpenHarmony技術(shù)大會(huì)即將在北京國(guó)家會(huì)議中心盛大開(kāi)幕。本次大會(huì)由OpenAtom OpenHarmony(簡(jiǎn)稱“OpenHarmony
    發(fā)表于 10-31 11:27

    亮點(diǎn)劇透 | 第二屆開(kāi)放原子開(kāi)源基金會(huì) OpenHarmony技術(shù)大會(huì)精彩來(lái)襲

    點(diǎn)擊藍(lán)字 ╳ 關(guān)注我們 開(kāi)源項(xiàng)目 OpenHarmony 是每個(gè)人的 OpenHarmony 探討開(kāi)源創(chuàng)新實(shí)踐,共筑開(kāi)源技術(shù)未來(lái) 第二屆開(kāi)放原子開(kāi)源基金會(huì)OpenHarmony技術(shù)大會(huì) 大咖云集
    的頭像 發(fā)表于 10-27 19:50 ?500次閱讀