2023年的五月,稱得上一句AI之夏。
大模型層出不窮、扎堆發(fā)布。
這一輪由大模型推動的AI熱潮中, NLP(自然語言處理)技術(shù)與金融落地場景的結(jié)合備受期待。金融行業(yè)是數(shù)字化、智能化的先行者,也是大模型技術(shù)落地的最佳領(lǐng)域。如果將大模型的能力放在金融行業(yè)中去處理原有的任務(wù),會對很多工作產(chǎn)生顛覆性的影響。
對科技企業(yè)來說,不僅要積極參與“訓大模型”的技術(shù)競賽,更重要的是,從場景出發(fā),用最快速度完成大模型的業(yè)務(wù)落地、找到可行的產(chǎn)業(yè)邏輯。
這條“NLP+金融”的技術(shù)落地之路,度小滿已經(jīng)走了五年。作為源自百度的公司,度小滿在NLP上的積累得天獨厚。我們從度小滿NLP開始,去看看NLP與金融的可能性,以及AI走向產(chǎn)業(yè)的應(yīng)用落地是如何實現(xiàn)的。
大模型時代, 打開NLP+金融的想象力
大模型的到來,讓NLP技術(shù)在金融領(lǐng)域的應(yīng)用,打開了想象空間。
幾乎所有金融單位都要處理大量文本、文檔,NLP技術(shù)有潛力貫穿金融業(yè)務(wù)的所有環(huán)節(jié):
1.讀。超大規(guī)模的預(yù)訓練生成式大模型,能夠?qū)鹑跇I(yè)務(wù)場景中的數(shù)據(jù)信息和隱藏知識進行更高效的挖掘和理解,“多快好省”從文檔文本數(shù)據(jù)中抽取出相應(yīng)的信息,包括文檔智能信息抽取、OCR、輿情分析、暴雷事件分析、報警、風控等,提高決策能力。
比如信貸輔助決策,基于強大的語義理解能力,讀懂非結(jié)構(gòu)化數(shù)據(jù),包括財務(wù)報告自動化解析、數(shù)據(jù)智能挖掘、信貸流水材料智能處理、宏觀行業(yè)分析、風險事件傳導(dǎo)分析等。
在金融領(lǐng)域,征信報告是識別個人信用的最重要風控手段,小微企業(yè)融資難,一個主要原因是個人征信報告中存在大量非結(jié)構(gòu)化數(shù)據(jù),很難用傳統(tǒng)的數(shù)據(jù)處理方式進行分析。度小滿“智能化征信解讀中臺”,將NLP、圖算法應(yīng)用在征信報告的解讀上,能夠?qū)蟾娼庾x出40萬維的風險變量,將銀行風控模型的風險區(qū)分度提升了26%。
- 寫。利用大模型的生成能力,自動化生成金融信息的抽取匯總、年報、行情預(yù)判、客戶畫像、營銷方案等,成為金融從業(yè)人員的“全能助理”, 提升金融機構(gòu)的效率。
3.說?;谧匀徽Z言的通用對話能力,更智能的任務(wù)式對話理解,打造全新的的智能客服、智能交互服務(wù),例如 “超級金融顧問”,提供專業(yè)建議和方案輔助交流,快速高效低成本地響應(yīng)用戶需求,讓金融更有溫度。
從“智能”到“致用”:度小滿的NLP之路
自然語言處理是人工智能皇冠上的明珠,但在大語言模型展露出強大的通用能力之前,如何用這顆“明珠”洞察金融數(shù)據(jù),沒有現(xiàn)成的路可走,全世界專注做NLP公司都比較少。2018年的時候,金融科技公司成立專門的NLP團隊的更是鮮見,NLP在金融領(lǐng)域的應(yīng)用落地也相對有限。
度小滿則走出了一條獨特的NLP之路。2018年創(chuàng)立之初,度小滿就看到了“NLP+金融”的潛力,開始進行相應(yīng)的產(chǎn)業(yè)布局。
首先是人才。人才是創(chuàng)新的源頭。作為源自百度的公司,度小滿在NLP技術(shù)上的人才儲備可為得天獨厚。度小滿CTO許冬亮,2005年從清華大學計算機系人工智能實驗室畢業(yè)后加入百度,三年多時間成長為百度搜索算法領(lǐng)域的領(lǐng)軍人物,在自然語言處理、搜索算法及架構(gòu)、知識圖譜、LBS、智能營銷及反欺詐等領(lǐng)域?qū)移齐y關(guān)。度小滿技術(shù)委員會執(zhí)行主席楊青,曾任百度主任架構(gòu)師,有著豐富的技術(shù)應(yīng)用實踐經(jīng)驗。
有了人才作為技術(shù)創(chuàng)新的驅(qū)動力,度小滿在NLP前沿領(lǐng)域持續(xù)探索,并不斷斬獲成果。
2021年,在微軟舉辦的MS MARCO 比賽中的文檔排序Document Ranking(文檔排序)任務(wù)中,度小滿的AI-NLP團隊排名第一并刷新紀錄。2022年,團隊研發(fā)的軒轅 (XuanYuan) 預(yù)訓練模型也在中文語言理解領(lǐng)域最具權(quán)威性的測評基準之一CLUE分類任務(wù)中排名第一。度小滿AI-Lab在預(yù)訓練模型、用戶表示、序列建模等NLP任務(wù)相關(guān)算法也取得了突破性進展,相關(guān)論文被收入NLP頂會。
更重要的是,度小滿的NLP之路并沒有止步于學術(shù)賽場和實驗室,而是積極走向產(chǎn)業(yè),推動NLP技術(shù)與金融場景緊密結(jié)合,典型的就是信貸風控場景的征信報告解讀。
2023年,由度小滿建設(shè)的“智能化征信解讀中臺”工程,將大型語言模型 LLM、圖算法應(yīng)用在征信報告的解讀上,榮獲了 “吳文俊人工智能科學技術(shù)獎”,度小滿也憑借該工程成為唯一入選的金融科技公司。
今年以來,大語言模型的爆發(fā),讓NLP這一技術(shù)路線成為科技公司和大眾關(guān)注的焦點。
2023年2月,度小滿成為百度文心一言首批生態(tài)合作伙伴,推動對話式語言模型技術(shù)在國內(nèi)金融場景的落地應(yīng)用。
大語言模型掀起的AI熱潮還在持續(xù),大眾的關(guān)注焦點,也從“訓大模型”,擴展到了“用大模型”的長線故事。
度小滿作為一支超前布局、技術(shù)前沿性強、與金融產(chǎn)業(yè)接軌十分成熟的NLP力量,有望跑通大模型從技術(shù)到產(chǎn)業(yè)應(yīng)用的落地之路。
審核編輯 黃宇
-
AI
+關(guān)注
關(guān)注
87文章
29824瀏覽量
268117 -
nlp
+關(guān)注
關(guān)注
1文章
486瀏覽量
21987
發(fā)布評論請先 登錄
相關(guān)推薦
評論