一、現(xiàn)狀問題
國際系統(tǒng)當前的多語言是國際業(yè)務的普遍特點,僅僅倉儲管理系統(tǒng),當前系統(tǒng)語言種類已經(jīng)達到了九種,并且隨著業(yè)務的開展還在不斷的擴展,現(xiàn)有的國際系統(tǒng)支持的語言有中文、英語、日語、韓語、葡萄牙語、西班牙語、法語、德語、越南語。其中每個語言包的詞條都有上萬條,且隨著新需求的開發(fā)迭代也在不斷的新增,語言包的不斷擴展和詞條的不斷增加,詞條翻譯的簡潔性、專業(yè)性和時效性就直接影響了業(yè)務的開展和需求的交付速度,迭代的完成效率。更多完整的系統(tǒng)多語言解決方案參見: 系統(tǒng)國際化之多語言解決方案
??
國際的系統(tǒng)不僅僅是語言多、詞條多,而且基本涵蓋了供應鏈體系的所有核心系統(tǒng),在這些系統(tǒng)的詞條翻譯也缺少統(tǒng)一的國際專業(yè)術語,相同的業(yè)務釋義在不同的業(yè)務條線就存在各種名字,內(nèi)部溝通不僅費時費力,在客戶使用京東系統(tǒng)時也會造成一些困惑。
二、分析原因
在新語言的不斷新增過程中,每次新增一種語言,一般的流程是研發(fā)提供全套的待翻譯詞條,業(yè)務找到對口的翻譯公司按照詞條和我們提供的語境、場景翻譯成對應的語言,研發(fā)根據(jù)翻譯公司提供的詞條生成新的語言包添加到系統(tǒng)中。但是標準和專業(yè)的工作流程往往實現(xiàn)起來存在困難,從“成本、效率、體驗”的角度出發(fā),總不能研發(fā)每次做一個需求都要找一遍翻譯公司吧?隨著語言包的不斷新增和各種需求的不斷迭代,所有的翻譯都需要專業(yè)翻譯公司介入基本是不太現(xiàn)實的,這種工作流程方式既增加了成本,又影響了交付效率。在以前沒有大模型的時候,一些簡單的翻譯基本都是借助各類翻譯平臺實現(xiàn)詞語的直譯。隨著GPT的出現(xiàn),我們開始使用GPT替換了人工翻譯和翻譯平臺的直譯,翻譯的準確性對比其他翻譯工具更加準確,對比人工翻譯成本降低了,效率提高了,且準確性也能得到一定的保障。
不論是人工翻譯還是GPT的AI智能翻譯,都不能達到國外專業(yè)業(yè)務系統(tǒng)的簡潔和準確,但是想要做的特別專業(yè)就需要請專業(yè)的外部翻譯公司,無疑又增加了成本的支出,有沒有一種既能讓系統(tǒng)逐步迭代的越來越完美又能降低成本的辦法呢?
其實,在多語言方面,“用戶”就是最專業(yè)的專家。他們對系統(tǒng)熟悉以后,在特定的場景和語境下,是最專業(yè)的人。如果他們能夠在線修訂系統(tǒng)中的各種詞匯,是不是就可以解決這個問題?
三、計劃目標
1.實時多語言支持:
?利用大模型的翻譯能力,實現(xiàn)對新增語言的快速響應和實時翻譯,從而加速國際系統(tǒng)對新語言的支持。
2.提升翻譯質(zhì)量:
?通過大模型對歷史翻譯數(shù)據(jù)的學習,提高翻譯的專業(yè)性和準確性,減少人工干預,提升整體翻譯質(zhì)量。
3.提高詞條更新效率:
?通過“詞條管家”功能,允許用戶在線即時修改詞條,利用大模型提供智能建議和自動更正,大幅提升詞條更新的速度。
4.優(yōu)化用戶參與流程:
?鼓勵用戶參與詞條的修訂,利用大模型分析用戶反饋,快速響應用戶需求,提升用戶參與度和滿意度。
5.降低成本:
?減少對專業(yè)翻譯公司的依賴,通過大模型輔助的自動化翻譯和用戶社區(qū)的參與,有效降低翻譯和更新的成本。
6.增強系統(tǒng)的智能化:
?利用大模型對用戶行為和詞條使用模式的分析,實現(xiàn)智能化的詞條推薦和預測性更新,進一步提升系統(tǒng)的智能化水平。
7.持續(xù)學習和優(yōu)化:
?大模型將持續(xù)從用戶修訂、審批流程和系統(tǒng)反饋中學習,不斷優(yōu)化翻譯和更新流程,實現(xiàn)持續(xù)的性能提升
充分利用大模型的強大計算和學習能力,實現(xiàn)多語言支持的自動化、智能化,從而顯著提升整個系統(tǒng)的效率和性能。
四、實現(xiàn)步驟
4.1 建設國際物流術語詞條庫
建設國際系統(tǒng)統(tǒng)一使用的國際專業(yè)術語詞條庫,這個詞條庫將現(xiàn)有各個系統(tǒng)已有詞匯匯集整理以后形成一套大家都在使用的標準國際專業(yè)術語詞條,后續(xù)新增的需求將優(yōu)先從詞條庫中選擇現(xiàn)有詞條,沒有的詞條需要產(chǎn)品新增,產(chǎn)品新增完成以后前端研發(fā)就會引用該詞條到各自的系統(tǒng)中。
??
使用技術手段,讓用戶能夠在線修訂系統(tǒng)中的各種詞條和提示語,經(jīng)過審批流程以后,詞條、提示語就能夠生效并最終應用于系統(tǒng)中。
4.2 哪里不對改哪里,詞條管家秒更新
在系統(tǒng)中集成了自動劃詞修改功能,該功能允許用戶在瀏覽前端頁面時,對識別出的不恰當或過時的詞條進行即時修改。
1.劃詞選中:用戶在前端頁面中發(fā)現(xiàn)需要修訂的詞條后,可以通過劃詞操作快速選中該詞條。
2.彈出更正窗口:選中詞條后,系統(tǒng)會自動彈出一個更正窗口,引導用戶輸入修訂后的詞條內(nèi)容。
3.審批流程:用戶輸入新詞條并提交后,系統(tǒng)將啟動審批流程。這一流程確保了詞條修改的專業(yè)性和準確性。
4.自動生效:一旦新詞條通過審批,修改將被自動應用并即時生效,從而保證了詞條庫的時效性和可靠性。
通過這一流程,我們不僅提高了詞條更新的效率,還通過審批機制確保了詞條內(nèi)容的質(zhì)量和權(quán)威性。
??
4.3 架構(gòu)實現(xiàn)
整體架構(gòu)設計
??
4.3.1 大模型翻譯
使用集團提供的大模型平臺GPT、言犀等,對需要翻譯的語言包或者新增詞條部分進行定制化翻譯,方便系統(tǒng)很快速的擴展新的語言包。對國際術語詞條庫的內(nèi)容進行實時在線翻譯,新增詞條時自動根據(jù)母語(中文)翻譯出其他語言的結(jié)果供產(chǎn)品參考。
內(nèi)容沉淀:在翻譯過程中內(nèi)置了多種專業(yè)詞條庫,包括敏感詞、商品名稱、報關地址、各個國家的地址信息等,在翻譯的同時還會沉淀下來,形成專業(yè)的術語庫,為后續(xù)其他業(yè)務提供模塊化的支撐。
規(guī)則約束:在翻譯時,會在系統(tǒng)中內(nèi)置一系列的邏輯,確保翻譯出來的結(jié)果符合各個語境下的習慣,例如英語的詞匯翻譯結(jié)果一般都是首字母大寫,在進行英語簡拼時,一般后面都會帶個英文的“.”來標識。日本的地址信息一般是按照都道府縣、市、區(qū)一級級,類似于中國的省市縣,在翻譯日本地址信息也會嚴格遵照日本的地址規(guī)范,這些都是系統(tǒng)內(nèi)置的能力。
話術集成:對不同的翻譯場景,在使用時會使用已經(jīng)培訓好的話術,根據(jù)需要的不同場景自動翻譯提煉。
結(jié)果糾錯:大語言模型對于翻譯的結(jié)果不是穩(wěn)定可靠的,經(jīng)常會因為需要翻譯的話術存在歧義導致整體翻譯的結(jié)果不對,或者翻譯出來的內(nèi)容不是純粹的翻譯結(jié)果而失敗,在進行翻譯時,根據(jù)多種規(guī)則判斷翻譯的結(jié)果是否是正常的翻譯內(nèi)容,包括翻譯結(jié)果的長度是否和預期差異較大,包括翻譯的結(jié)果是否是純粹的結(jié)果而不是帶了一些其他的干擾詞匯等等最終實現(xiàn)翻譯結(jié)果與預期一致。
?
??
大模型自動化輔助翻譯:在新增加詞條時,用戶選擇語言后,利用大模型得到相對應的翻譯輔助用戶,可直接使用或在此基礎上進行調(diào)整,大大降低翻譯成本。
??
4.3.2 多語言線上化
將多語言包上傳至云存儲,在每次更新翻譯內(nèi)容并審批通過時自動更新云存儲的文件。
??
4.3.3 自動版本更新
審批通過以后自動生成新的版本,在前端拉取語言版本時自動拉取的就是最新版本的語言包。系統(tǒng)底層存儲了各個語言的版本號,和云存儲的文件對應在一起。
??
4.3.4 自動化詞條更新技術
自動化詞條更新技術,旨在提升詞條更新的效率和專業(yè)性。
效率:具體而言,當用戶在前端界面啟用錨點編輯功能并選中特定詞條時,系統(tǒng)將自動觸發(fā)并展示更新界面。該界面引導用戶輸入新的詞條內(nèi)容,隨后前端將這些更改實時轉(zhuǎn)化為一個待審批的詞條替換任務。
專業(yè)性:此任務隨后被送至管理員端,由具備相應權(quán)限的管理員進行審核。審批流程不僅確保了詞條更新的合法性和準確性,同時也維護了內(nèi)容的質(zhì)量和一致性。
一旦管理員批準了該詞條替換任務,所提議的詞條更改將被自動應用并立即生效,從而實現(xiàn)了對語言庫的快速而審慎的更新。
4.3.5 異常兼容降級
在用戶訪問應用時,優(yōu)先拉取最新的語言包,同時存儲該版本到本地,下次進入獲取各語言包版本,和本地緩存的對應語言包版本進行對比,如果對應語言的版本有更新,則獲取新資源同時對本地資源更新。
同時在每次構(gòu)建時自動拉取最新的語言包并更新,同時該版本作為base(基礎)版本,當自動更新詞條服務不可用時進行降級處理,繼續(xù)引用編譯構(gòu)建時的語言包,不影響系統(tǒng)的正常使用。
??
本地緩存的語言包:
??
通過這種降級方案,我們可以實現(xiàn):
1.無縫更新:用戶可以自動獲取最新的語言包,無需手動干預,提升了用戶體驗。
2.離線支持:即使遠程服務不可用,應用也能通過本地緩存的語言包繼續(xù)運行,保證了應用的可用性。
3.版本兼容性:通過版本檢查確保用戶總是使用與應用兼容的語言包,避免因版本不匹配導致的潛在問題。
4.構(gòu)建時更新:在構(gòu)建應用時自動更新語言包,確保部署的應用總是使用最新的語言資源。
5.資源效率:通過本地緩存減少了重復從遠程服務器拉取相同資源的次數(shù),節(jié)省了網(wǎng)絡帶寬和服務器負載。
6.容錯性:即使在更新過程中出現(xiàn)問題,系統(tǒng)也可以回退到穩(wěn)定的base版本,保持系統(tǒng)的穩(wěn)定性。
7.易于維護:清晰的版本管理和更新邏輯簡化了維護工作,便于開發(fā)者管理和部署語言資源。
五、實現(xiàn)效果
5.1 人效提升
每個迭代周期按照經(jīng)驗更正20個不規(guī)范詞條左右,并且每個迭代周期上線1.5次,那么每個月可以節(jié)省大約2人日的工作量。這種效率的提升,不僅提高了國際化產(chǎn)品的專業(yè)力,還提高了團隊的整體生產(chǎn)力。
5.1.1 系統(tǒng)國際化快速復用
在傳統(tǒng)的國際化流程中,每當系統(tǒng)需要支持新的語言,通常需要進行繁瑣的翻譯和本地化工作。然而,通過引入大型模型的翻譯能力,我們能夠?qū)崿F(xiàn)快速的語言版本定制和更新。例如,當系統(tǒng)需要支持一種新的語言時,可以利用大模型快速翻譯系統(tǒng)代碼中的詞條,然后通過自動化工具將這些詞條集成到系統(tǒng)中,無需進行復雜的手動操作。
此外,通過建立國際物流術語詞條庫,我們可以確保不同系統(tǒng)之間的術語統(tǒng)一,避免了重復翻譯和不一致的問題。這種方法不僅提高了翻譯的準確性,還大大減少了研發(fā)在多語言支持上的工作量,使得國際化過程更加高效。
??
5.1.2 詞條校準快速高效
在每個迭代的需求開發(fā)時,不再因為詞條的更新需要研發(fā)不斷的發(fā)版,每次發(fā)版發(fā)布多套環(huán)境,而是系統(tǒng)自動更新自動生效。只需要在詞條管家中修改以后等待審批人審批以后即可生效,極大的縮短詞條的生效時間,助力敏捷提效??焖俑缓线m的詞條,省去各個中間環(huán)節(jié)。
原有流程完成一次術語修改需要經(jīng)過10個流程節(jié)點才能完成一次術語的修改和生效,每次修改需要2個多小時,主要花費在部署多套環(huán)境上。增加了術語庫的能力以后,每次修改術語需要4個流程節(jié)點,生效時間只需要15分鐘左右,真正實現(xiàn)了即改即生效,生效即可見的效果。
??
5.2 質(zhì)量提升
5.2.1 物流術語專業(yè)統(tǒng)一
為了解決翻譯本土化的難題,我們嘗試了多種方案。最直接的方法是依賴第三方翻譯服務商,但這種做法存在多個問題。首先,成本較高;其次,翻譯的準確性無法保證。主要問題是,我們的每個系統(tǒng)都具有專業(yè)性,日常使用中看似簡單的詞匯,翻譯公司可能無法準確理解其含義,從而導致翻譯結(jié)果無法準確表達原意。因此,這種方法產(chǎn)生的結(jié)果并不理想。隨著越來越多的系統(tǒng)在做國際化,我們發(fā)現(xiàn)同行業(yè)系統(tǒng)之間有很多詞匯是相同的,但是不同系統(tǒng)的翻譯結(jié)果可能有差異,無法做到術語統(tǒng)一,這會給用戶帶來困擾,對外體驗不好,因此我們孕育出想做一個行業(yè)詞條庫的想法。
通過國際供應鏈各個系統(tǒng)詞條匯總,統(tǒng)計出高頻詞條,通過GPT智能翻譯加人工校對,確保詞條翻譯的準確性和本土化,有了公共詞庫作為基礎,所有系統(tǒng)多語言翻譯優(yōu)先查詢公共詞庫,確保不同系統(tǒng)術語統(tǒng)一,其次才是復雜文本GPT智能翻譯。
國際公共詞庫成型示意圖:
??
通過現(xiàn)有國際物流系統(tǒng)的詞條,我們通過使用頻率篩選出高頻詞條,通過GPT翻譯加人工校驗的方式進行詞條沉淀,考慮到不同位置展示的詞條書寫格式的差異,詞條類型根據(jù)不同的用途進行分類管理。比如考慮到菜單類詞條可能很多英語寫法喜歡縮寫,會將頁面菜單詞條和異常提示詞條分類存放,使用的時候同樣的詞匯會根據(jù)具體的類型進行翻譯。
??
?
通過公共詞庫的實踐,我們避免了很多詞匯的二次翻譯,同時翻譯結(jié)果的準確性和本土化程度大幅提高,隨著詞條沉淀的增多,發(fā)揮的作用將會越大,所以,如果你的系統(tǒng)正在做國際化,強烈推薦沉淀一份公共詞庫,可以讓系統(tǒng)翻譯更加統(tǒng)一,更加精確。
六、總結(jié)規(guī)劃
當前國際物流術語詞條庫已經(jīng)開始建設,但是不同語言在系統(tǒng)層面如何精簡的體現(xiàn)且能被用戶清晰的知曉還需要不斷的摸索和提煉,也希望大家獻言獻策,不斷完善。
國際在多語言的開發(fā)過程中不斷總結(jié)歸納,創(chuàng)新性的將國際的多語言整理成了國際術語詞條庫,為國際的專業(yè)術語統(tǒng)一打下了良好的基礎。利用技術優(yōu)勢,將語言包放置到了線上,在打包時自動更新拉取,同時提供線上所見即所得的詞條修改能力,不斷提高多語言的專業(yè)性。
附錄:系統(tǒng)國際化技術解決方案系列—— 系統(tǒng)國際化之多語言解決方案
審核編輯 黃宇
-
GPT
+關注
關注
0文章
347瀏覽量
15182 -
大模型
+關注
關注
2文章
2136瀏覽量
1982
發(fā)布評論請先 登錄
相關推薦
評論