0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

大數(shù)據(jù)實時鏈路備戰(zhàn)——數(shù)據(jù)雙流高保真壓測

京東云 ? 來源:京東零售 京東零售 ? 作者:京東零售 京東零售 ? 2024-10-22 14:40 ? 次閱讀

作者:京東零售 京東零售

一、大數(shù)據(jù)雙流建設

1.1 數(shù)據(jù)雙流

大數(shù)據(jù)時代,越來越多的業(yè)務依賴實時數(shù)據(jù)用于決策,比如促銷調(diào)整,點擊率預估、廣告分傭等。為了保障業(yè)務的順利開展,也為了保證整體大數(shù)據(jù)鏈路的高可用性,越來越多的0級系統(tǒng)建設雙流,以保證日常及大促期間數(shù)據(jù)流的穩(wěn)定性。建設核心數(shù)據(jù)鏈路雙機房,雙流雙活。同時雙流建設需要整條鏈路上的所有環(huán)節(jié)雙機房部署,占用了雙倍的物理資源;整個建設過程要協(xié)同上下游各環(huán)節(jié)(數(shù)據(jù)生產(chǎn)方、數(shù)倉加工方、中間處理節(jié)點、業(yè)務消費方),也會消耗大量的溝通建設成本。為了達到資源消耗和業(yè)務穩(wěn)定性的平衡,特制定雙流建設標準和實施流程以引導業(yè)務方合理評估雙流需求,順利開展雙流建設實施。

1.2 數(shù)據(jù)雙流的建設評估維度和標準

編號 維度 評估標準 標準定義 & 備注
1 系統(tǒng)等級 0級系統(tǒng) 0級系統(tǒng)為公司最核心的業(yè)務服務系統(tǒng),一旦發(fā)生不可用會直接影響黃金交易流程或影響公司名譽、品牌、集團戰(zhàn)略、營銷計劃等,可能造成P0-P2級事故發(fā)生。0級系統(tǒng)的定義以零售子集團線上事故定級、定責及扣分標準中4.1-4.2定義為準。0級系統(tǒng)會在服務器資源和人力資源方面有傾斜,但0級系統(tǒng)要確保高可用,會與事故級別緊密關聯(lián)。
2 任務等級 L0實時任務 服務線上0級系統(tǒng)的任務具體任務等級細側(cè)參見實時數(shù)據(jù)平臺作業(yè)分級管理規(guī)范協(xié)議等級設置參考說明。
3 物理資源 業(yè)務方申請并且承擔雙流建設所需要的物理資源消耗物理資源成本合理。備流按照主流80%的承載量建設(資源的80%) 業(yè)務方需要提供具體的物理資源信息:a. 物理資源成本包括存儲資源、計算資源、帶寬、隊列資源等。b. 涵蓋上游生產(chǎn)系統(tǒng)存儲、數(shù)倉加工方、中間處理節(jié)點、業(yè)務消費方等各個環(huán)節(jié)。c. 評估流量和交易兩個方面
4 數(shù)據(jù)時效性 大促0點(或?qū)鄳獦I(yè)務高峰點)數(shù)據(jù)時效性要求<=20分鐘 或平時數(shù)據(jù)時效性要求<=40分鐘 ?
5 數(shù)據(jù)峰值 大促峰值預估(交易、流量)平時峰值預估(交易、流量) 數(shù)據(jù)峰值作為主要的參考,但是新系統(tǒng)在沒有數(shù)據(jù)參考情況下,會根據(jù)業(yè)務是否是集團戰(zhàn)略這一條做適當調(diào)整。其它條件滿足,但是數(shù)據(jù)峰值很小的情況下,一般不建議雙流,特殊情況另討論。
6 生產(chǎn)源 生產(chǎn)源必須是雙機房部署 ?
7 業(yè)務場景 數(shù)據(jù)缺失會造成XX級事故 業(yè)務方提供完整的業(yè)務場景和發(fā)生故障時的影響以幫助評估

二、大數(shù)據(jù)雙流憋壩高保真壓測

2.1 雙流憋壩壓測

從21年大促備戰(zhàn)開始,大數(shù)據(jù)側(cè)核心數(shù)據(jù)鏈路,從單模塊單任務的壓測,轉(zhuǎn)向全鏈路憋壩壓測,把泄洪閘口上移,壓測范圍覆蓋更廣,流量和交易同時泄洪,高保真大促網(wǎng)絡峰值,資源競爭場景,同時數(shù)據(jù)產(chǎn)品(黃金眼、商智、作戰(zhàn)指揮室大屏)會在泄洪時同時進行讀查詢的壓測,模擬大促讀寫峰值并行的真實大促場景。

2.2 雙流憋壩的壓測目標制定

(1) 壓測目標設定,一般會參照歷史峰值和市場預估,給出核心交易、流量主題鏈路峰值預估,例如22年雙11的1.2倍。關鍵的數(shù)據(jù)流topic,會給出預估消費峰值供下游參考,如下表格所示(數(shù)據(jù)涉及保密不做詳細展示)

wKgZoWcXSMaASlIYAACZhZdWBTY87.jpeg

2.3 雙流憋壩的壓測方案

(1)交易的憋壩方式,通過停止同步任務憋單 ,交易雙流架構(gòu)圖如下所示:

wKgaoWcXSMaAHd7JAAEkdT3Qvb4096.png

(2)流量的憋壩方式,流量無損憋壩壓測是通過停止采集服務寫JDQ寫集群的方式憋流,不參與壓測的業(yè)務方,可以切換到“JDQ4瀾滄江_點擊流新建流”(壓測期間新建JDQ寫集群)保證下游業(yè)務可以在憋流壓測期間,正常消費流量實時數(shù)據(jù),做到無損。

wKgZoWcXSMiAekpnAAZPZg0edX0170.png

2.4 雙流憋壩壓測規(guī)范

(1)全鏈路壓測的具體憋單、憋流開始時間以及泄洪時間,每次壓測前,會提前24~48小時發(fā)出通知(郵件+工作群),通知發(fā)出后,泄洪時間不再調(diào)整

(2)全鏈路壓測會進行集團報備,避開重要促銷活動,壓測要避開存儲(hbase、jimdb、ES)、JDQ、JRC 等自身的災備演練,以免無效壓測

2.5 失真場景的高保真壓測

平時訂單中預售訂單占比過低,預售訂單 平日峰值/大促峰值=0.05%~5.9%,峰值也無法達到要求,且不能指定場景,例如付定金和付尾款場景。所以預售訂單無法在雙流憋壩壓測中實現(xiàn)高保真,所以做了大數(shù)據(jù)預售鏈路的整體改造,聯(lián)合在線軍演壓測(業(yè)務生產(chǎn)系統(tǒng)的壓測)實現(xiàn)預售鏈路的高保真壓測補充

落地方案:軍演負責提供預售訂單數(shù)據(jù)和付定金付尾款場景,大數(shù)據(jù)鏈路進行改造兼容壓測進行數(shù)據(jù)壓測且不污染線上數(shù)據(jù)

如下圖所示: 黃色部分為在線軍演提供數(shù)據(jù)的對應存儲——影子庫表 。綠色部分為壓測新增,最上層為壓測數(shù)據(jù)源(JMQ/JDQ) ,下面是為了壓測搭建的透傳壓測環(huán)境以及寫影子存儲。黃金眼預售通用源和商智預售交易通用源對應任務改成雙進雙出,同時可以處理線上數(shù)據(jù)源和壓測數(shù)據(jù)源,線上數(shù)據(jù)寫入線上輸出topic和線上存儲。 壓測數(shù)據(jù)源的數(shù)據(jù)處理后輸出壓測數(shù)據(jù)的topic,寫入影子存儲。這樣線上拓撲不用隨著每次壓測改動,同時,下游業(yè)務方也可以靈活選擇是否參與壓測。

wKgaoWcXSMqAFvgyAAS3D2AlYm808.jpeg

三、大數(shù)據(jù)憋壩壓測期間,業(yè)務方的遷移方案

3.1 雙流憋壩壓測對于業(yè)務方的影響

在大數(shù)據(jù)雙流壓測的憋流和憋單期間,憋流和憋單對應的機房(匯天/廊坊)無實時數(shù)據(jù)下發(fā),泄洪后恢復。不參與壓測的業(yè)務方,需要做對應的切換。

3.2 不參與壓測的業(yè)務方的遷移方案

(1)切換集群:

A、交易不涉及,交易從源頭topic都是雙流雙活,業(yè)務可以切換消費到不壓測機房對應的topic即可

B、流量直接消費點擊流吐出的topic,需要切換到無損壓測集群“JDQ4瀾滄江_點擊流新建流”。本次切換集群,支持一鍵遷移,不用重啟任務,要使用這次功能,需要升級jdq-sdk,jdq sdk版本是jdq4-clients:1.3.0-SNAPSHOT flink:1.10/1.12/1.14-1.0.9-SNAPSHOT。如果遷移過程中看不到集群“JDQ4瀾滄江_點擊流新建流”,可以聯(lián)系平運維同學支持

(2)切換topic鑒權(quán)

A、交易是雙流,廊坊和匯天都有對應的topic,不參與壓測的業(yè)務方可以申請,消費非壓測機房對應的topic即可

B、流量不是消費采集服務直接吐出的topic,消費的是流量實時數(shù)倉及以下鏈路的topic,也是雙流雙活,切換消費到非壓測機房對應的topic即可。

?

大數(shù)據(jù)雙流憋壩壓測(方案、影響、業(yè)務方遷移方案)——內(nèi)部版本(這部分對外部保密不能發(fā)布,外網(wǎng)發(fā)布的時候這部分不需要,前面就是完整版本)

一、大數(shù)據(jù)雙流憋壩簡介

1.1 數(shù)據(jù)雙流

大數(shù)據(jù)時代,越來越多的業(yè)務依賴實時數(shù)據(jù)用于決策,比如促銷調(diào)整,點擊率預估、廣告分傭等。為了保障業(yè)務的順利開展,也為了保證整體大數(shù)據(jù)鏈路的高可用性,越來越多的0級系統(tǒng)建設雙流,以保證日常及大促期間數(shù)據(jù)流的穩(wěn)定性。建設核心數(shù)據(jù)鏈路雙機房,雙流雙活。同時雙流建設需要整條鏈路上的所有環(huán)節(jié)雙機房部署,占用了雙倍的物理資源;整個建設過程要協(xié)同上下游各環(huán)節(jié)(數(shù)據(jù)生產(chǎn)方、數(shù)倉加工方、中間處理節(jié)點、業(yè)務消費方),也會消耗大量的溝通建設成本。為了達到資源消耗和業(yè)務穩(wěn)定性的平衡,特制定雙流建設標準和實施流程以引導業(yè)務方合理評估雙流需求,順利開展雙流建設實施,詳細參見:雙流建設評估標準?

1.2 大數(shù)據(jù)雙流憋壩壓測

從21年大促備戰(zhàn)開始,大數(shù)據(jù)側(cè)核心數(shù)據(jù)鏈路,從單模塊單任務的壓測,轉(zhuǎn)向全鏈路憋壩壓測,把泄洪閘口上移,壓測范圍覆蓋更廣,訂單和交易同時泄洪,高保真大促網(wǎng)絡峰值,資源競爭場景,同時數(shù)據(jù)產(chǎn)品(黃金眼、商智、作戰(zhàn)指揮室大屏)會在泄洪時同時進行讀查詢的壓測,模擬大促讀寫峰值并行的真實大促場景

1.3 大數(shù)據(jù)憋壩與軍演的關系

(1)軍演,是針對生產(chǎn)業(yè)務系統(tǒng)的壓測,主要涵蓋首頁、搜索、列表、商詳、活動、購物車、結(jié)算頁、訂單、優(yōu)惠券、禮品卡、支付、網(wǎng)關、OFC、物流、售后及依賴的上游動態(tài)系統(tǒng)。壓測所用的sku是測試sku,壓測的訂單會打sendpay140=2或者3的標識,不會污染線上真實數(shù)據(jù)。

(2)大數(shù)據(jù)憋壩,是從停止同步任務開始,憋真實的線上流量,達到一定的量后,泄洪,所有壓測數(shù)據(jù)都是真實線上數(shù)據(jù)。

(3)大數(shù)據(jù)憋壩與軍演的關系:

A、軍演壓測數(shù)據(jù)不會影響大數(shù)據(jù)鏈路

B、大數(shù)據(jù)泄洪的時間,需要避開軍演起量的時間,否則源頭訂單源泄洪會有拖尾

C、對于預售這種平時憋單,無法達到大促場景和量級的特殊訂單場景,軍演與大數(shù)據(jù)會做聯(lián)合高保真壓測

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 機房
    +關注

    關注

    0

    文章

    404

    瀏覽量

    17100
  • 鏈路
    +關注

    關注

    1

    文章

    68

    瀏覽量

    13980
  • 大數(shù)據(jù)

    關注

    64

    文章

    8856

    瀏覽量

    137222
收藏 人收藏

    評論

    相關推薦

    高保真是什么意思?什么叫高保真

    `<p><b><font face="Verdana">高保真
    發(fā)表于 05-04 18:58

    高保真揚聲器系統(tǒng)設計的探索

    高保真揚聲器系統(tǒng)設計的探索【作者】:鄧漢波;【來源】:《電聲技術(shù)》2010年02期【摘要】:綜合利用客觀的測量結(jié)果、計算機模擬分析結(jié)果和主觀的聽感音質(zhì)評價結(jié)果,進行了一個二分頻高保真揚聲器系統(tǒng)
    發(fā)表于 04-22 11:29

    常見大數(shù)據(jù)應用有哪些?

    設計階段大數(shù)據(jù)架構(gòu)設計階段需掌握的技術(shù)有:Flume分布式、Zookeeper、Kafka等。四、大數(shù)據(jù)實時計算階段大數(shù)據(jù)實時計算階段需掌握的技術(shù)有:Mahout、Spark、storm。五、
    發(fā)表于 03-13 16:50

    請問6rfid如何實時接收數(shù)據(jù)

    項目要求同時接收6串口rfid的信號,rfid被動發(fā)送標簽id,只接收ID不需發(fā)送,數(shù)據(jù)速度不定,最快0.1s一個。然后將接收到的數(shù)據(jù)實時發(fā)送給PC機。求助高手給項目一些建議,或者方案?。?!
    發(fā)表于 01-28 06:35

    大數(shù)據(jù)監(jiān)控binlog組件的maxwell組件

    大數(shù)據(jù)實時監(jiān)控mysql數(shù)據(jù)庫binlog(二)
    發(fā)表于 05-16 11:24

    阿里巴巴高級技術(shù)專家章劍鋒:大數(shù)據(jù)發(fā)展的 8 個要點

    繼續(xù)擴大,大數(shù)據(jù)將繼續(xù)發(fā)揚光大3、 數(shù)據(jù)實時性需求將更加突出4、大數(shù)據(jù)基礎設施往云上遷移勢不可擋5、大數(shù)據(jù)產(chǎn)品全
    發(fā)表于 10-14 10:56

    大數(shù)據(jù)實時分析領域的ClickHouse

    ClickHouse大數(shù)據(jù)實時分析領域的黑馬
    發(fā)表于 03-24 11:09

    高保真音響設計制作

    高保真音響的技術(shù)現(xiàn)狀,聲音概論,元器件,繼電器,場效應管,晶體
    發(fā)表于 08-20 13:19 ?311次下載
    <b class='flag-5'>高保真</b>音響設計制作

    什么是高保真耳機

    什么叫高保真耳機 常聽說“高保真耳機”、“高保真音響”。音響中的“高保真”指的是什么高保真簡單的說就是 讓你感受原汁原味的聲音 好象就在
    發(fā)表于 10-09 16:18 ?53次下載

    什么是高保真

    什么是高保真? 高保真的英文原詞是High Fidelity,簡稱HI-FI。高保真指聲頻錄音及放音系統(tǒng)或設備具有如實反
    發(fā)表于 05-04 18:55 ?1.2w次閱讀

    高保真音響實用全書

    高保真音響實用全書》》將對何謂高保真,何謂HighEnd音響,如何選購HiFi音響器材,如何對聽音室進行聲學處理,如何擺放音箱,如何使音響升級和家庭影院中的音響等有關問題以及
    發(fā)表于 07-23 11:25 ?0次下載
    <b class='flag-5'>高保真</b>音響實用全書

    流式大數(shù)據(jù)實時處理技術(shù)及應用

    大數(shù)據(jù)處理系統(tǒng)根據(jù)其時效性可分為批式大數(shù)據(jù)和流式大數(shù)據(jù)兩類。上述兩類系統(tǒng)均無法滿足事中感知查詢分析處理模式的需求。為此,從分析大數(shù)據(jù)應用場景入手,提出了流立方流式
    發(fā)表于 03-28 15:29 ?10次下載

    AD1883高保真音頻MAX編解碼器過時數(shù)據(jù)

    AD1883高保真音頻MAX編解碼器過時數(shù)據(jù)
    發(fā)表于 04-26 18:08 ?7次下載
    AD1883<b class='flag-5'>高保真</b>音頻MAX編解碼器過時<b class='flag-5'>數(shù)據(jù)</b>表

    AD1882:高保真音頻MAX編解碼器過時數(shù)據(jù)

    AD1882:高保真音頻MAX編解碼器過時數(shù)據(jù)
    發(fā)表于 05-17 21:13 ?12次下載
    AD1882:<b class='flag-5'>高保真</b>音頻MAX編解碼器過時<b class='flag-5'>數(shù)據(jù)</b>表

    LME49743四高性能、高保真音頻運算放大器數(shù)據(jù)

    電子發(fā)燒友網(wǎng)站提供《LME49743四高性能、高保真音頻運算放大器數(shù)據(jù)表.pdf》資料免費下載
    發(fā)表于 06-19 11:00 ?0次下載
    LME49743四<b class='flag-5'>路</b>高性能、<b class='flag-5'>高保真</b>音頻運算放大器<b class='flag-5'>數(shù)據(jù)</b>表