電子發(fā)燒友App

硬聲App

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示
創(chuàng)作
電子發(fā)燒友網(wǎng)>電子資料下載>電子資料>Big Whale分布式計算任務(wù)調(diào)度系統(tǒng)

Big Whale分布式計算任務(wù)調(diào)度系統(tǒng)

2022-06-14 | zip | 3.83 MB | 次下載 | 2積分

資料介紹

授權(quán)協(xié)議 Apache-2.0
開發(fā)語言 Java
軟件類型 開源軟件

軟件簡介

Big Whale 巨鯨任務(wù)調(diào)度平臺為美柚大數(shù)據(jù)研發(fā)的分布式計算任務(wù)調(diào)度系統(tǒng),提供 Spark、Flink 等批處理任務(wù)的 DAG 調(diào)度和流處理任務(wù)的運行管理和狀態(tài)監(jiān)控,并具有Yarn應(yīng)用管理、重復(fù)應(yīng)用檢測、大內(nèi)存應(yīng)用檢測等功能。 服務(wù)基于 Spring Boot 2.0 開發(fā),打包后即可運行。

概述

1.架構(gòu)圖

poYBAGKjJGmASCuzAAB4b6NQm30365.png

2.特性

  • 基于SSH的腳本執(zhí)行機制,部署簡單快捷,僅需單個服務(wù)
  • 基于Yarn Rest Api的任務(wù)狀態(tài)同步機制,對Spark、Flink無版本限制
  • 支持失敗重試
  • 支持任務(wù)依賴
  • 支持復(fù)雜任務(wù)編排(DAG)
  • 支持流處理任務(wù)運行管理和監(jiān)控
  • 支持Yarn應(yīng)用管理

部署

1.準(zhǔn)備

  • Java 1.8+
  • Mysql 5.1.0+
  • 下載項目或git clone項目
  • 為解決 github README.md 圖片無法正常加載的問題,請在hosts文件中加入相關(guān)域名解析規(guī)則,參考:hosts

2.安裝

  • 創(chuàng)建數(shù)據(jù)庫:big-whale
  • 運行數(shù)據(jù)庫腳本:big-whale.sql
  • 根據(jù)Spring Boot環(huán)境,配置相關(guān)數(shù)據(jù)庫賬號密碼,以及SMTP信息
  • 配置:big-whale.properties
    • 配置項說明
      • ssh.user: 擁有腳本執(zhí)行權(quán)限的ssh遠程登錄用戶名(平臺會將該用戶作為統(tǒng)一的腳本執(zhí)行用戶)
      • ssh.password: ssh遠程登錄用戶密碼
      • dingding.enabled: 是否開啟釘釘告警
      • dingding.watcher-token: 釘釘公共群機器人Token
      • yarn.app-memory-threshold: Yarn應(yīng)用內(nèi)存上限(單位:MB),-1禁用檢測
      • yarn.app-white-list: Yarn應(yīng)用白名單列表(列表中的應(yīng)用申請的內(nèi)存超過上限,不會進行告警)
  • 修改:$FLINK_HOME/bin/flink,參考:flink(因flink提交任務(wù)時只能讀取本地jar包,故需要在執(zhí)行提交命令時從hdfs上下載jar包并替換腳本中的jar包路徑參數(shù)
  • 打包:mvn clean package

3.啟動

  • 檢查端口17070是否被占用,被占用的話,關(guān)閉占用的進程或修改項目端口號配置重新打包
  • 拷貝target目錄下的big-whale.jar,執(zhí)行命令:java -jar big-whale.jar

4.初始配置

  • 打開:http://localhost:17070
    pYYBAGKjJGuAHvZzAACAIbN9V58215.png
  • 輸入賬號admin,密碼admin
  • 點擊:權(quán)限管理->用戶管理,修改當(dāng)前賬號的郵箱為合法且存在的郵箱地址,否則會導(dǎo)致郵件發(fā)送失敗
  • 添加集群
    • 集群管理->集群管理->新增
      poYBAGKjJGyAf1K3AABv6fSVHZE762.png
    • “yarn管理地址”為Yarn ResourceManager的WEB UI地址
    • “程序包存儲目錄”為程序包上傳至hdfs集群時的存儲路徑,如:/data/big-whale/storage
    • “支持Flink任務(wù)代理用戶”“流處理任務(wù)黑名單”和“批處理任務(wù)黑名單”為內(nèi)部定制的任務(wù)分配規(guī)則,勿填
  • 添加集群用戶
    • 集群管理->集群用戶->新增
      pYYBAGKjJG6AA06PAAAojnsjTkk724.png
    • 該配置的語義為:平臺用戶在所選集群下可以使用的Yarn資源隊列(--queue)和代理用戶(--proxy-user)
  • 添加代理
    • 集群管理->代理管理->新增
      pYYBAGKjJG-AftnaAAAf7KnTqR8891.png
    • 可添加多個實例(僅支持IP地址,可指定端口號,默認為22),執(zhí)行腳本的時候會隨機選擇一個實例執(zhí)行,在實例不可達的情況下,會繼續(xù)隨機選擇下一個實例,在實例均不可達時執(zhí)行失敗
    • 選擇集群后,會作為該集群下提交Spark或Flink任務(wù)的代理之一
  • 添加計算框架版本
    • 集群管理->版本管理->新增
      poYBAGKjJHGAUIpIAAAitn_LjYg257.png
    • 同一集群下不同版本的Spark或Flink任務(wù)的提交命令可能有所不同,如Spark 1.6.0版本的提交命令為spark-submit,Spark 2.1.0版本的提交命令為spark2-submit

使用

1.離線調(diào)度

1.1 新增

  • 目前支持“Shell”、“Spark Batch”和“Flink Batch”三種類型的批處理任務(wù)
  • 通過拖拽左側(cè)工具欄相應(yīng)的批處理任務(wù)圖標(biāo),可添加相應(yīng)的DAG節(jié)點
    poYBAGKjJHKAEvPYAAFC-Tw-mQc231.png
    poYBAGKjJHSAegH_AAGRvrvC4CY706.png
    • 支持時間參數(shù)${now} ${now - 1d} ${now - 1h@yyyyMMddHHmmss}等(d天、h時、m分、s秒、@yyyyMMddHHmmss為格式化參數(shù))
    • 非“Shell”類型的批處理任務(wù)應(yīng)上傳與之處理類型相對應(yīng)的程序包,此處為Spark批處理任務(wù)打成的jar包
    • “資源選項”可不填
    • 代碼有兩種編輯模式,“可視化視圖”和“代碼視圖”,可互相切換
    • 點擊“測試”可測試當(dāng)前節(jié)點是否正確配置并可以正常運行
    • 為防止平臺線程被大量占用,平臺提交Saprk或Flink任務(wù)的時候都會強制以“后臺”的方式執(zhí)行,對應(yīng)spark配置:--conf spark.yarn.submit.waitAppCompletion=false,flink配置:-d,但是基于后臺“作業(yè)狀態(tài)更新任務(wù)”的回調(diào),在實現(xiàn)DAG執(zhí)行引擎時可以確保當(dāng)前節(jié)點所提交的任務(wù)運行完成后再執(zhí)行下一個節(jié)點的任務(wù)
  • DAG節(jié)點支持失敗重試
  • 將節(jié)點按照一定的順序連接起來可以構(gòu)建一個完整的DAG
    poYBAGKjJHWAdtN3AAFNWMJrkKA033.png
  • DAG構(gòu)建完成后,點擊“保存”,完成調(diào)度設(shè)置
    pYYBAGKjJHeAB5zyAAG6agSrXZo947.png

1.2 操作

  • 打開離線調(diào)度列表
  • ?poYBAGKjJHiAAu-NAACu-q5TW6k533.png
  • 點擊左側(cè)操作欄“調(diào)度實例”可查看調(diào)度實例列表、運行狀態(tài)和節(jié)點啟動日志
    pYYBAGKjJHqAXp6jAAEq0vlcx6U314.png
  • 點擊左側(cè)操作欄“手動執(zhí)行”可觸發(fā)調(diào)度執(zhí)行

2.實時任務(wù)

2.1 新增

  • 目前支持“Spark Stream”和“Flink Stream”兩種類型的流處理任務(wù)
    poYBAGKjJHyACKRqAAFL0EhNasM791.png
  • 啟用監(jiān)控可以對任務(wù)進行狀態(tài)監(jiān)控,包括異常重啟、批次積壓告警等
    poYBAGKjJH2AHo5vAAErZTZ93Zc714.png

2.2 操作

  • 打開實時任務(wù)列表
  • ?pYYBAGKjJH-AWbPGAAEETIXPptE839.png
  • 點擊左側(cè)操作欄“日志”可查看任務(wù)啟動日志
  • 點擊左側(cè)操作欄“執(zhí)行”可觸發(fā)任務(wù)啟動

3.任務(wù)告警

  • 正確配置郵件或釘釘告警后在任務(wù)運行異常時會發(fā)送相應(yīng)的告警郵件或通知,以便及時進行相應(yīng)的處理
<巨鯨任務(wù)告警>
代理: agent1
類型: 腳本執(zhí)行失敗
用戶: admin
任務(wù): 調(diào)度示例1 - shell_test
時間: 2021-03-05 15:18:23
<巨鯨任務(wù)告警>
集群: 集群1
類型: spark離線任務(wù)異常(FAILED)
用戶: admin
任務(wù): 調(diào)度示例1 - spark_test
時間: 2021-03-05 15:28:33
<巨鯨任務(wù)告警>
集群: 集群1
類型: spark實時任務(wù)批次積壓,已重啟
用戶: admin
任務(wù): sparkstream_test
時間: 2021-03-05 15:30:41
  • 除上述告警信息外還有其他告警信息此處不一一列舉

Change log

  • v1.1開始支持DAG
  • v1.2開始支持DAG節(jié)點失敗重試
  • v1.3調(diào)度引擎進行重構(gòu)升級,不支持從舊版本升級上來,原有舊版本的任務(wù)請手動進行遷移,離線調(diào)度移除“Python”類型腳本支持
?

下載該資料的人也在下載 下載該資料的人還在閱讀
更多 >

評論

查看更多

下載排行

本周

  1. 1山景DSP芯片AP8248A2數(shù)據(jù)手冊
  2. 1.06 MB  |  532次下載  |  免費
  3. 2RK3399完整板原理圖(支持平板,盒子VR)
  4. 3.28 MB  |  339次下載  |  免費
  5. 3TC358743XBG評估板參考手冊
  6. 1.36 MB  |  330次下載  |  免費
  7. 4DFM軟件使用教程
  8. 0.84 MB  |  295次下載  |  免費
  9. 5元宇宙深度解析—未來的未來-風(fēng)口還是泡沫
  10. 6.40 MB  |  227次下載  |  免費
  11. 6迪文DGUS開發(fā)指南
  12. 31.67 MB  |  194次下載  |  免費
  13. 7元宇宙底層硬件系列報告
  14. 13.42 MB  |  182次下載  |  免費
  15. 8FP5207XR-G1中文應(yīng)用手冊
  16. 1.09 MB  |  178次下載  |  免費

本月

  1. 1OrCAD10.5下載OrCAD10.5中文版軟件
  2. 0.00 MB  |  234315次下載  |  免費
  3. 2555集成電路應(yīng)用800例(新編版)
  4. 0.00 MB  |  33566次下載  |  免費
  5. 3接口電路圖大全
  6. 未知  |  30323次下載  |  免費
  7. 4開關(guān)電源設(shè)計實例指南
  8. 未知  |  21549次下載  |  免費
  9. 5電氣工程師手冊免費下載(新編第二版pdf電子書)
  10. 0.00 MB  |  15349次下載  |  免費
  11. 6數(shù)字電路基礎(chǔ)pdf(下載)
  12. 未知  |  13750次下載  |  免費
  13. 7電子制作實例集錦 下載
  14. 未知  |  8113次下載  |  免費
  15. 8《LED驅(qū)動電路設(shè)計》 溫德爾著
  16. 0.00 MB  |  6656次下載  |  免費

總榜

  1. 1matlab軟件下載入口
  2. 未知  |  935054次下載  |  免費
  3. 2protel99se軟件下載(可英文版轉(zhuǎn)中文版)
  4. 78.1 MB  |  537798次下載  |  免費
  5. 3MATLAB 7.1 下載 (含軟件介紹)
  6. 未知  |  420027次下載  |  免費
  7. 4OrCAD10.5下載OrCAD10.5中文版軟件
  8. 0.00 MB  |  234315次下載  |  免費
  9. 5Altium DXP2002下載入口
  10. 未知  |  233046次下載  |  免費
  11. 6電路仿真軟件multisim 10.0免費下載
  12. 340992  |  191187次下載  |  免費
  13. 7十天學(xué)會AVR單片機與C語言視頻教程 下載
  14. 158M  |  183279次下載  |  免費
  15. 8proe5.0野火版下載(中文版免費下載)
  16. 未知  |  138040次下載  |  免費