隨著信息技術和互聯(lián)網的發(fā)展,終端設備從 PC 端擴展到移動端,應用的架構從單體架構演進為分布式的微服務架構,軟件系統(tǒng)服務層之間的交互日益復雜,給系統(tǒng)的運維管理帶來了巨大的挑戰(zhàn),應運而生的可觀測性技術,帶來了問題的答案。
近日,上海道客網絡科技有限公司(簡稱:「DaoCloud 道客」)攜手北京基調網絡股份有限公司(簡稱:基調聽云)推出云原生智能可觀測性平臺聯(lián)合解決方案。雙方基于 DaoCloud Enterprise 云操作系統(tǒng)與基調聽云智能可觀測性平臺的產品兼容性互認證,在異構環(huán)境下,為企業(yè)提供覆蓋應用計算、服務編排、多云納管等方面的端到端一體化監(jiān)控解決方案。
隨著 Kubernetes 得到越來越廣泛的采用,企業(yè)軟件系統(tǒng)正在向復雜的云原生架構進行革命性轉變。應用的架構從單體架構演進為微服務架構,應用形式呈現有 Web、APP、小程序等多種形式,訪問的網絡有 4G、5G、Wi-Fi 等。企業(yè)用云也從單一云時代,逐漸來到混合多云時代。在這些龐大復雜的多云環(huán)境中,各種模塊、各種語言開發(fā)的應用程序或服務的數量與日俱增,如何追蹤它們運行在何處、性能如何、故障定位、請求的完整端到端流程等,并持續(xù)檢查海量高速數據流以識別系統(tǒng)中的已知和未知問題,顯得至關重要。
云原生智能可觀測性平臺聯(lián)合解決方案,以 DaoCloud Enterprise 云操作系統(tǒng)為底座,結合基調聽云智能可觀測性平臺,提供云原生計算、網絡、存儲的能力,屏蔽底層基礎設施復雜性,支持多云、多集群全生命周期統(tǒng)一納管,同時為不同的角色提供不同的監(jiān)控視角,全面覆蓋了最終用戶體驗、應用性能、業(yè)務性能、基礎架構、云平臺等客戶 IT 環(huán)境,具有全量的數據采集、全鏈路數據事務追蹤、代碼級根源分析、調用鏈日志溯源、健康度和智能告警能力,幫助企業(yè)了解用戶體驗及應用性能,構建業(yè)務系統(tǒng)的云原生智能可觀測性平臺。
如上所說,龐大復雜的多云異構環(huán)境,以及日益增長的應用程序和服務數量,使排查定位系統(tǒng)問題的難度呈指數級上升,面對這些挑戰(zhàn),該方案具備三個關鍵優(yōu)勢:
統(tǒng)一、安全、成熟穩(wěn)定的高性能云原生應用平臺
DaoCloud Enterprise支持 x86、 ARM 架構的異構服務器的接入,快速構建高性能云原生應用集群。依托于云原生容器封裝技術,屏蔽操作系統(tǒng)之間的差異性,為業(yè)務應用構建統(tǒng)一的管理平臺,并提供“一次構建,隨處運行”的能力。
降本增效的云原生彈性可觀測
方案以云原生技術為底座,支持業(yè)務和可觀測組件的彈性擴展,減少動態(tài) IT 環(huán)境中的人工維護工作,能夠動態(tài)適應業(yè)務需求,實現隨業(yè)務高峰而彈性擴張計算,隨低谷而釋放資源,降低 IT 運營成本。
完善的指標體系
在此基礎上,方案構建了完善的指標體系,橫跨基礎組件層、應用層、業(yè)務層、用戶體驗層,為故障感知提供質量標準:
基礎組件層:包含了企業(yè)常用的主機、數據庫、容器等常規(guī)指標;
應用層:除了包含應用健康度、響應時間、吞吐率、錯誤率等通用指標外,還包含服務或數據庫組件的實例、執(zhí)行時間等指標,錯誤分析的開始時間、最后發(fā)生時間、異常名稱、錯誤次數等指標,以及事務追蹤的追蹤 ID、事務名稱、業(yè)務標識等指標;
業(yè)務層:包含業(yè)務可用性、活躍用戶數、業(yè)務流、執(zhí)行周期等通用業(yè)務指標外,還支持自定義監(jiān)控指標。 如:交易金額、訂單總數、Top10 銷售排名等;
用戶體驗層:包含 PC 端、小程序端的 PV、白屏時間、首屏時間、慢頁面占比等指標,以及移動端的頁面完整度、頁面流暢度、冷啟動時間、次數等指標。
該方案有效結合了云原生與可觀測性的技術優(yōu)勢,在通過分析系統(tǒng)生成的數據,理解推演出系統(tǒng)內部的狀態(tài),實現快速排障的同時,也能利用云原生技術實現降本增效,在各種應用場景中都得到了驗證,如:
一體化監(jiān)控
復雜的多云異構環(huán)境加海量客戶端設備的情況下,大量的服務端運行情況、日志、應用性能數據等監(jiān)控數據通常由多個第三方監(jiān)控平臺提供支持,眾多采集 agent、異構的數據存儲庫、定制化的數據模型和查詢語句、分散監(jiān)控大屏等導致企業(yè)需要大量人員對監(jiān)控進行管理,例如研發(fā)適配、存儲策略、告警策略、大屏展示圖表以及各個平臺的權限控制等事務。海量監(jiān)測數據如何統(tǒng)一采集、上傳、存儲、分析和應用成為企業(yè)降本增效的關鍵因素。
該方案構建從基礎設施到應用層全方位立體化監(jiān)控。以 APM 為核心,調用鏈追蹤技術為手段,將業(yè)務監(jiān)控、應用監(jiān)控、日志監(jiān)控、Kubernetes平臺監(jiān)控、容器監(jiān)控等有機關聯(lián)在一起,實現端到端一體化監(jiān)控,提高根因定位效率。
DevOps 集成強化
DevOps 流程中,一次質量測試需要多方協(xié)作共同完成:運維協(xié)調測試資源和壓測環(huán)境、測試執(zhí)行測試用例、研發(fā)使用監(jiān)控平臺和測試平臺獲取測試結果和事務分析結果。但基于傳統(tǒng)的 CI/CD 流程,功能和性能測試往往是和 CI 流程分開進行,先執(zhí)行 CI,然后到性能測試環(huán)境部署監(jiān)控探針,通過各種監(jiān)控平臺觀察信息,效率相對較低。
該方案實現在測試階段一鍵創(chuàng)建測試環(huán)境,CI 階段引入 APM 工具、集成探針,通過 API 即可獲取檢測數據和結果,自動生成報告并發(fā)送,提高測試效率,結合事務分析和追蹤功能快速發(fā)現性能瓶頸,優(yōu)化應用質量。
微服務架構下的故障定位、性能優(yōu)化
云原生已是業(yè)界公認的數字化轉型最佳路徑。以云原生為核心的云操作系統(tǒng),對微服務架構和容器化技術的應用,提供天然的支持,新的技術架構使得平臺上應用的監(jiān)控從穩(wěn)態(tài)的方式向敏態(tài)的方向轉變,這種轉變帶來便利的同時,也帶來了一些新的挑戰(zhàn):容器易于創(chuàng)建和銷毀的特性,以及應用采用微服務架構的方式,使得應用的調用鏈變得繁雜,單個服務故障會引發(fā)多個服務告警,被動采集監(jiān)控指標數據的方式難以精準定位故障。
該方案的 APM 能夠實現 100% 真全量的性能追蹤和業(yè)務數據采集,保證了調用鏈數據的完整性,可以實現深度代碼級性能診斷和優(yōu)化,配合分層展示的拓撲圖,友好的展現微服務間的依賴和調用關系,幫助運維團隊快速定位問題根因,降低 MTTR。
移動端 APP 真實用戶體驗監(jiān)測
移動端作為互聯(lián)網新時代的流量入口的重要性不言而喻,移動端 APP 開發(fā)后難以在海量設備上進行測試,在發(fā)布后可能遇到在某些設備上出現啟動崩潰、首次啟動加載時間過長、頁面渲染異常等問題,企業(yè)往往難以及時獲取有效的反饋,對用戶體驗產生了極大的影響。
方案通過 APP SDK 字節(jié)碼技術和運行時 hook 技術,能夠實時采集 APP性能數據,并且不影響業(yè)務代碼邏輯,當 APP 切換到后臺或者退出時,SDK 會自動停止采集和上報,減少不必要的流量消耗。服務端依托云操作系統(tǒng)的容器編排技術,結合自動彈性擴縮功能,針對移動端彈性的流量,自動適配服務器資源,利用自動化編排技術提供高性能高可靠的可觀測服務,保障平臺高可用的同時,為企業(yè)降低監(jiān)控運營成本。
云原生時代,以運維的視角、被動解決故障為目標的監(jiān)控正在逐漸退出舞臺,而適配 IT 架構變革和云原生技術實踐、協(xié)同開發(fā)和業(yè)務視角、具備更廣泛和主動能力的可觀測性,正在冉冉升起。未來,基調聽云將攜手DaoCoud道客結合雙方技術優(yōu)勢,為企業(yè)數字化轉型提供與時俱進的云原生可觀測性解決方案。
審核編輯黃宇
-
測試
+關注
關注
8文章
4927瀏覽量
125952 -
云原生
+關注
關注
0文章
238瀏覽量
7918
發(fā)布評論請先 登錄
相關推薦
評論