0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

怎樣去減少Confluent Cloud Kafka運營成本呢

廣州虹科電子科技有限公司 ? 來源:虹科云科技 ? 作者:虹科云科技 ? 2022-09-23 17:23 ? 次閱讀

流式數(shù)據(jù)已成為企業(yè)構建和運營出色數(shù)據(jù)產(chǎn)品的必要條件,而 Apache Kafka 已成為實時流式傳輸?shù)臉藴省?/p>

雖然采用 Kafka 變得至關重要,但在如何部署 Kafka 時,數(shù)據(jù)團隊有多種選擇。

Kafka 最初是安裝在服務器上的開源軟件。復雜且高度可配置的 Kafka 早期使用者親身感受了管理 Kafka 集群的困難、耗時和昂貴。那些還在使用本地 Kafka 的用戶正在采用諸如“數(shù)據(jù)可觀測性平臺”之類的解決方案,以賦予他們對環(huán)境的自動可見性和控制權。

除此之外,其他公司正在轉向云計算,其中有很多選擇,每一種都為 Kafka 提供不同級別的VIP服務。為此,我們可以將 Kafka 服務分為兩個基本類別

1.Kafka即服務:用戶的 Kafka 集群被提升并轉移到托管服務提供商,如 AWS、Cloudera、Red Hat (IBM) 或 Azure,后者處理大部分基礎設施管理,包括供應、配置和維護服務器。為了保障安全,每個用戶的 Kafka 實例都托管在他們自己的物理服務器上,采用單租戶架構。盡管在云中,用戶仍然保留對其 Kafka 環(huán)境的大部分控制權——這意味著用戶仍然有責任對 Kafka 環(huán)境進行管理。

2.完全托管的 Kafka:由Confluent Cloud首創(chuàng)。Confluent Cloud 幾乎消除了運行 Kafka 的所有操作麻煩,同時提供了開發(fā)人員喜歡的即時可擴展性和簡單可靠的可靠性。正如Confluent Cloud 發(fā)布者 Kai Waehner 自夸的那樣:“如果 Kafka 軟件是汽車引擎,那么托管 Kafka 或 Kafka-as-a-service 就是汽車,這使得 Confluent Cloud 相當于一輛自動駕駛汽車”。

Confluent Cloud可減少

企業(yè)運營Kafka的成本

作為完全托管 Kafka 的標準承載者,Confluent Cloud 確實提供了用戶想要的任何風格的 Kafka,包括本地、混合和托管即服務。Confluent Cloud 認識到,許多用戶根本沒有準備好從一個極端(Kafka 的完全手動控制和可定制性)跳到另一個極端(在無服務器 Confluent Cloud 中對 Kafka 的控制較少,甚至可見性更低)。

Kafka 的成本,除了硬件之外,還包括管理和開發(fā)應用程序的成本。因此,對于公司而言,仍有大量機會簡化其 Kafka 環(huán)境并優(yōu)化其成本提高性價比。

在Kafka-as-a-single-tenant-service(Kafka單租戶服務)的情況下,用戶的操作復雜性仍然很高。盡管托管服務提供商會自動執(zhí)行任務,例如引入新的 Kafka 集群,但仍需要監(jiān)控很多儀表板、做出部署決策、優(yōu)化數(shù)據(jù)瓶頸、修復數(shù)據(jù)錯誤以及進行存儲管理等。為了減輕運營負擔并提高動態(tài) Kafka 環(huán)境的性價比,本地和混合用戶的連續(xù)數(shù)據(jù)可觀測性可以使托管的 Kafka 用戶從中獲益。

完全托管的 Kafka 用戶是否面臨相同的運營成本?Confluent Cloud 回復說:“并不會。Confluent Cloud 的后端規(guī)模經(jīng)濟、近乎零的管理要求、即時和自動的用戶彈性可以幫助用戶節(jié)省巨額的總擁有成本 (TCO) 轉化為巨大的總擁有成本 (TCO) 。從Forrester TEI 的2022報告可知,相較于自我管理和部署Kafka,使用Confluent Cloud可幫助企業(yè)在三年內(nèi)節(jié)省 260 萬美元。

5cf1a5fc-3b1c-11ed-9e49-dac502259ad0.png

Confluent Cloud Kafka

用戶面臨的成本問題

Confluent的承諾也反映了 Snowflake的—承諾其三年的投資回報率為2100萬美元。低運維、高度可擴展的云數(shù)據(jù)倉庫已被開發(fā)人員和數(shù)據(jù)驅動的公司所采納。由于云數(shù)據(jù)倉具有敏捷性特征,可以大大加快企業(yè)產(chǎn)品上市時間,用戶將“低運維”誤認為是“無運維”。這是因為他們忽略了價值工程和云計算運營的基本原則,也忽略了運營監(jiān)督,例如監(jiān)控成本、設置成本護欄等。

在Snowflake 使用中有一個著名的案例,該案例錯誤地配置了一個長達 7 小時的代碼測試,導致Snowflake收取用戶72,000 美元的費用。同時,其他 Snowflake 用戶發(fā)現(xiàn)成本優(yōu)化不是自動的,仍然需要他們付出大量的努力和監(jiān)督成本。

基于此,Snowflake 用戶被迫嘗試各種解決方案,從 Snowflake 的內(nèi)置資源監(jiān)視器到可視化的第三方儀表板和報告以及許多其他工具。然而,即使將這些工具拼湊在一起,也無法為用戶提供持續(xù)的可見性、預測性和成本控制功能,更不用說數(shù)據(jù)可靠性和數(shù)據(jù)性能等其他應用了。

同樣,在 Confluent Cloud 的“動態(tài)即用即付”收費模式中優(yōu)化成本既不簡單,也不會自動進行。流數(shù)據(jù)量可以瞬間飆升至每秒10 GB。要想監(jiān)控和防止這種潛在的成本超支,非常不容易。雖然 Confluent Cloud Console 可以實時顯示初步使用情況,但實際上,用戶的成本將滯后6到24小時。

雖然 Confluent Cloud 使用戶能夠圍繞數(shù)據(jù)性能問題創(chuàng)建實時觸發(fā)器和警報,且不會造成成本超支。但如果開發(fā)人員忘記關閉大容量測試流數(shù)據(jù)管道,或者采取保守的歸檔策略導致存儲費用增加,這可能是Confluent Cloud將面臨的問題。同時,Confluent Cloud 用戶在支付每月使用費前,不會注意到這個問題。

數(shù)據(jù)可觀測性如何幫助用戶減少

Confluent Cloud Kafka運營成本

對于想要認真監(jiān)控和管理其 Confluent Cloud 環(huán)境的用戶,Confluent建議他們尋找第三方提供商,而像HK-Acceldata這樣的企業(yè)數(shù)據(jù)可觀測性平臺就可以為其服務。

HK-Acceldata 通過 Confluent Cloud 的 API 獲取成本和性能指標,通過自己的監(jiān)控生成額外的分析,然后將兩者結合起來以創(chuàng)建進一步的見解、警報和建議。下面介紹一下HK-Acceldata 幫助用戶防止成本超支并優(yōu)化成本的五種方式

1)為 Confluent Cloud 數(shù)據(jù)管道的性能和使用情況提供持續(xù)可見性和警報。在實時數(shù)據(jù)流下,處理、發(fā)送和存儲的事件量會急劇增加,尤其是在 Confluent Cloud 的即時、多 GB 可擴展的情況下。HK-Acceldata的計算可觀察性有助于監(jiān)控可能造成的數(shù)據(jù)瓶頸以及導致進程崩潰的數(shù)據(jù)峰值。HK-Acceldata 還提供實時視圖,幫助用戶選擇正確數(shù)量的分區(qū)和主題,以優(yōu)化用戶的性價比。

2)生產(chǎn)者-主題-沿襲可見性。HK-Acceldata 的Kapxy工具可讓 Confluent Cloud 用戶進一步了解 Kafka 的三個關鍵組件——生產(chǎn)者、主題和消費者。因此,用戶可以從端到端更精細地跟蹤數(shù)據(jù)。通過深入了解數(shù)據(jù)的實際流動方式,用戶可以準確計算管道、應用程序或企業(yè)各部門的使用情況和成本,不僅可以實現(xiàn)準確的成本退款、ROI 計算,還可以支持數(shù)據(jù)管道重用和其他價值工程工作。

5d8f2dae-3b1c-11ed-9e49-dac502259ad0.png

使用 HK-Acceldata 跟蹤 Confluent Cloud 中的數(shù)據(jù)路徑

3)監(jiān)控和防止消費者滯后。Kafka中最大的潛在問題之一是攝取的數(shù)據(jù)與下游應用程序或使用者接收的數(shù)據(jù)存在差距。如果差距過大,那么存儲在Kafka代理中的數(shù)據(jù)可能會在傳輸成功之前就自動過期。HK-Acceldata 提供高級別的可見性,可在用戶的整個Confluent Cloud數(shù)據(jù)管道中查找潛在問題,例如找到離線和復制不足的分區(qū)、最大和最偏斜的主題、不同步的副本數(shù)量是否在增長以及滯后最多的消費者組等。用戶也可以深入了解消費者組或查看單個事件,所有這些可見性都可以幫助用戶防止成本滯后,不需要用戶通過昂貴的計算或存儲來解決這個問題。

5db3afe4-3b1c-11ed-9e49-dac502259ad0.png

HK-Acceldata 的 Kafka 儀表板圖表有助于防止代價高的消費者滯后

?4) 防止數(shù)據(jù)丟失。如上所述,Consumer Lag和其他瓶頸不僅會直接增加用戶的處理成本,還會導致數(shù)據(jù)丟失。這是因為用戶可以控制 Kafka Brokers(服務器)存儲數(shù)據(jù)的時間長度。如果數(shù)據(jù)瓶頸或延遲持續(xù)時間過長,則代理可能會在數(shù)據(jù)成功傳輸?shù)较M者應用程序之前清除數(shù)據(jù)。HK-Acceldata 的監(jiān)控儀表板可幫助用戶診斷數(shù)據(jù)丟失的原因,而Kapxy等工具可以精確定位丟失的數(shù)據(jù)及其的位置。

5) 清理、驗證和轉換流數(shù)據(jù)。將HK-Acceldata與Kafka和Confluent Cloud 管道一起使用,可以實時攝取、驗證和轉換事件以提高用戶的數(shù)據(jù)質(zhì)量和可靠性。同時,還減少了搜索和修復數(shù)據(jù)錯誤的時間,用戶也不需要對有問題的數(shù)據(jù)管道和應用程序進行故障排除,這大大降低了企業(yè)的運營成本,投資回報率顯著提升。

總結

上述企業(yè)數(shù)據(jù)可觀測性平臺HK-Acceldata 5個優(yōu)勢也有助于簡化舊 Kafka 環(huán)境到 Confluent Cloud 的遷移過程。因為Confluent Cloud與本地或托管的單租戶Kafka集群有很大不同,任何遷移對用戶的環(huán)境而言都是從頭開始,而不是簡單的提升和轉移。HK-Acceldata 的自動化數(shù)據(jù)準備和監(jiān)控可以使遷移變得輕松且順利,同時也可以調(diào)整資源以匹配工作區(qū)和 SLA 要求,從而平衡性能與成本。

總之,如果使用完全托管的 Confluent Cloud ,公司仍然需要對運營成本進行監(jiān)督,而HK-Acceldata Data Observability for Kafka 解決方案可以很好的解決這一問題。Confluent Cloud 的用戶可以使用HK-Acceldata等連續(xù)數(shù)據(jù)可觀測性平臺為其提供的額外可見性和監(jiān)控,從而降低用戶的總擁有成本(TCO)。




審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • IBM
    IBM
    +關注

    關注

    3

    文章

    1730

    瀏覽量

    74479
  • 服務器
    +關注

    關注

    12

    文章

    8701

    瀏覽量

    84554
  • 存儲管理
    +關注

    關注

    0

    文章

    30

    瀏覽量

    9147

原文標題:虹科方案 | 使用數(shù)據(jù)可觀測性減少Confluent Cloud Kafka 運營成本的五種方式

文章出處:【微信號:Hongketeam,微信公眾號:廣州虹科電子科技有限公司】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    LMH7322怎樣改善輸出波形 ?

    圖一 我按照LMH7322資料中,按照上圖一 畫的 PCB圖 (見圖二) 圖二 測試時輸出的波形為: 請問工程師 怎樣改善輸出波形 ?
    發(fā)表于 09-02 06:57

    面試官:Kafka會丟消息嗎?

    許多開發(fā)人員普遍認為,Kafka 的設計本身就能保證不會丟失消息。然而,Kafka 架構和配置的細微差別會導致消息的丟失。我們需要了解它如何以及何時可能丟失消息,并防止此類情況的發(fā)生。
    的頭像 發(fā)表于 04-29 17:32 ?828次閱讀
    面試官:<b class='flag-5'>Kafka</b>會丟消息嗎?

    X2電容的容量減少,可能原因有哪些?

    很多電路損壞,查找原因后發(fā)現(xiàn)是X2安規(guī)電容的容量減少了,它甚至會導致整個電路無法正常工作,X2電容的容量減少,可能原因有哪些?
    的頭像 發(fā)表于 03-18 13:58 ?543次閱讀

    Redis流與Kafka相比如何?

    我們先來看看Kafka的基本架構?;镜臄?shù)據(jù)結構是主題。它是一個按時間排序的記錄序列,只需追加。使用這種數(shù)據(jù)結構的好處在Jay Kreps的經(jīng)典博文The Log中得到了很好的描述。
    的頭像 發(fā)表于 02-21 16:09 ?349次閱讀
    Redis流與<b class='flag-5'>Kafka</b>相比如何?

    kafka基本原理詳解

    今天浩道跟大家分享一篇關于kafka相關原理的硬核干貨,可以說即使你沒有接觸過kafka,也可以秒懂,一起看看!
    的頭像 發(fā)表于 01-03 09:57 ?786次閱讀
    <b class='flag-5'>kafka</b>基本原理詳解

    怎樣減少路徑上的LUT個數(shù)使速度更快?

    對FPGA設計而言如果想速度更快則應當努力減少路徑上LUT的個數(shù),而不是邏輯級數(shù)。
    的頭像 發(fā)表于 12-27 09:03 ?478次閱讀
    <b class='flag-5'>怎樣</b><b class='flag-5'>減少</b>路徑上的LUT個數(shù)使速度更快<b class='flag-5'>呢</b>?

    kafka支持哪些消息交付語義?

    在讀完kafka官方文檔,kafka設計里的消息交付語義一章后,給我的第一印象是內(nèi)容很抽象,于是草擬和總結了給個副標題,并把相關內(nèi)容進行了歸類;有些生澀的句子,盡量用大白話和舉例進行說明,并加入了總結。
    的頭像 發(fā)表于 12-22 11:27 ?396次閱讀
    <b class='flag-5'>kafka</b>支持哪些消息交付語義?

    如何保證kafka消息不丟失

    如果在簡歷上寫了使用過kafka消息中間件,面試官大概80%的概率會問你:"如何保證kafka消息不丟失?"反正我是屢試不爽。
    的頭像 發(fā)表于 12-19 09:52 ?611次閱讀
    如何保證<b class='flag-5'>kafka</b>消息不丟失

    golang中使用kafka的綜合指南

    kafka是一個比較流行的分布式、可拓展、高性能、可靠的流處理平臺。在處理kafka的數(shù)據(jù)時,這里有確保處理效率和可靠性的多種最佳實踐。本文將介紹這幾種實踐方式,并通過sarama實現(xiàn)他們。
    的頭像 發(fā)表于 11-30 11:18 ?457次閱讀

    Google Cloud 線上課堂 | Google Cloud 遷移最佳實踐

    數(shù)據(jù)中心的數(shù)千個復雜工作負載,將這些應用及數(shù)據(jù)遷移到新環(huán)境時面臨各種挑戰(zhàn):如何降低遷移復雜性并控制成本?如何保證業(yè)務連續(xù)性及數(shù)據(jù)安全...... Google Cloud 通過經(jīng)過驗證的企業(yè)級工具和方法,幫助組織將工作負載順利從本地和其他云環(huán)境遷移到 Google
    的頭像 發(fā)表于 11-28 17:45 ?382次閱讀

    如何將Kafka使用到我們的后端設計中

    :《hello-world-in-kafka-using-python》,有部分刪改。 1.Kafka是什么、為什么我們需要它? 簡而言之,Kafka是一個分布式消息系統(tǒng)。這是什么意思
    的頭像 發(fā)表于 10-30 14:30 ?417次閱讀
    如何將<b class='flag-5'>Kafka</b>使用到我們的后端設計中

    kafka相關命令詳解

    kafka常用命令詳解
    的頭像 發(fā)表于 10-20 11:34 ?734次閱讀

    Kafka架構技術:Kafka的架構和客戶端API設計

    Kafka 給自己的定位是事件流平臺(event stream platform)。因此在消息隊列中經(jīng)常使用的 "消息"一詞,在 Kafka 中被稱為 "事件"。
    的頭像 發(fā)表于 10-10 15:41 ?730次閱讀
    <b class='flag-5'>Kafka</b>架構技術:<b class='flag-5'>Kafka</b>的架構和客戶端API設計

    Spring Kafka的各種用法

    最近業(yè)務上用到了Spring Kafka,所以系統(tǒng)性的探索了下Spring Kafka的各種用法,發(fā)現(xiàn)了很多實用的特性,下面介紹下Spring Kafka的消息重試機制。 0. 前言 原生
    的頭像 發(fā)表于 09-25 17:04 ?810次閱讀

    kafka client在 spring如何實現(xiàn)

    消息中間件,比如 Kafka、RabbitMq,只需要簡單的引入 jar,就可以通過注解+配置快速集成到項目中。 開始一個 Pulsar Starter 既然已經(jīng)了解了 Apache Pulsar ,又
    的頭像 發(fā)表于 09-25 11:21 ?399次閱讀
    <b class='flag-5'>kafka</b> client在 spring如何實現(xiàn)