0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何將Kafka使用到我們的后端設(shè)計中

科技綠洲 ? 來源:Python實用寶典 ? 作者:Python實用寶典 ? 2023-10-30 14:30 ? 次閱讀

本文介紹了以下內(nèi)容:

1.什么是Kafka?

2.為什么我們需要使用Kafka這樣的消息系統(tǒng)及使用它的好處

3.如何將Kafka使用到我們的后端設(shè)計中。

譯自timber.io:《hello-world-in-kafka-using-python》,有部分刪改。

1.Kafka是什么、為什么我們需要它?

簡而言之,Kafka是一個分布式消息系統(tǒng)。這是什么意思呢?

想象一下,你現(xiàn)在有一個簡單的Web應(yīng)用,其包含了網(wǎng)頁前端客戶端(Client)、服務(wù)端和數(shù)據(jù)庫:

圖片

你需要記錄所有發(fā)生在你的Web應(yīng)用的事件,比如點擊、請求、搜索等,以便后續(xù)進行計算和運營分析。

假設(shè)每個事件都由單獨的APP完成,那么一個簡單的解決方案就是將數(shù)據(jù)存儲在數(shù)據(jù)庫中,所有APP連接到數(shù)據(jù)庫進行存儲:

圖片

這看起來簡單,但是其中還會出現(xiàn)許多問題:

1.點擊、請求、搜索等事件會產(chǎn)生大量的數(shù)據(jù)到數(shù)據(jù)庫中,這可能會導(dǎo)致插入事件存在延遲。

2.如果選擇將高頻數(shù)據(jù)存儲在SQL或MongoDB等數(shù)據(jù)庫中,很難再原有歷史數(shù)據(jù)的基礎(chǔ)上擴展數(shù)據(jù)庫。

3.如果你需要用這些數(shù)據(jù)進行數(shù)據(jù)分析,你可能無法直接對數(shù)據(jù)庫進行高頻率的讀取操作。

4.每個APP可以遵循自己的數(shù)據(jù)格式,這就意味著當(dāng)你需要在不同的APP進行數(shù)據(jù)交換時,你需要進行數(shù)據(jù)格式的轉(zhuǎn)換。

通過使用像Kafka這樣的消息流系統(tǒng),可以很好地解決這些問題,因為他們可以執(zhí)行以下操作:

1.存儲的大量數(shù)據(jù)可以被持久化、校驗和復(fù)制,具備容錯能力。

2.支持跨系統(tǒng)實時處理連續(xù)的數(shù)據(jù)流。

3.允許APP獨立發(fā)布數(shù)據(jù)或數(shù)據(jù)流,并與使用它的APP無關(guān)。

那么它和傳統(tǒng)數(shù)據(jù)庫有何不同?

盡管Kafka可以持久化地存儲數(shù)據(jù),但它不是數(shù)據(jù)庫。

Kafka不僅允許APP存儲或提取連續(xù)的數(shù)據(jù)流,還支持實時處理。這與對被動數(shù)據(jù)執(zhí)行CRUD操作或?qū)鹘y(tǒng)數(shù)據(jù)庫執(zhí)行查詢的方式不同。

聽起來不錯,那么Kafka是如何解決以上挑戰(zhàn)的?

Kafka是一個分布式平臺,是為規(guī)模而構(gòu)建的,這意味著它可以處理高頻率的讀寫和存儲大量數(shù)據(jù)。它確保數(shù)據(jù)始終可靠。它還支持從故障中恢復(fù)的強大機制。

以下是為什么應(yīng)該使用Kafka的一些關(guān)鍵因素:

1.1 簡化后端架構(gòu)

在Kafka的幫助下,我們前面的結(jié)構(gòu)會變得簡單一些:

圖片

1.2 通用數(shù)據(jù)管道

如上所示,Kafka充當(dāng)多個APP和服務(wù)的通用數(shù)據(jù)管道,這給了我們兩個好處:

1.數(shù)據(jù)是集成的,我們將來自不同系統(tǒng)的數(shù)據(jù)都存在一個地方,這使得Kafka成為真正的數(shù)據(jù)源。任何APP都可以將數(shù)據(jù)推送到該平臺,然后由另一個APP提取數(shù)據(jù)。

2.Kafka使得應(yīng)用程序之間交換數(shù)據(jù)變得容易。因為我們可以標(biāo)準(zhǔn)化數(shù)據(jù)格式,減少了數(shù)據(jù)格式的轉(zhuǎn)換。

1.3 通用連接性

盡管Kafka允許你使用標(biāo)準(zhǔn)數(shù)據(jù)格式,但并不意味著你的APP就不需要數(shù)據(jù)轉(zhuǎn)換了,它只是減少了我們轉(zhuǎn)換數(shù)據(jù)的頻率罷了。

此外,Kafka提供了一個叫 Kafka Connect 的框架允許我們維護遺留的老系統(tǒng)。

1.4 實時數(shù)據(jù)處理

類似于監(jiān)控系統(tǒng)這樣的實時APP,往往需要連續(xù)的數(shù)據(jù)流,這些數(shù)據(jù)需要被立即處理或盡量減少延遲處理。

Kafka的流式處理,使得處理引擎可以在很短的時間內(nèi)(幾毫米到幾分鐘)內(nèi)取數(shù)、分析、以及響應(yīng)。

2.Kafka入門

2.1 安裝

安裝Kafka是一個相當(dāng)簡單的過程。只需遵循以下給定步驟:

1.下載最新的1.1.0版本的Kafka

2.使用以下命令解壓縮下載文件: tar -xzf kafka_2.11-1.1.0.tgz

3.cd到Kafka目錄開始使用它: cd kafka_2.11-1.1.0

2.2 啟動服務(wù)器

ZooKeeper是一個針對Kafka等分布式環(huán)境的集中管理工具,它為大型分布式系統(tǒng)提供配置服務(wù)、同步服務(wù)及命名注冊表。

因此,我們需要先啟動ZooKeeper服務(wù)器,然后再啟動Kafka服務(wù)器。使用以下命令即可:

# Start ZooKeeper Server
bin/zookeeper-server-start.sh config/zookeeper.properties


# Start Kafka Server
bin/kafka-server-start.sh config/server.properties

2.3 Kafka 基本概念

我們快速介紹一下Kafka體系結(jié)構(gòu)的核心概念:

1.Kafka在一個或多個服務(wù)器上作為集群運行。

2.Kafka將數(shù)據(jù)流存儲在名為topics的類別中。每條數(shù)據(jù)均由鍵、值、時間戳組成。

3.Kafka使用發(fā)布-訂閱模式。它允許某些APP充當(dāng)producers(生產(chǎn)者),記錄數(shù)據(jù)并將數(shù)據(jù)發(fā)布到Kafka topic中。

同樣,它允許某些APP充當(dāng)consumer(消費者)和訂閱Kafka topic并處理由它產(chǎn)生的數(shù)據(jù)。

4.除了Prodcuer API 和 Consumer API,Kafka還為應(yīng)用提供了一個 Streams API 作為流處理器。通過 Connector API 我們可以將Kafka連接到其他現(xiàn)有的應(yīng)用程序和數(shù)據(jù)系統(tǒng)。

2.4 架構(gòu)

圖片

如你所見,每個Kafka的 Topic 可以分為多個Partition(分區(qū)),可以使用broker(經(jīng)紀(jì)人)在不同的計算機上復(fù)制這些 Topic,從而使消費者可以并行讀取 Topic.

kafka的復(fù)制是針對分區(qū)的:

圖片

比如上圖中有4個broker, 1個topic, 2個分區(qū),復(fù)制因子是3。當(dāng)producer發(fā)送一個消息的時候,它會選擇一個分區(qū),比如topic1-part1分區(qū),將消息發(fā)送給這個分區(qū)的leader, broker2、broker3會拉取這個消息,一旦消息被拉取過來,slave會發(fā)送ack給master,這時候master才commit這個log。

因此,整個系統(tǒng)的容錯級別極高。當(dāng)系統(tǒng)正常運行時,對Topic的所有讀取和寫入都將通過leader,且leader會保證所有其他broker均被更新。

如果Broker失效了,系統(tǒng)會自動重新配置,此時副本也可以接管成為Leader.

2.5 創(chuàng)建Kafka Topic

讓我們創(chuàng)建一個名為 sample,含有一個partition(分區(qū))和一個replica(副本)的Kafka Topic:

bin/kafka-topics.sh --create --zookeeper localhost:2181 --replication-factor 1 --partitions 1 --topic sample

列出所有的Kafka Topics,檢查是否成功創(chuàng)建了sample Topic:

bin/kafka-topics.sh --list --zookeeper localhost:2181

describe topics 命令還可以獲得特定Topic的詳細信息

bin/kafka-topics.sh --describe --zookeeper localhost:2181 --topic sample

2.6 創(chuàng)建生產(chǎn)者與消費者

這里是本章的代碼實戰(zhàn)部分,利用Kafka-Python實現(xiàn)簡單的生產(chǎn)者和消費者。

1.首先需要安裝kafka-python:

pip install kafka-python

2.創(chuàng)建消費者(consumer.py)

from kafka import KafkaConsumer
consumer = KafkaConsumer('sample')
for message in consumer:
    print (message)

3.創(chuàng)建生產(chǎn)者(producer.py)

有一個消費者正在訂閱我們的消息流,因此我們要創(chuàng)建一個生產(chǎn)者,發(fā)布消息到Kafka:

from kafka import KafkaProducer
producer = KafkaProducer(bootstrap_servers='localhost:9092')
producer.send('sample', b'Hello, World!')
producer.send('sample', key=b'message-two', value=b'This is Kafka-Python')

現(xiàn)在,你重新運行消費者(consumer.py),你就會接收到生產(chǎn)者發(fā)送過來的消息。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 存儲
    +關(guān)注

    關(guān)注

    13

    文章

    4226

    瀏覽量

    85578
  • 數(shù)據(jù)庫
    +關(guān)注

    關(guān)注

    7

    文章

    3752

    瀏覽量

    64233
  • 服務(wù)端
    +關(guān)注

    關(guān)注

    0

    文章

    66

    瀏覽量

    6978
  • Web應(yīng)用
    +關(guān)注

    關(guān)注

    0

    文章

    16

    瀏覽量

    3467
  • kafka
    +關(guān)注

    關(guān)注

    0

    文章

    50

    瀏覽量

    5202
收藏 人收藏

    評論

    相關(guān)推薦

    探討如何將機器學(xué)習(xí)應(yīng)用到物聯(lián)網(wǎng)

    本項目探討如何將機器學(xué)習(xí)(Machine learning)應(yīng)用到物聯(lián)網(wǎng)(IoT,Internet of Things)我們將使用 Android Things 作為
    的頭像 發(fā)表于 05-23 09:24 ?8953次閱讀

    如何將LCD運用到低通濾波電路里

    本帖最后由 klysa 于 2011-11-2 17:28 編輯 如題如何將LCD運用到低通濾波電路里
    發(fā)表于 11-02 17:28

    如何將DRIVEDONE屬性傳播到我的mcs文件生成?

    我正在使用Kintex-7部分,由于某種原因(尚未完全研究),我必須將BITSTREAM.CONFIG.DRIVEDONE屬性設(shè)置為yes以便能夠位文件加載到FPGA。現(xiàn)在我遇到了編程SPI PROM的問題 - 表明完成的引腳沒有變高。
    發(fā)表于 06-04 07:29

    請問如何將Swift語言應(yīng)用到MCU開發(fā)

    請問如何將Swift語言應(yīng)用到MCU開發(fā)?
    發(fā)表于 02-11 07:30

    如何將UDESTK的調(diào)試屏幕添加到我的SPC5上呢

    我找不到如何將 UDESTK 的調(diào)試屏幕添加到我的 SPC5,你能給我建議正確的方法嗎?
    發(fā)表于 12-20 07:02

    如何將RAFL添加到我的項目的適當(dāng)示例和/或文檔?

    我無法找到有關(guān)如何將 RAFL 添加到我的項目的適當(dāng)示例和/或文檔。查看 RFAL 的 rfal.chm 文件有一個示例,但它對我不起作用?當(dāng)我查看 X-CUBE-NFC5.chm 時,應(yīng)該有 4
    發(fā)表于 01-10 06:02

    IDE如何將外圍頭文件包含在我的項目中并連接到我的項目?

    我正在使用系統(tǒng)工作臺 IDE。我想包括一些外圍頭文件,如 LCD 16x2 。請告訴我如何將這些文件包含在我的項目中并連接到我的項目?
    發(fā)表于 02-07 08:17

    如何將ESP32置于認證過程所需的模式?

    二進制形式提供 FCC 測試軟件。我已經(jīng)聯(lián)系 Espressif 看我是否可以獲得源代碼或二進制庫,以便我可以將其合并到我們的測試代碼,他們回答說不會提供代碼。有誰知道如何將 ESP32 置于認證過程所需的模式
    發(fā)表于 03-01 08:03

    如何將MCU應(yīng)用到FPGA:關(guān)于FPGA(1)

    最近,我接手一個項目,這個項目不僅要求我使用FPGA,而且還要求我使用功能更強大的ARM。這都是我從未接觸過的領(lǐng)域。在這個系列博客,我介紹我是如何將自己現(xiàn)有的MCU知識和經(jīng)驗運用到
    發(fā)表于 05-08 15:41 ?3882次閱讀

    如何將物聯(lián)網(wǎng)數(shù)據(jù)從設(shè)備連接到Kafka集群?

    Apache Kafka是一個實時流平臺,在大大小小的組織得到了廣泛的采用。Kafka的分布式微服務(wù)架構(gòu)和發(fā)布/訂閱協(xié)議使得它非常適合在企業(yè)系統(tǒng)和應(yīng)用程序之間實時移動數(shù)據(jù)。據(jù)統(tǒng)計,超過三分之一
    發(fā)表于 07-20 09:10 ?2123次閱讀

    如何將物聯(lián)網(wǎng)數(shù)據(jù)從設(shè)備連接到Kafka集群?

    在與HiveMQ客戶的對話,一些操作集群具有數(shù)百萬臺設(shè)備和非常高的消息吞吐量,我們看到需要為Kafka創(chuàng)建MQTT代理擴展。我們的客戶希望從MQTT和
    發(fā)表于 07-28 11:53 ?1421次閱讀

    如何將轉(zhuǎn)換器設(shè)計指標(biāo)應(yīng)用到 Fly-Buck 電路設(shè)計

    本博客共分兩個部分,第 1 部分我們探討了使 Fly-Buck 設(shè)計穩(wěn)定所需的重要設(shè)計指標(biāo)。本文我們介紹如何將這些設(shè)計指標(biāo)應(yīng)用到 Fly-
    的頭像 發(fā)表于 01-28 09:24 ?1479次閱讀
    <b class='flag-5'>如何將</b>轉(zhuǎn)換器設(shè)計指標(biāo)應(yīng)<b class='flag-5'>用到</b> Fly-Buck 電路設(shè)計<b class='flag-5'>中</b>

    如何將大模型應(yīng)用到效能評估系統(tǒng)中去

    維度對應(yīng)用數(shù)據(jù)進行評估,從而對應(yīng)用的效能產(chǎn)生評估,進而獲得量化評估應(yīng)用的效能水平的總分數(shù)。 智慧華盛恒輝效能評估系統(tǒng)大模型應(yīng)用到效能評估系統(tǒng)是一項具有挑戰(zhàn)性的任務(wù)。首先,我們需要考
    的頭像 發(fā)表于 09-27 16:16 ?492次閱讀

    如何將1-Wire主機復(fù)用到多個通道?

    如何將1-Wire主機復(fù)用到多個通道? 1-Wire是一種串行通信協(xié)議,可用于連接各種感測器和芯片,如溫度傳感器、濕度傳感器、EEPROM等。通常情況下,每個1-Wire主機(例如單片機)只能連接一
    的頭像 發(fā)表于 10-29 14:21 ?540次閱讀

    Standard cell是怎么應(yīng)用到我們后端設(shè)計的呢?

    Standard cell,標(biāo)準(zhǔn)單元,或者簡稱cell,可以說是數(shù)字芯片后端最基本的概念之一了,甚至可能沒有接觸過后端的同學(xué)也有所耳聞?
    的頭像 發(fā)表于 12-04 11:44 ?885次閱讀