0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

針對Redis服務我們應該避免哪些性能浪費

Android編程精選 ? 來源:簡書 ? 作者:劉思寧 ? 2021-10-28 14:07 ? 次閱讀

來源:www.jianshu.com/p/67093716547b

在一些網(wǎng)絡服務的系統(tǒng)中,Redis 的性能,可能是比 MySQL 等硬盤數(shù)據(jù)庫的性能更重要的課題。比如微博,把熱點微博[1],最新的用戶關系[2],都存儲在 Redis 中,大量的查詢擊中 Redis,而不走 MySQL。

那么,針對 Redis 服務,我們能做哪些性能優(yōu)化呢?或者說,應該避免哪些性能浪費呢?

Redis 性能的基本面

在討論優(yōu)化之前,我們需要知道,Redis 服務本身就有一些特性,比如單線程運行。除非修改 Redis 的源代碼,不然這些特性,就是我們思考性能優(yōu)化的基本面。

那么,有哪些 Redis 基本特性需要我們考慮呢?Redis 的項目介紹中概括了它特性:

Redis is an in-memory database that persists on disk. The data model is key-value, but many different kind of values are supported.

首先,Redis 使用操作系統(tǒng)提供的虛擬內(nèi)存來存儲數(shù)據(jù)。而且,這個操作系統(tǒng)一般就是指 Unix。Windows 上也能運行 Redis,但是需要特殊處理。如果你的操作系統(tǒng)使用交換空間,那么 Redis 的數(shù)據(jù)可能會被實際保存在硬盤上。

其次,Redis 支持持久化,可以把數(shù)據(jù)保存在硬盤上。很多時候,我們也確實有必要進行持久化來實現(xiàn)備份,數(shù)據(jù)恢復等需求。但持久化不會憑空發(fā)生,它也會占用一部分資源。

第三,Redis 是用 key-value 的方式來讀寫的,而 value 中又可以是很多不同種類的數(shù)據(jù);更進一步,一個數(shù)據(jù)類型的底層還有被存儲為不同的結構。不同的存儲結構決定了數(shù)據(jù)增刪改查的復雜度以及性能開銷。

最后,在上面的介紹中沒有提到的是,Redis 大多數(shù)時候是單線程運行[2]的(single-threaded),即同一時間只占用一個 CPU,只能有一個指令在運行,并行讀寫是不存在的。很多操作帶來的延遲問題,都可以在這里找到答案。

關于最后這個特性,為什么 Redis 是單線程的,卻能有很好的性能(根據(jù) Amdahl’s Law,優(yōu)化耗時占比大的過程,才更有意義),兩句話概括是:Redis 利用了多路 I/O 復用機制[3],處理客戶端請求時,不會阻塞主線程;Redis 單純執(zhí)行(大多數(shù)指令)一個指令不到 1 微秒[4],如此,單核 CPU 一秒就能處理 1 百萬個指令(大概對應著幾十萬個請求吧),用不著實現(xiàn)多線程(網(wǎng)絡才是瓶頸[5])。

優(yōu)化網(wǎng)絡延時

Redis 的官方博客在幾個地方都說,性能瓶頸更可能是網(wǎng)絡[6],那么我們?nèi)绾蝺?yōu)化網(wǎng)絡上的延時呢?

首先,如果你們使用單機部署(應用服務和 Redis 在同一臺機器上)的話,使用 Unix 進程間通訊來請求 Redis 服務,速度比 localhost 局域網(wǎng)(學名 loopback)更快。官方文檔[7]是這么說的,想一想,理論上也應該是這樣的。

但很多公司的業(yè)務規(guī)模不是單機部署能支撐的,所以還是得用 TCP。

Redis 客戶端和服務器的通訊一般使用 TCP 長鏈接。如果客戶端發(fā)送請求后需要等待 Redis 返回結果再發(fā)送下一個指令,客戶端和 Redis 的多個請求就構成下面的關系:

(備注:如果不是你要發(fā)送的 key 特別長,一個 TCP 包完全能放下 Redis 指令,所以只畫了一個 push 包)這樣這兩次請求中,客戶端都需要經(jīng)歷一段網(wǎng)絡傳輸時間。

但如果有可能,完全可以使用 multi-key 類的指令來合并請求,比如兩個 GET key 可以用 MGET key1 key2 合并。這樣在實際通訊中,請求數(shù)也減少了,延時自然得到好轉。

如果不能用 multi-key 指令來合并,比如一個 SET,一個 GET 無法合并。怎么辦?

Redis 中有至少這樣兩個方法能合并多個指令到一個 request 中,一個是 MULTI/EXEC,一個是 script。前者本來是構建 Redis 事務的方法,但確實可以合并多個指令為一個 request,它到通訊過程如下。至于 script,最好利用緩存腳本的 sha1 hash key 來調起腳本,這樣通訊量更小。

這樣確實更能減少網(wǎng)絡傳輸時間,不是么?但如此以來,就必須要求這個 transaction / script 中涉及的 key 在同一個 node 上,所以要酌情考慮。

如果上面的方法我們都考慮過了,還是沒有辦法合并多個請求,我們還可以考慮合并多個 responses。比如把 2 個回復信息合并:

這樣,理論上可以省去 1 次回復所用的網(wǎng)絡傳輸時間。這就是 pipeline 做的事情。舉個 ruby 客戶端使用 pipeline 的例子:

require ‘redis’ @redis = Redis.new() @redis.pipelined do @redis.get ‘key1’ @redis.set ‘key2’ ‘some value’ end # =》 [1, 2]

據(jù)說,有些語言的客戶端,甚至默認就使用 pipeline 來優(yōu)化延時問題,比如 node_redis。

另外,不是任意多個回復信息都可以放進一個 TCP 包中,如果請求數(shù)太多,回復的數(shù)據(jù)很長(比如 get 一個長字符串),TCP 還是會分包傳輸,但使用 pipeline,依然可以減少傳輸次數(shù)。

pipeline 和上面的其他方法都不一樣的是,它不具有原子性。所以在 cluster 狀態(tài)下的集群上,實現(xiàn) pipeline 比那些原子性的方法更有可能。

小結一下:

使用 unix 進程間通信,如果單機部署

使用 multi-key 指令合并多個指令,減少請求數(shù),如果有可能的話

使用 transaction、script 合并 requests 以及 responses

使用 pipeline 合并 response

警惕執(zhí)行時間長的操作

在大數(shù)據(jù)量的情況下,有些操作的執(zhí)行時間會相對長,比如 KEYS *,LRANGE mylist 0 -1,以及其他算法復雜度為 O(n) 的指令。因為 Redis 只用一個線程來做數(shù)據(jù)查詢,如果這些指令耗時很長,就會阻塞 Redis,造成大量延時。

盡管官方文檔中說 KEYS *的查詢挺快的,(在普通筆記本上)掃描 1 百萬個 key,只需 40 毫秒(參見:https://redis.io/commands/keys),但幾十 ms 對于一個性能要求很高的系統(tǒng)來說,已經(jīng)不短了,更何況如果有幾億個 key(一臺機器完全可能存幾億個 key,比如一個 key 100字節(jié),1 億個 key 只有 10GB),時間更長。

所以,盡量不要在生產(chǎn)環(huán)境的代碼使用這些執(zhí)行很慢的指令,這一點 Redis 的作者在博客[8]中也提到了。另外,運維同學查詢 Redis 的時候也盡量不要用。甚至,Redis Essential 這本書建議利用 rename-command KEYS ‘’ 來禁止使用這個耗時的指令。

除了這些耗時的指令,Redis 中 transaction,script,因為可以合并多個 commands 為一個具有原子性的執(zhí)行過程,所以也可能占用 Redis 很長時間,需要注意。

如果你想找出生產(chǎn)環(huán)境使用的「慢指令」,那么可以利用 SLOWLOG GET count 來查看最近的 count 個執(zhí)行時間很長的指令。至于多長算長,可以通過在 redis.conf 中設置 slowlog-log-slower-than 來定義。

除此之外,在很多地方都沒有提到的一個可能的慢指令是 DEL,但 redis.conf 文件的注釋[9]中倒是說了。長話短說就是 DEL 一個大的 object 時候,回收相應的內(nèi)存可能會需要很長時間(甚至幾秒),所以,建議用 DEL 的異步版本:UNLINK。后者會啟動一個新的 thread 來刪除目標 key,而不阻塞原來的線程。

更進一步,當一個 key 過期之后,Redis 一般也需要同步的把它刪除。其中一種刪除 keys 的方式是,每秒 10 次的檢查一次有設置過期時間的 keys,這些 keys 存儲在一個全局的 struct 中,可以用 server.db-》expires 訪問。

檢查的方式是:

從中隨機取出 20 個 keys

把過期的刪掉。

如果剛剛 20 個 keys 中,有 25% 以上(也就是 5 個以上)都是過期的,Redis 認為,過期的 keys 還挺多的,繼續(xù)重復步驟 1,直到滿足退出條件:某次取出的 keys 中沒有那么多過去的 keys。

這里對于性能的影響是,如果真的有很多的 keys 在同一時間過期,那么 Redis 真的會一直循環(huán)執(zhí)行刪除,占用主線程。

對此,Redis 作者的建議[10]是警惕 EXPIREAT 這個指令,因為它更容易產(chǎn)生 keys 同時過期的現(xiàn)象。我還見到過一些建議是給 keys 的過期時間設置一個隨機波動量。最后,redis.conf 中也給出了一個方法,把 keys 的過期刪除操作變?yōu)楫惒降?,即,?redis.conf 中設置 lazyfree-lazy-expire yes。

優(yōu)化數(shù)據(jù)結構、使用正確的算法

一種數(shù)據(jù)類型(比如 string,list)進行增刪改查的效率是由其底層的存儲結構決定的。

我們在使用一種數(shù)據(jù)類型時,可以適當關注一下它底層的存儲結構及其算法,避免使用復雜度太高的方法。

舉兩個例子:

ZADD的時間復雜度是 O(log(N)),這比其他數(shù)據(jù)類型增加一個新元素的操作更復雜,所以要小心使用。

若 Hash 類型的值的 fields 數(shù)量有限,它很有可能采用 ziplist 這種結構做存儲,而 ziplist 的查詢效率可能沒有同等字段數(shù)量的 hashtable 效率高,在必要時,可以調整 Redis 的存儲結構。

除了時間性能上的考慮,有時候我們還需要節(jié)省存儲空間。比如上面提到的 ziplist 結構,就比 hashtable 結構節(jié)省存儲空間(Redis Essentials 的作者分別在 hashtable 和 ziplist 結構的 Hash 中插入 500 個 fields,每個 field 和 value 都是一個 15 位左右的字符串,結果是 hashtable 結構使用的空間是 ziplist 的 4 倍。)。但節(jié)省空間的數(shù)據(jù)結構,其算法的復雜度可能很高。所以,這里就需要在具體問題面前做出權衡。

如何做出更好的權衡?我覺得得深挖 Redis 的存儲結構才能讓自己安心。這方面的內(nèi)容我們下次再說。

以上這三點都是編程層面的考慮,寫程序時應該注意啊。下面這幾點,也會影響 Redis 的性能,但解決起來,就不只是靠代碼層面的調整了,還需要架構和運維上的考慮。

考慮操作系統(tǒng)和硬件是否影響性能

Redis 運行的外部環(huán)境,也就是操作系統(tǒng)和硬件顯然也會影響 Redis 的性能。在官方文檔中,就給出了一些例子:

CPU:Intel 多種 CPU 都比 AMD 皓龍系列好

虛擬化:實體機比虛擬機好,主要是因為部分虛擬機上,硬盤不是本地硬盤,監(jiān)控軟件導致 fork 指令的速度慢(持久化時會用到 fork),尤其是用 Xen 來做虛擬化時。

內(nèi)存管理:在 linux 操作系統(tǒng)中,為了讓 translation lookaside buffer,即 TLB,能夠管理更多內(nèi)存空間(TLB 只能緩存有限個 page),操作系統(tǒng)把一些 memory page 變得更大,比如 2MB 或者 1GB,而不是通常的 4096 字節(jié),這些大的內(nèi)存頁叫做 huge pages。同時,為了方便程序員使用這些大的內(nèi)存 page,操作系統(tǒng)中實現(xiàn)了一個 transparent huge pages(THP)機制,使得大內(nèi)存頁對他們來說是透明的,可以像使用正常的內(nèi)存 page 一樣使用他們。但這種機制并不是數(shù)據(jù)庫所需要的,可能是因為 THP 會把內(nèi)存空間變得緊湊而連續(xù)吧,就像mongodb 的文檔[11]中明確說的,數(shù)據(jù)庫需要的是稀疏的內(nèi)存空間,所以請禁掉 THP 功能。Redis 也不例外,但 Redis 官方博客上給出的理由是:使用大內(nèi)存 page 會使 bgsave 時,fork 的速度變慢;如果 fork 之后,這些內(nèi)存 page 在原進程中被修改了,他們就需要被復制(即 copy on write),這樣的復制會消耗大量的內(nèi)存(畢竟,人家是 huge pages,復制一份消耗成本很大)。所以,請禁止掉操作系統(tǒng)中的 transparent huge pages 功能。

交換空間:當一些內(nèi)存 page 被存儲在交換空間文件上,而 Redis 又要請求那些數(shù)據(jù),那么操作系統(tǒng)會阻塞 Redis 進程,然后把想要的 page,從交換空間中拿出來,放進內(nèi)存。這其中涉及整個進程的阻塞,所以可能會造成延時問題,一個解決方法是禁止使用交換空間(Redis Essentials 中如是建議,如果內(nèi)存空間不足,請用別的方法處理)。

考慮持久化帶來的開銷

Redis 的一項重要功能就是持久化,也就是把數(shù)據(jù)復制到硬盤上?;诔志没?,才有了 Redis 的數(shù)據(jù)恢復等功能。

但維護這個持久化的功能,也是有性能開銷的。

首先說,RDB 全量持久化。

這種持久化方式把 Redis 中的全量數(shù)據(jù)打包成 rdb 文件放在硬盤上。但是執(zhí)行 RDB 持久化過程的是原進程 fork 出來一個子進程,而 fork 這個系統(tǒng)調用是需要時間的,根據(jù)Redis Lab 6 年前做的實驗[12],在一臺新型的 AWS EC2 m1.small^13 上,fork 一個內(nèi)存占用 1GB 的 Redis 進程,需要 700+ 毫秒,而這段時間,redis 是無法處理請求的。

雖然現(xiàn)在的機器應該都會比那個時候好,但是 fork 的開銷也應該考慮吧。為此,要使用合理的 RDB 持久化的時間間隔,不要太頻繁。

接下來,我們看另外一種持久化方式:AOF 增量持久化。

這種持久化方式會把你發(fā)到 redis server 的指令以文本的形式保存下來(格式遵循 redis protocol),這個過程中,會調用兩個系統(tǒng)調用,一個是 write(2),同步完成,一個是 fsync(2),異步完成。

這兩部都可能是延時問題的原因:

write 可能會因為輸出的 buffer 滿了,或者 kernal 正在把 buffer 中的數(shù)據(jù)同步到硬盤,就被阻塞了。

fsync 的作用是確保 write 寫入到 aof 文件的數(shù)據(jù)落到了硬盤上,在一個 7200 轉/分的硬盤上可能要延時 20 毫秒左右,消耗還是挺大的。更重要的是,在 fsync 進行的時候,write 可能會被阻塞。

其中,write 的阻塞貌似只能接受,因為沒有更好的方法把數(shù)據(jù)寫到一個文件中了。但對于 fsync,Redis 允許三種配置,選用哪種取決于你對備份及時性和性能的平衡:

always:當把 appendfsync 設置為 always,fsync 會和客戶端的指令同步執(zhí)行,因此最可能造成延時問題,但備份及時性最好。

everysec:每秒鐘異步執(zhí)行一次 fsync,此時 redis 的性能表現(xiàn)會更好,但是 fsync 依然可能阻塞 write,算是一個折中選擇。

no:redis 不會主動出發(fā) fsync (并不是永遠不 fsync,那是不太可能的),而由 kernel 決定何時 fsync

使用分布式架構 —— 讀寫分離、數(shù)據(jù)分片

以上,我們都是基于單臺,或者單個 Redis 服務進行優(yōu)化。下面,我們考慮當網(wǎng)站的規(guī)模變大時,利用分布式架構來保障 Redis 性能的問題。

首先說,哪些情況下不得不(或者最好)使用分布式架構:

數(shù)據(jù)量很大,單臺服務器內(nèi)存不可能裝得下,比如 1 個 T 這種量級

需要服務高可用

單臺的請求壓力過大

解決這些問題可以采用數(shù)據(jù)分片或者主從分離,或者兩者都用(即,在分片用的 cluster 節(jié)點上,也設置主從結構)。

這樣的架構,可以為性能提升加入新的切入點:

把慢速的指令發(fā)到某些從庫中執(zhí)行

把持久化功能放在一個很少使用的從庫上

把某些大 list 分片

其中前兩條都是根據(jù) Redis 單線程的特性,用其他進程(甚至機器)做性能補充的方法。

當然,使用分布式架構,也可能對性能有影響,比如請求需要被轉發(fā),數(shù)據(jù)需要被不斷復制分發(fā)。(待查)

后話

其實還有很多東西也影響 Redis 的性能,比如 active rehashing(keys 主表的再哈希,每秒 10 次,關掉它可以提升一點點性能),但是這篇博客已經(jīng)寫的很長了。而且,更重要不是收集已經(jīng)被別人提出的問題,然后記憶解決方案;而是掌握 Redis 的基本原理,以不變應萬變的方式杜絕新出現(xiàn)的問題。

責任編輯:haq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 網(wǎng)絡
    +關注

    關注

    14

    文章

    7389

    瀏覽量

    88213
  • Redis
    +關注

    關注

    0

    文章

    368

    瀏覽量

    10780

原文標題:參考資料

文章出處:【微信號:AndroidPush,微信公眾號:Android編程精選】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    Redis 開源協(xié)議調整,我們怎么辦?

    2 024 年 3 月 20 日, Redis 官方宣布,從 Redis 7.4 版本開始,Redis 將獲得源可用許可證 ( RSALv2 ) 和服務器端公共許可證 ( SSPLv1
    的頭像 發(fā)表于 05-09 22:59 ?317次閱讀
    <b class='flag-5'>Redis</b> 開源協(xié)議調整,<b class='flag-5'>我們</b>怎么辦?

    Redis開源版與Redis企業(yè)版,怎么選用?

    點擊“藍字”關注我們數(shù)以千計的企業(yè)和數(shù)以百萬計的開發(fā)人員Redis開源版來構建應用程序。但隨著用戶數(shù)量、數(shù)據(jù)量和地區(qū)性的增加,成本、可擴展性、運營和可用性等問題也隨之而來。Redis企業(yè)版
    的頭像 發(fā)表于 04-04 08:04 ?696次閱讀
    <b class='flag-5'>Redis</b>開源版與<b class='flag-5'>Redis</b>企業(yè)版,怎么選用?

    如何避免錫膏的浪費?

    錫膏在使用中,有手動印刷和機器印刷。手動印刷要比機器印刷浪費得多一些,但是在機器印刷中也是極為容易出現(xiàn)浪費的。雖說錫膏在使用過程中的浪費是不可避免的,但有些情況是可以控制的,下面由深圳
    的頭像 發(fā)表于 02-23 17:26 ?270次閱讀
    如何<b class='flag-5'>避免</b>錫膏的<b class='flag-5'>浪費</b>?

    聊聊Redis的使用案例

    今天我們來聊聊 Redis 的使用案例。
    的頭像 發(fā)表于 12-13 14:13 ?407次閱讀

    【愛芯派 Pro 開發(fā)板試用體驗】Redis源碼編譯和基準測試

    ; redis-benchmark Redis基準測試程序,用于進行性能測試; redis-cli Redis命令行程序,用于操作
    發(fā)表于 12-10 22:18

    【昉·星光 2 高性能RISC-V單板計算機體驗】Redis源碼編譯和性能測試以及與樹莓派4B對比

    同一版本的Redis服務Redis基準測試。測試結果顯示,VisionFive2上Redis性能明顯由于樹莓派4B,這一定程度上說明——V
    發(fā)表于 12-10 21:27

    redis容器內(nèi)怎么查看redis日志

    redis是一款流行的開源內(nèi)存數(shù)據(jù)庫,常用于緩存、消息隊列、任務管理等場景。在使用redis時,了解如何查看redis日志對于排查問題、監(jiān)控性能和分析應用程序行為非常重要。在本文中,
    的頭像 發(fā)表于 12-05 10:10 ?2923次閱讀

    redis的lru原理

    Redis是一種基于內(nèi)存的鍵值數(shù)據(jù)庫,它使用了LRU(Least Recently Used)算法來進行緩存的數(shù)據(jù)淘汰。LRU算法的核心思想是最近最少使用的數(shù)據(jù)將會在未來也不常用,因此應該優(yōu)先
    的頭像 發(fā)表于 12-05 09:56 ?526次閱讀

    redis查看主從節(jié)點命令

    服務器的數(shù)據(jù)復制到其他 Redis 服務器的過程。其中一個 Redis 服務器作為主服務器,其
    的頭像 發(fā)表于 12-04 11:44 ?1053次閱讀

    redis集群性能測試工具有哪些

    Redis是一種高性能的內(nèi)存鍵值存儲系統(tǒng),它被廣泛應用于各種互聯(lián)網(wǎng)應用和大規(guī)模的數(shù)據(jù)存儲中。為了評估Redis在不同場景下的性能,我們需要使
    的頭像 發(fā)表于 12-04 11:36 ?601次閱讀

    redis連接數(shù)對性能測試影響

    連接數(shù)對性能測試的影響。 連接數(shù)與并發(fā)性能: 在性能測試中,連接數(shù)代表著客戶端同時連接到Redis服務器的數(shù)量。連接數(shù)的增加會增加并發(fā)操作的
    的頭像 發(fā)表于 12-04 11:33 ?811次閱讀

    java redis鎖處理并發(fā)代碼

    在并發(fā)編程中,一個常見的問題是如何確保多個線程安全地訪問共享資源,避免產(chǎn)生競態(tài)條件和數(shù)據(jù)異常。而Redis作為一種高性能的內(nèi)存數(shù)據(jù)庫,可以提供分布式鎖的功能,通過Redis鎖,
    的頭像 發(fā)表于 12-04 11:04 ?764次閱讀

    Java redis鎖怎么實現(xiàn)

    進入Redis目錄,運行 make 命令編譯Redis 運行 redis-server 啟動Redis服務器 可以運行
    的頭像 發(fā)表于 12-04 10:47 ?911次閱讀

    Cloud MemoryStore for Redis Cluster 正式發(fā)布

    以下文章來源于谷歌云服務,作者 Google Cloud 自從我們推出 Memorystore for Redis Cluster 預覽版以來,銀行、零售、廣告、制造和社交媒體等各個行業(yè)的客戶都利用
    的頭像 發(fā)表于 11-24 17:40 ?306次閱讀
    Cloud MemoryStore for <b class='flag-5'>Redis</b> Cluster 正式發(fā)布

    如何用Springboot整合Redis

    本篇文件我們來介紹如何用Springboot整合Redis。 1、Docker 安裝 Redis 1.1 下載鏡像 docker pull redis: 6 . 2 . 6 1.2 創(chuàng)
    的頭像 發(fā)表于 10-08 14:56 ?487次閱讀
    如何用Springboot整合<b class='flag-5'>Redis</b>