0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

數(shù)據(jù)庫連接池的設置怎么確定大小

汽車玩家 ? 來源:今日頭條 ? 作者:Java的小本家 ? 2020-05-04 14:23 ? 次閱讀

數(shù)據(jù)庫連接池的配置是開發(fā)者們常常搞出坑的地方,在配置數(shù)據(jù)庫連接池時,有幾個可以說是和直覺背道而馳的原則需要明確。

1萬并發(fā)用戶訪問

想象你有一個網(wǎng)站,壓力雖然還沒到Facebook那個級別,但也有個1萬上下的并發(fā)訪問——也就是說差不多2萬左右的TPS。那么這個網(wǎng)站的數(shù)據(jù)庫連接池應該設置成多大呢?結(jié)果可能會讓你驚訝,因為這個問題的正確問法是:

“這個網(wǎng)站的數(shù)據(jù)庫連接池應該設置成多小呢?”

下面這個視頻Oracle Real World Performance Group發(fā)布的,請先看完:http://www.dailymotion.com/video/x2s8uec

因為這視頻是英文解說且沒有字幕,我替大家做一下簡單的概括:

視頻中對Oracle數(shù)據(jù)庫進行壓力測試,9600并發(fā)線程進行數(shù)據(jù)庫操作,每兩次訪問數(shù)據(jù)庫的操作之間sleep 550ms,一開始設置的中間件線程池大小為2048:

數(shù)據(jù)庫連接池的設置怎么確定大小

壓測跑起來之后是這個樣子的:

數(shù)據(jù)庫連接池的設置怎么確定大小

每個請求要在連接池隊列里等待33ms,獲得連接后執(zhí)行SQL需要77ms

此時數(shù)據(jù)庫的等待事件是這個熊樣的:

數(shù)據(jù)庫連接池的設置怎么確定大小

各種buffer busy waits,數(shù)據(jù)庫CPU在95%左右(這張圖里沒截到CPU)

接下來,把中間件連接池減到1024(并發(fā)什么的都不變),性能數(shù)據(jù)變成了這樣:

數(shù)據(jù)庫連接池的設置怎么確定大小

獲取鏈接等待時長沒怎么變,但是執(zhí)行SQL的耗時減少了。

下面這張圖,上半部分是wait,下半部分是吞吐量

數(shù)據(jù)庫連接池的設置怎么確定大小

能看到,中間件連接池從2048減半之后,吐吞量沒變,但wait事件減少了一半。

接下來,把數(shù)據(jù)庫連接池減到96,并發(fā)線程數(shù)仍然是9600不變。

數(shù)據(jù)庫連接池的設置怎么確定大小

隊列平均等待1ms,執(zhí)行SQL平均耗時2ms。

數(shù)據(jù)庫連接池的設置怎么確定大小

wait事件幾乎沒了,吞吐量上升。

沒有調(diào)整任何其他東西,僅僅只是縮小了中間件層的數(shù)據(jù)庫連接池,就把請求響應時間從100ms左右縮短到了3ms。

But why?

為什么nginx只用4個線程發(fā)揮出的性能就大大超越了100個進程的Apache HTTPD?回想一下計算機科學的基礎(chǔ)知識,答案其實是很明顯的。

即使是單核CPU的計算機也能“同時”運行數(shù)百個線程。但我們都[應該]知道這只不過是操作系統(tǒng)用時間分片玩的一個小把戲。一顆CPU核心同一時刻只能執(zhí)行一個線程,然后操作系統(tǒng)切換上下文,核心開始執(zhí)行另一個線程的代碼,以此類推。給定一顆CPU核心,其順序執(zhí)行A和B永遠比通過時間分片“同時”執(zhí)行A和B要快,這是一條計算機科學的基本法則。一旦線程的數(shù)量超過了CPU核心的數(shù)量,再增加線程數(shù)系統(tǒng)就只會更慢,而不是更快。推薦:多線程內(nèi)容聚合

這幾乎就是真理了……

有限的資源

上面的說法只能說是接近真理,但還并沒有這么簡單,有一些其他的因素需要加入。當我們尋找數(shù)據(jù)庫的性能瓶頸時,總是可以將其歸為三類:CPU、磁盤、網(wǎng)絡。把內(nèi)存加進來也沒有錯,但比起磁盤和網(wǎng)絡,內(nèi)存的帶寬要高出好幾個數(shù)量級,所以就先不加了。

如果我們無視磁盤和網(wǎng)絡,那么結(jié)論就非常簡單。在一個8核的服務器上,設定連接/線程數(shù)為8能夠提供最優(yōu)的性能,再增加連接數(shù)就會因上下文切換的損耗導致性能下降。數(shù)據(jù)庫通常把數(shù)據(jù)存儲在磁盤上,磁盤又通常是由一些旋轉(zhuǎn)著的金屬碟片和一個裝在步進馬達上的讀寫頭組成的。

讀/寫頭同一時刻只能出現(xiàn)在一個地方,然后它必須“尋址”到另外一個位置來執(zhí)行另一次讀寫操作。所以就有了尋址的耗時,此外還有旋回耗時,讀寫頭需要等待碟片上的目標數(shù)據(jù)“旋轉(zhuǎn)到位”才能進行操作。使用緩存當然是能夠提升性能的,但上述原理仍然成立。

在這一時間段(即"I/O等待")內(nèi),線程是在“阻塞”著等待磁盤,此時操作系統(tǒng)可以將那個空閑的CPU核心用于服務其他線程。所以,由于線程總是在I/O上阻塞,我們可以讓線程/連接數(shù)比CPU核心多一些,這樣能夠在同樣的時間內(nèi)完成更多的工作。

那么應該多多少呢?這要取決于磁盤。較新型的SSD不需要尋址,也沒有旋轉(zhuǎn)的碟片??蓜e想當然地認為“SSD速度更快,所以我們應該增加線程數(shù)”,恰恰相反,無需尋址和沒有旋回耗時意味著更少的阻塞,所以更少的線程[更接近于CPU核心數(shù)]會發(fā)揮出更高的性能。只有當阻塞創(chuàng)造了更多的執(zhí)行機會時,更多的線程數(shù)才能發(fā)揮出更好的性能。

網(wǎng)絡和磁盤類似。通過以太網(wǎng)接口讀寫數(shù)據(jù)時也會形成阻塞,10G帶寬會比1G帶寬的阻塞少一些,1G帶寬又會比100M帶寬的阻塞少一些。不過網(wǎng)絡通常是放在第三位考慮的,有些人會在性能計算中忽略它們。

數(shù)據(jù)庫連接池的設置怎么確定大小

上圖是PostgreSQL的benchmark數(shù)據(jù),可以看到TPS增長率從50個連接數(shù)開始變緩。在上面Oracle的視頻中,他們把連接數(shù)從2048降到了96,實際上96都太高了,除非服務器有16或32顆核心。

計算公式

下面的公式是由PostgreSQL提供的,不過我們認為可以廣泛地應用于大多數(shù)數(shù)據(jù)庫產(chǎn)品。你應該模擬預期的訪問量,并從這一公式開始測試你的應用,尋找最合適的連接數(shù)值。

連接數(shù) = ((核心數(shù) * 2) + 有效磁盤數(shù))

核心數(shù)不應包含超線程(hyper thread),即使打開了hyperthreading也是。如果活躍數(shù)據(jù)全部被緩存了,那么有效磁盤數(shù)是0,隨著緩存命中率的下降,有效磁盤數(shù)逐漸趨近于實際的磁盤數(shù)。這一公式作用于SSD時的效果如何尚未有分析。

按這個公式,你的4核i7數(shù)據(jù)庫服務器的連接池大小應該為((4 * 2) + 1) = 9。取個整就算是是10吧。是不是覺得太小了?跑個性能測試試一下,我們保證它能輕松搞定3000用戶以6000TPS的速率并發(fā)執(zhí)行簡單查詢的場景。如果連接池大小超過10,你會看到響應時長開始增加,TPS開始下降。擴展:用了這么久的數(shù)據(jù)庫連接池,你知道原理嗎?

筆者注:這一公式其實不僅適用于數(shù)據(jù)庫連接池的計算,大部分涉及計算和I/O的程序,線程數(shù)的設置都可以參考這一公式。我之前在對一個使用Netty編寫的消息收發(fā)服務進行壓力測試時,最終測出的最佳線程數(shù)就剛好是CPU核心數(shù)的一倍。

公理:你需要一個小連接池,和一個充滿了等待連接的線程的隊列

如果你有10000個并發(fā)用戶,設置一個10000的連接池基本等于失了智。1000仍然很恐怖。即是100也太多了。你需要一個10來個連接的小連接池,然后讓剩下的業(yè)務線程都在隊列里等待。連接池中的連接數(shù)量應該等于你的數(shù)據(jù)庫能夠有效同時進行的查詢?nèi)蝿諗?shù)(通常不會高于2*CPU核心數(shù))。

我們經(jīng)常見到一些小規(guī)模的web應用,應付著大約十來個的并發(fā)用戶,卻使用著一個100連接數(shù)的連接池。這會對你的數(shù)據(jù)庫造成極其不必要的負擔。

請注意

連接池的大小最終與系統(tǒng)特性相關(guān)。

比如一個混合了長事務和短事務的系統(tǒng),通常是任何連接池都難以進行調(diào)優(yōu)的。最好的辦法是創(chuàng)建兩個連接池,一個服務于長事務,一個服務于短事務。

再例如一個系統(tǒng)執(zhí)行一個任務隊列,只允許一定數(shù)量的任務同時執(zhí)行,此時并發(fā)任務數(shù)應該去適應連接池連接數(shù),而不是反過來。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • SQL
    SQL
    +關(guān)注

    關(guān)注

    1

    文章

    750

    瀏覽量

    43900
  • 數(shù)據(jù)庫
    +關(guān)注

    關(guān)注

    7

    文章

    3712

    瀏覽量

    64025
收藏 人收藏

    評論

    相關(guān)推薦

    數(shù)據(jù)庫數(shù)據(jù)恢復—SQL Server數(shù)據(jù)庫出現(xiàn)823錯誤的數(shù)據(jù)恢復案例

    SQL Server數(shù)據(jù)庫故障: SQL Server附加數(shù)據(jù)庫出現(xiàn)錯誤823,附加數(shù)據(jù)庫失敗。數(shù)據(jù)庫沒有備份,無法通過備份恢復數(shù)據(jù)庫。
    的頭像 發(fā)表于 09-20 11:46 ?100次閱讀
    <b class='flag-5'>數(shù)據(jù)庫</b><b class='flag-5'>數(shù)據(jù)</b>恢復—SQL Server<b class='flag-5'>數(shù)據(jù)庫</b>出現(xiàn)823錯誤的<b class='flag-5'>數(shù)據(jù)</b>恢復案例

    使用mybatis切片實現(xiàn)數(shù)據(jù)權(quán)限控制

    一、使用方式 數(shù)據(jù)權(quán)限控制需要對查詢出的數(shù)據(jù)進行篩選,對業(yè)務入侵最少的方式就是利用mybatis或者數(shù)據(jù)庫連接池的切片對已有業(yè)務的sql進行修改。切片邏輯完成后,僅需要在業(yè)務中加入少量
    的頭像 發(fā)表于 07-09 17:26 ?250次閱讀
    使用mybatis切片實現(xiàn)<b class='flag-5'>數(shù)據(jù)</b>權(quán)限控制

    數(shù)據(jù)庫數(shù)據(jù)恢復—raid5陣列上層Sql Server數(shù)據(jù)庫數(shù)據(jù)恢復案例

    。 數(shù)據(jù)庫故障: 數(shù)據(jù)庫文件丟失,主要涉及3個數(shù)據(jù)庫,數(shù)千張表。數(shù)據(jù)庫文件丟失原因未知,不能確定丟失的
    的頭像 發(fā)表于 05-08 11:43 ?392次閱讀
    <b class='flag-5'>數(shù)據(jù)庫</b><b class='flag-5'>數(shù)據(jù)</b>恢復—raid5陣列上層Sql Server<b class='flag-5'>數(shù)據(jù)庫</b><b class='flag-5'>數(shù)據(jù)</b>恢復案例

    數(shù)據(jù)庫數(shù)據(jù)恢復—ndf文件大小變?yōu)?KB的數(shù)據(jù)恢復案例

    存儲設備損壞導致存儲中SQL Server數(shù)據(jù)庫崩潰。對數(shù)據(jù)庫文件進行恢復后,用戶發(fā)現(xiàn)有4個ndf文件的大小變?yōu)?KB。該SQL Server數(shù)據(jù)庫每10天生成一個
    的頭像 發(fā)表于 05-07 11:19 ?323次閱讀

    PostgreSQL數(shù)據(jù)庫連接報錯故障分析

    數(shù)據(jù)庫的密碼設置錯誤或未設置,在連接到本地服務后,重新設置即可。本次錯誤就是大意將密碼錯打了一個字母。
    的頭像 發(fā)表于 03-15 10:00 ?1035次閱讀
    PostgreSQL<b class='flag-5'>數(shù)據(jù)庫</b><b class='flag-5'>連接</b>報錯故障分析

    labview與sql數(shù)據(jù)庫連接5種方法

    連接LabVIEW和SQL數(shù)據(jù)庫是一種常見的需求,可以通過多種方法實現(xiàn)。本文將介紹五種連接LabVIEW和SQL數(shù)據(jù)庫的方法。 方法一:使用ADO.NET
    的頭像 發(fā)表于 01-07 16:01 ?3776次閱讀

    eclipse怎么連接數(shù)據(jù)庫mysql

    連接Eclipse和MySQL數(shù)據(jù)庫可以通過JDBC(Java Database Connectivity)來實現(xiàn)。以下是詳細步驟: 下載并安裝MySQL數(shù)據(jù)庫:你首先需要下載并安裝MySQL
    的頭像 發(fā)表于 12-06 11:06 ?1038次閱讀

    oracle數(shù)據(jù)庫的基本操作

    Oracle數(shù)據(jù)庫是一種關(guān)系數(shù)據(jù)庫管理系統(tǒng)(RDBMS),廣泛應用于企業(yè)級應用中。它具有強大的功能和靈活的配置選項,可以滿足復雜的數(shù)據(jù)處理需求。本文將介紹Oracle數(shù)據(jù)庫的基本操作,
    的頭像 發(fā)表于 12-06 10:14 ?548次閱讀

    什么是JSON數(shù)據(jù)庫

    如何理解JSON數(shù)據(jù)庫?作為NoSQL數(shù)據(jù)庫的一種類型,JSON數(shù)據(jù)庫有哪些優(yōu)勢呢?JSON數(shù)據(jù)庫如何運作,它為應用程序開發(fā)者帶來了哪些價值呢?文章速覽:什么是JSON什么是JSON
    的頭像 發(fā)表于 12-02 08:04 ?687次閱讀
    什么是JSON<b class='flag-5'>數(shù)據(jù)庫</b>

    NoSQL 數(shù)據(jù)庫如何選型

    什么是NoSQL數(shù)據(jù)庫?為什么要使用NoSQL數(shù)據(jù)庫?鍵值數(shù)據(jù)庫內(nèi)存鍵值數(shù)據(jù)庫文檔數(shù)據(jù)庫列式數(shù)據(jù)庫
    的頭像 發(fā)表于 11-26 08:05 ?357次閱讀
    NoSQL <b class='flag-5'>數(shù)據(jù)庫</b>如何選型

    給Oracle數(shù)據(jù)庫添加表字段的代碼

    TABLE語句來添加表字段。 首先,在開始操作之前,我們需要確保已經(jīng)連接到了正確的Oracle數(shù)據(jù)庫實例,并且有足夠的權(quán)限來執(zhí)行表結(jié)構(gòu)的修改操作。 確定需要添加字段的表 首先,我們需要確定
    的頭像 發(fā)表于 11-21 11:38 ?682次閱讀

    navicat怎么導出數(shù)據(jù)庫文件

    。 首先,確保你已經(jīng)安裝了Navicat,并已成功連接到目標數(shù)據(jù)庫。接下來,按照以下步驟進行導出數(shù)據(jù)庫文件: 步驟一:選擇目標數(shù)據(jù)庫 在Navicat主界面左側(cè)的
    的頭像 發(fā)表于 11-21 10:53 ?7309次閱讀

    MySQL與Redis數(shù)據(jù)庫連接池應用

    一、概念 數(shù)據(jù)庫連接池(Connection pooling)是程序啟動時建立足夠的數(shù)據(jù)庫連接,并將這些連接組成一個
    的頭像 發(fā)表于 11-10 16:40 ?415次閱讀
    MySQL與Redis<b class='flag-5'>數(shù)據(jù)庫</b><b class='flag-5'>連接池</b>應用

    了解連接池、線程、內(nèi)存、異步請求

    可被重復使用像常見的線程、內(nèi)存、連接池、對象都具有以上的共同特點。 連接池 什么是數(shù)據(jù)庫
    的頭像 發(fā)表于 11-09 14:44 ?869次閱讀
    了解<b class='flag-5'>連接池</b>、線程<b class='flag-5'>池</b>、內(nèi)存<b class='flag-5'>池</b>、異步請求<b class='flag-5'>池</b>

    如何提高Mysql數(shù)據(jù)庫的訪問瓶頸

    為了提高Mysql數(shù)據(jù)庫的訪問瓶頸,常用的方法有如下兩個: 在服務器端增加緩存服務器緩存常用的數(shù)據(jù)(例如redis) 增加連接池,來提高MYsql Server的訪問效率,在高并發(fā)的情況下,每一個用戶大量的TCP三次握手。My
    的頭像 發(fā)表于 11-08 16:22 ?931次閱讀
    如何提高Mysql<b class='flag-5'>數(shù)據(jù)庫</b>的訪問瓶頸