0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Python異步IO分析

馬哥Linux運(yùn)維 ? 來源:工程師曾玲 ? 2019-02-02 09:04 ? 次閱讀

異步操作在計(jì)算機(jī)軟硬件體系中是一個(gè)普遍概念,根源在于參與協(xié)作的各實(shí)體處理速度上有明顯差異。軟件開發(fā)中遇到的多數(shù)情況是CPU與IO的速度不匹配,所以異步IO存在于各種編程框架中,客戶端比如瀏覽器,服務(wù)端比如node.js。本文主要分析Python異步IO。

Python 3.4標(biāo)準(zhǔn)庫有一個(gè)新模塊asyncio,用來支持異步IO,不過目前API狀態(tài)是provisional,意味著不保證向后兼容性,甚至可能從標(biāo)準(zhǔn)庫中移除(可能性極低)。如果關(guān)注PEP和Python-Dev會(huì)發(fā)現(xiàn)該模塊醞釀了很長時(shí)間,可能后續(xù)有API和實(shí)現(xiàn)上的調(diào)整,但毋庸置疑asyncio非常實(shí)用且功能強(qiáng)大,值得學(xué)習(xí)和深究。

示例

asyncio主要應(yīng)對TCP/UDP socket通信,從容管理大量連接,而無需創(chuàng)建大量線程,提高系統(tǒng)運(yùn)行效率。此處將官方文檔的一個(gè)示例做簡單改造,實(shí)現(xiàn)一個(gè)HTTP長連接benchmark工具,用于診斷WEB服務(wù)器長連接處理能力。

功能概述:

每隔10毫秒創(chuàng)建10個(gè)連接,直到目標(biāo)連接數(shù)(比如10k),同時(shí)每個(gè)連接都會(huì)規(guī)律性的向服務(wù)器發(fā)送HEAD請求,以維持HTTP keepavlie。

代碼如下:

importargparse

importasyncio

importfunctools

importlogging

importrandom

importurllib.parse

loop=asyncio.get_event_loop()

@asyncio.coroutine

defprint_http_headers(no,url,keepalive):

url=urllib.parse.urlsplit(url)

wait_for=functools.partial(asyncio.wait_for,timeout=3,loop=loop)

query=('HEAD {url.path} HTTP/1.1\r\n'

'Host: {url.hostname}\r\n'

'\r\n').format(url=url).encode('utf-8')

rd,wr=yieldfromwait_for(asyncio.open_connection(url.hostname,80))

whileTrue:

wr.write(query)

whileTrue:

line=yieldfromwait_for(rd.readline())

ifnotline:# end of connection

wr.close()

returnno

line=line.decode('utf-8').rstrip()

ifnotline:# end of header

break

logging.debug('(%d) HTTP header> %s'%(no,line))

yieldfromasyncio.sleep(random.randint(1,keepalive//2))

@asyncio.coroutine

defdo_requests(args):

conn_pool=set()

waiter=asyncio.Future()

def_on_complete(fut):

conn_pool.remove(fut)

exc,res=fut.exception(),fut.result()

ifexcisnotNone:

logging.info('conn#{} exception'.format(exc))

else:

logging.info('conn#{} result'.format(res))

ifnotconn_pool:

waiter.set_result('event loop is done')

foriinrange(args.connections):

fut=asyncio.async(print_http_headers(i,args.url,args.keepalive))

fut.add_done_callback(_on_complete)

conn_pool.add(fut)

ifi%10==0:

yieldfromasyncio.sleep(0.01)

logging.info((yieldfromwaiter))

defmain():

parser=argparse.ArgumentParser(description='asyncli')

parser.add_argument('url',help='page address')

parser.add_argument('-c','--connections',type=int,default=1,

help='number of connections simultaneously')

parser.add_argument('-k','--keepalive',type=int,default=60,

help='HTTP keepalive timeout')

args=parser.parse_args()

logging.basicConfig(level=logging.INFO,format='%(asctime)s %(message)s')

loop.run_until_complete(do_requests(args))

loop.close()

if__name__=='__main__':

main()

測試與分析

硬件:CPU 2.3GHz / 2 cores,RAM 2GB

軟件:CentOS 6.5(kernel 2.6.32), Python 3.3 (pip install asyncio), nginx 1.4.7

參數(shù)設(shè)置:ulimit -n 10240;nginx worker的連接數(shù)改為10240

啟動(dòng)WEB服務(wù)器,只需一個(gè)worker進(jìn)程:

# ../sbin/nginx

# ps ax | grep nginx

2007 ? Ss 0:00 nginx: master process ../sbin/nginx

2008 ? S 0:00 nginx: worker process

啟動(dòng)benchmark工具, 發(fā)起10k個(gè)連接,目標(biāo)URL是nginx的默認(rèn)測試頁面:

$ python asyncli.py http://10.211.55.8/ -c 10000

nginx日志統(tǒng)計(jì)平均每秒請求數(shù):

# tail -1000000 access.log | awk '{ print $4 }' | sort | uniq -c | awk '{ cnt+=1; sum+=$1 } END { printf "avg = %d\n", sum/cnt }'

avg = 548

top部分輸出:

VIRT RES SHR S %CPU %MEM TIME+ COMMAND

657m 115m 3860 R 60.2 6.2 4:30.02 python

54208 10m 848 R 7.0 0.6 0:30.79 nginx

總結(jié):

1. Python實(shí)現(xiàn)簡潔明了。不到80行代碼,只用到標(biāo)準(zhǔn)庫,邏輯直觀,想象下C/C++標(biāo)準(zhǔn)庫實(shí)現(xiàn)這些功能,頓覺“人生苦短,我用Python”。

2. Python運(yùn)行效率不理想。當(dāng)連接建立后,客戶端和服務(wù)端的數(shù)據(jù)收發(fā)邏輯差不多,看上面top輸出,Python的CPU和RAM占用基本都是nginx的10倍,意味著效率相差100倍(CPU x RAM),側(cè)面說明了Python與C的效率差距。這個(gè)對比雖然有些極端,畢竟nginx不僅用C且為CPU/RAM占用做了深度優(yōu)化,但相似任務(wù)效率相差兩個(gè)數(shù)量級,除非是BUG,說明架構(gòu)設(shè)計(jì)的出發(fā)點(diǎn)就是不同的,Python優(yōu)先可讀易用而性能次之,nginx就是一個(gè)高度優(yōu)化的WEB服務(wù)器,開發(fā)一個(gè)module都比較麻煩,要復(fù)用它的異步框架,簡直難上加難。開發(fā)效率與運(yùn)行效率的權(quán)衡,永遠(yuǎn)都存在。

3. 單線程異步IO v.s. 多線程同步IO。上面的例子是單線程異步IO,其實(shí)不寫demo就知道多線程同步IO效率低得多,每個(gè)線程一個(gè)連接?10k個(gè)線程,僅線程棧就占用600+MB(64KB * 10000)內(nèi)存,加上線程上下文切換和GIL,基本就是噩夢。

ayncio核心概念

以下是學(xué)習(xí)asyncio時(shí)需要理解的四個(gè)核心概念,更多細(xì)節(jié)請看<參考資料>

1. event loop。單線程實(shí)現(xiàn)異步的關(guān)鍵就在于這個(gè)高層事件循環(huán),它是同步執(zhí)行的。

2. future。異步IO有很多異步任務(wù)構(gòu)成,而每個(gè)異步任務(wù)都由一個(gè)future控制。

3. coroutine。每個(gè)異步任務(wù)具體的執(zhí)行邏輯由一個(gè)coroutine來體現(xiàn)。

4. generator(yield & yield from) 。在asyncio中大量使用,是不可忽視的語法細(xì)節(jié)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • API
    API
    +關(guān)注

    關(guān)注

    2

    文章

    1475

    瀏覽量

    61761
  • python
    +關(guān)注

    關(guān)注

    55

    文章

    4774

    瀏覽量

    84386

原文標(biāo)題:快學(xué)學(xué)Python異步IO輕松管理10k+并發(fā)連接

文章出處:【微信號:magedu-Linux,微信公眾號:馬哥Linux運(yùn)維】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    Linux驅(qū)動(dòng)學(xué)習(xí)筆記:異步IO

    前幾篇介紹了幾種IO模型,今天介紹另一種IO模型——異步IO。
    發(fā)表于 06-12 16:24 ?652次閱讀

    學(xué)python有哪些方向?

    。3. 爬蟲開發(fā)在爬蟲領(lǐng)域,Python幾乎是霸主地位,將網(wǎng)絡(luò)一切數(shù)據(jù)作為資源,通過自動(dòng)化程序進(jìn)行有針對性的數(shù)據(jù)采集以及處理。從事該領(lǐng)域應(yīng)學(xué)習(xí)爬蟲策略、高性能異步IO、分布式爬蟲等,并針對Scrapy
    發(fā)表于 03-09 15:47

    Python就業(yè)狀況分析

    ,數(shù)據(jù)庫,數(shù)據(jù)分析,云基礎(chǔ)設(shè)施,設(shè)計(jì),站點(diǎn)可靠性/測試,網(wǎng)絡(luò)抓取,安全性,移動(dòng)開發(fā),API等等。根據(jù)列出的職位,機(jī)會(huì)傾向于國際化需求,尤其是在英國地區(qū)。在任何主要工作網(wǎng)站搜索“Python開發(fā)人員”,會(huì)返回
    發(fā)表于 05-23 15:20

    怎么有效學(xué)習(xí)Python數(shù)據(jù)分析?

    Python在人工智能、機(jī)器學(xué)習(xí)領(lǐng)域受到火熱追捧,很大程度上在于它擁有非常龐大的第三方庫,以及強(qiáng)大的通用編程性能。因此,快速掌握Python進(jìn)行數(shù)據(jù)分析,就是學(xué)習(xí)Python各種第三方
    發(fā)表于 06-28 15:18

    Python數(shù)據(jù)如何分析

    Python數(shù)據(jù)分析:seaborn
    發(fā)表于 05-29 16:34

    Python中的并行性和并發(fā)性分析

    理,異步編程,并發(fā)和并行性。我們使用python的多處理模塊來實(shí)現(xiàn)并行性,而Python中的并發(fā)是通過線程和異步IO模塊來實(shí)現(xiàn)的。并行運(yùn)行的
    發(fā)表于 08-21 17:45

    異步IO是什么

    python 異步ioAsync IO is a concurrent programming design that has received dedicated support
    發(fā)表于 09-06 07:26

    《Linux設(shè)備驅(qū)動(dòng)開發(fā)詳解》第9章、Linux設(shè)備驅(qū)動(dòng)中的異步通知與異步IO

    《Linux設(shè)備驅(qū)動(dòng)開發(fā)詳解》第9章、Linux設(shè)備驅(qū)動(dòng)中的異步通知與異步IO
    發(fā)表于 10-27 11:33 ?0次下載
    《Linux設(shè)備驅(qū)動(dòng)開發(fā)詳解》第9章、Linux設(shè)備驅(qū)動(dòng)中的<b class='flag-5'>異步</b>通知與<b class='flag-5'>異步</b><b class='flag-5'>IO</b>

    淺析同步與異步Python的區(qū)別與概述

    你是否聽到人們說過,異步Python代碼比普通(或同步)Python代碼更快?果真是那樣嗎?
    的頭像 發(fā)表于 04-25 13:53 ?2178次閱讀
    淺析同步與<b class='flag-5'>異步</b><b class='flag-5'>Python</b>的區(qū)別與概述

    基于Python的聚類分析及其應(yīng)用簡介

    基于Python的聚類分析及其應(yīng)用簡介。
    發(fā)表于 05-28 10:54 ?8次下載

    FPGA 結(jié)構(gòu)分析 -IO 資源

    關(guān)于 FPGA 的 IO資源分析共分為三個(gè)系列進(jìn)行具體闡述,分別為: IO資源:分析FPGA IO資源的電氣特性;
    的頭像 發(fā)表于 12-13 13:20 ?1697次閱讀

    用于將數(shù)據(jù)從Google表單自動(dòng)發(fā)布到Adafruit IOPython腳本

    電子發(fā)燒友網(wǎng)站提供《用于將數(shù)據(jù)從Google表單自動(dòng)發(fā)布到Adafruit IOPython腳本.zip》資料免費(fèi)下載
    發(fā)表于 06-16 15:47 ?0次下載
    用于將數(shù)據(jù)從Google表單自動(dòng)發(fā)布到Adafruit <b class='flag-5'>IO</b>的<b class='flag-5'>Python</b>腳本

    信號驅(qū)動(dòng)IO異步IO的區(qū)別

    一. 談信號驅(qū)動(dòng)IO (對比異步IO來看) 信號驅(qū)動(dòng)IO 對比 異步 IO進(jìn)行理解 信號驅(qū)動(dòng)
    的頭像 發(fā)表于 11-08 15:32 ?976次閱讀
    信號驅(qū)動(dòng)<b class='flag-5'>IO</b>與<b class='flag-5'>異步</b><b class='flag-5'>IO</b>的區(qū)別

    linux異步io框架iouring應(yīng)用

    Linux內(nèi)核5.1支持了新的異步IO框架iouring,由Block IO大神也即Fio作者Jens Axboe開發(fā),意在提供一套公用的網(wǎng)絡(luò)和磁盤異步
    的頭像 發(fā)表于 11-08 15:39 ?631次閱讀
    linux<b class='flag-5'>異步</b><b class='flag-5'>io</b>框架iouring應(yīng)用

    異步IO框架iouring介紹

    前言 Linux內(nèi)核5.1支持了新的異步IO框架iouring,由Block IO大神也即Fio作者Jens Axboe開發(fā),意在提供一套公用的網(wǎng)絡(luò)和磁盤異步
    的頭像 發(fā)表于 11-09 09:30 ?2120次閱讀
    <b class='flag-5'>異步</b><b class='flag-5'>IO</b>框架iouring介紹