??目錄
-
- 排查順序
- 方法論
- 性能分析工具
- CPU分析思路
- 內(nèi)存分析思路
- IO分析思路
- 網(wǎng)絡(luò)分析思路
- 基準(zhǔn)測(cè)試工具
- 參考
排查順序
整體情況:-
top/htop/atop
命令查看進(jìn)程/線程、CPU、內(nèi)存使用情況,CPU使用情況; -
dstat 2
查看CPU、磁盤IO、網(wǎng)絡(luò)IO、換頁、中斷、切換,系統(tǒng)I/O狀態(tài); -
vmstat 2
查看內(nèi)存使用情況,內(nèi)存狀態(tài); -
iostat -d -x 2
查看所有磁盤的IO情況,系統(tǒng)I/O狀態(tài); -
iotop
查看IO靠前的進(jìn)程,系統(tǒng)的I/O狀態(tài); -
perf top
查看占用CPU最多的函數(shù),CPU使用情況; -
perf record -ag -- sleep 15;perf report
查看CPU事件占比,調(diào)用棧,CPU使用情況; -
sar -n DEV 2
查看網(wǎng)卡的吞吐,網(wǎng)卡狀態(tài); -
/usr/share/bcc/tools/filetop -C
查看每個(gè)文件的讀寫情況,系統(tǒng)的I/O狀態(tài); -
/usr/share/bcc/tools/opensnoop
顯示正在被打開的文件,系統(tǒng)的I/O狀態(tài); -
mpstat -P ALL 1
單核CPU是否被打爆; -
ps aux --sort=-%cpu
按CPU使用率排序,找出CPU消耗最多進(jìn)程; -
ps -eo pid,comm,rss | awk '{m=$3/1e6;s["*"]+=m;s[$2]+=m} END{for (n in s) printf"%10.3f GB %s\n",s[n],n}' | sort -nr | head -20
統(tǒng)計(jì)前20內(nèi)存占用;
-
awk 'NF>3{s["*"]+=s[$1]=$3*$4/1e6} END{for (n in s) printf"%10.1f MB %s\n",s[n],n}' /proc/slabinfo | sort -nr | head -20
統(tǒng)計(jì)內(nèi)核前20slab的占用;
-
pidstat 2 -p 進(jìn)程號(hào)
查看可疑進(jìn)程CPU使用率變化情況; -
pidstat -w -p 進(jìn)程號(hào) 2
查看可疑進(jìn)程的上下文切換情況; -
pidstat -d -p 進(jìn)程號(hào) 2
查看可疑進(jìn)程的IO情況; -
lsof -p 進(jìn)程號(hào)
查看進(jìn)程打開的文件; -
strace -f -T -tt -p 進(jìn)程號(hào)
顯示進(jìn)程發(fā)起的系統(tǒng)調(diào)用;
-
ethtool -S
查看網(wǎng)卡硬件情況; -
cat/proc/net/softnet_stat/ifconfig eth1
查看網(wǎng)卡驅(qū)動(dòng)情況; -
netstat -nat|awk '{print awk $NF}'|sort|uniq -c|sort -n
查看連接狀態(tài)分布; -
ss -ntp
或者netstat -ntp
查看連接隊(duì)列; -
查看協(xié)議棧情況;netstat -s
方法論
RED方法:監(jiān)控服務(wù)的請(qǐng)求數(shù)(Rate)、錯(cuò)誤數(shù)(Errors)、響應(yīng)時(shí)間(Duration)。Weave Cloud在監(jiān)控微服務(wù)性能時(shí)提出的思路。USE方法:監(jiān)控系統(tǒng)資源的使用率(Utilization)、飽和度(Saturation)、錯(cuò)誤數(shù)(Errors)。????性能分析工具
Linux 內(nèi)核的各個(gè)子系統(tǒng)出發(fā),匯總了對(duì)各個(gè)子系統(tǒng)進(jìn)行性能分析時(shí),你可以選擇的工具。不過,雖然這個(gè)圖是性能分析最好的參考資料之一,它其實(shí)還不夠具體。比如,當(dāng)你需要查看某個(gè)性能指標(biāo)時(shí),這張圖里對(duì)應(yīng)的子系統(tǒng)部分,可能有多個(gè)性能工具可供選擇。但實(shí)際上,并非所有這些工具都適用,具體要用哪個(gè),還需要你去查找每個(gè)工具的手冊(cè),對(duì)比分析做出選擇。CPU分析思路
首先,從 CPU 的角度來說,主要的性能指標(biāo)就是 CPU 的使用率、上下文切換以及 CPU Cache 的命中率等。下面這張圖就列出了常見的 CPU 性能指標(biāo)。???內(nèi)存分析思路
接著我們來看內(nèi)存方面。從內(nèi)存的角度來說,主要的性能指標(biāo),就是系統(tǒng)內(nèi)存的分配和使用、進(jìn)程內(nèi)存的分配和使用以及 SWAP 的用量。下面這張圖列出了常見的內(nèi)存性能指標(biāo)。???IO分析思路
從文件系統(tǒng)和磁盤 I/O 的角度來說,主要性能指標(biāo),就是文件系統(tǒng)的使用、緩存和緩沖區(qū)的使用,以及磁盤 I/O 的使用率、吞吐量和延遲等。下面這張圖列出了常見的 I/O 性能指標(biāo)。???????網(wǎng)絡(luò)分析思路
從網(wǎng)絡(luò)的角度來說,主要性能指標(biāo)就是吞吐量、響應(yīng)時(shí)間、連接數(shù)、丟包數(shù)等。根據(jù) TCP/IP 網(wǎng)絡(luò)協(xié)議棧的原理,我們可以把這些性能指標(biāo),進(jìn)一步細(xì)化為每層協(xié)議的具體指標(biāo)。這里我同樣用一張圖,分別從鏈路層、網(wǎng)絡(luò)層、傳輸層和應(yīng)用層,列出了各層的主要指標(biāo)。?????基準(zhǔn)測(cè)試工具
除了性能分析外,很多時(shí)候,我們還需要對(duì)系統(tǒng)性能進(jìn)行基準(zhǔn)測(cè)試。比如,- 在文件系統(tǒng)和磁盤 I/O 模塊中,我們使用 fio 工具,測(cè)試了磁盤 I/O 的性能。
- 在網(wǎng)絡(luò)模塊中,我們使用 iperf、pktgen 等,測(cè)試了網(wǎng)絡(luò)的性能。
- 而在很多基于 Nginx 的案例中,我們則使用 ab、wrk 等,測(cè)試 Nginx 應(yīng)用的性能。
參考
- 相當(dāng)一部分內(nèi)容來自極客時(shí)間出品的倪鵬飛專欄《Linux性能優(yōu)化》, 這是之前這個(gè)專欄的學(xué)習(xí)筆記。
- 另一份資料是IBM紅寶書Linux性能調(diào)優(yōu)指南。
- 此外,The Linux Documentation Project是一個(gè)非常好的資料庫。
- 將硬件中斷的處理任務(wù)分配個(gè)多個(gè)CPU:SMP affinity and proper interrupt handling in Linux
- Hidden Costs of Memory Allocation
- https://www.lijiaocn.com/soft/linux/
END
開發(fā)板/核心板/主板/整機(jī)
OEM/ODM
原文標(biāo)題:Linux問題分析與性能優(yōu)化
文章出處:【微信公眾號(hào):啟揚(yáng)ARM嵌入式開發(fā)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。
舉報(bào)投訴
-
Linux
+關(guān)注
關(guān)注
87文章
11207瀏覽量
208717
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
如何優(yōu)化emc存儲(chǔ)性能
性能。 1. 理解存儲(chǔ)架構(gòu) 在進(jìn)行任何優(yōu)化之前,了解你的EMC存儲(chǔ)系統(tǒng)的架構(gòu)是至關(guān)重要的。這包括識(shí)別存儲(chǔ)陣列的型號(hào)、配置、連接的主機(jī)以及存儲(chǔ)網(wǎng)絡(luò)的布局。了解這些基本信息可以幫助你確定可能的性能瓶頸和
如何優(yōu)化SOC芯片性能
優(yōu)化SOC(System on Chip,系統(tǒng)級(jí)芯片)芯片性能是一個(gè)復(fù)雜而多維的任務(wù),涉及多個(gè)方面的優(yōu)化策略。以下是一些關(guān)鍵的優(yōu)化措施: 一、架構(gòu)設(shè)計(jì)
使用Arthas火焰圖工具的Java應(yīng)用性能分析和優(yōu)化經(jīng)驗(yàn)
分享作者在使用Arthas火焰圖工具進(jìn)行Java應(yīng)用性能分析和優(yōu)化的經(jīng)驗(yàn)。
如何優(yōu)化FPGA設(shè)計(jì)的性能
、延遲、吞吐量等。這些指標(biāo)應(yīng)根據(jù)系統(tǒng)的性能需求和資源限制來確定。 分析約束 :了解并考慮所有相關(guān)的設(shè)計(jì)約束,如功耗、成本、可制造性等,以確保優(yōu)化方案的實(shí)際可行性。 二、邏輯設(shè)計(jì)優(yōu)化 減
AI大模型的性能優(yōu)化方法
AI大模型的性能優(yōu)化是一個(gè)復(fù)雜而關(guān)鍵的任務(wù),涉及多個(gè)方面和策略。以下是一些主要的性能優(yōu)化方法: 一、模型壓縮與優(yōu)化 模型蒸餾(Model D
linux常用性能優(yōu)化方法
占用一個(gè)本地端口號(hào)(與 TCP 協(xié)議端口號(hào)不一樣),相當(dāng)于一個(gè)進(jìn)程,便于與其它進(jìn)程進(jìn)行交互。而Linux內(nèi)核的TCP/IP 協(xié)議實(shí)現(xiàn)模塊對(duì)本地端口號(hào)的范圍進(jìn)行了限制。當(dāng)端口號(hào)用盡,就會(huì)出現(xiàn)這種錯(cuò)誤了。
MySQL性能優(yōu)化淺析及線上案例
作者:京東健康 孟飛 1、 數(shù)據(jù)庫性能優(yōu)化的意義 業(yè)務(wù)發(fā)展初期,數(shù)據(jù)庫中量一般都不高,也不太容易出一些性能問題或者出的問題也不大,但是當(dāng)數(shù)據(jù)庫的量級(jí)達(dá)到一定規(guī)模之后,如果缺失有效的預(yù)警、監(jiān)控、處理等
如何優(yōu)化Linux服務(wù)器的性能
優(yōu)化Linux服務(wù)器的性能是一個(gè)綜合性的任務(wù),涉及硬件、軟件、配置、監(jiān)控等多個(gè)方面。以下是一個(gè)詳細(xì)的指南,旨在幫助系統(tǒng)管理員和運(yùn)維人員提升Linux服務(wù)器的
Linux服務(wù)器性能查看方法
Linux服務(wù)器性能查看是系統(tǒng)管理員和開發(fā)人員在日常工作中經(jīng)常需要進(jìn)行的任務(wù),以確保系統(tǒng)穩(wěn)定運(yùn)行并優(yōu)化資源使用。以下將詳細(xì)介紹多種Linux服務(wù)器性
基于望獲實(shí)時(shí)Linux的高性能運(yùn)動(dòng)控制器適配
國科環(huán)宇依托深厚的技術(shù)積累與實(shí)戰(zhàn)經(jīng)驗(yàn),成功推出了基于望獲實(shí)時(shí)Linux的高性能運(yùn)動(dòng)控制器適配方案。該方案不僅保留了Linux的通用性與兼容性,還通過自研的調(diào)度算法、網(wǎng)絡(luò)優(yōu)化技術(shù)及先進(jìn)的
OpenHarmony之開機(jī)優(yōu)化
對(duì)其進(jìn)行詳細(xì)的性能分析,從而優(yōu)化系統(tǒng)啟動(dòng)速度和運(yùn)行效率。
三丶開機(jī)優(yōu)化
開機(jī)優(yōu)化的主要目的是為了快速啟動(dòng)開機(jī)動(dòng)畫和退出開機(jī)動(dòng)畫(顯示桌面)。
發(fā)表于 07-01 16:39
兆芯正引入Linux首選內(nèi)核調(diào)度技術(shù),優(yōu)化性能
近期,兆芯工程團(tuán)隊(duì)亦在致力于將首選內(nèi)核調(diào)度技術(shù)引進(jìn)Linux系統(tǒng)中。他們?cè)噲D通過提議的Linux內(nèi)核補(bǔ)丁,利用已有的ACPI功能來辨別每個(gè)核心的特性。這項(xiàng)補(bǔ)丁將在ACPI CPUFreq驅(qū)動(dòng)程序中體現(xiàn)。這意味著調(diào)度程序能自動(dòng)在首要核心上運(yùn)行任務(wù),使得整體
MySQL性能優(yōu)化方法
MySQL 性能優(yōu)化是一項(xiàng)關(guān)鍵的任務(wù),可以提高數(shù)據(jù)庫的運(yùn)行速度和效率。以下是一些優(yōu)化方法,包括具體代碼和詳細(xì)優(yōu)化方案。
Linux內(nèi)核slab性能優(yōu)化的核心思想
今天分享一篇內(nèi)存性能優(yōu)化的文章,文章用了大量精美的圖深入淺出地分析了Linux內(nèi)核slab性能優(yōu)化
評(píng)論