0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Linux運(yùn)維常見(jiàn)故障排查和處理的33個(gè)技巧匯總

C語(yǔ)言編程基礎(chǔ) ? 來(lái)源:未知 ? 作者:鄧佳佳 ? 2018-03-05 13:39 ? 次閱讀

前言

作為linux運(yùn)維,多多少少會(huì)碰見(jiàn)這樣那樣的問(wèn)題或故障,從中總結(jié)經(jīng)驗(yàn),查找問(wèn)題,匯總并分析故障的原因,這是一個(gè)Linux運(yùn)維工程師良好的習(xí)慣。每一次技術(shù)的突破,都經(jīng)歷著苦悶,伴隨著快樂(lè),可我們還是執(zhí)著的繼續(xù)努力,從中也積累了更多的經(jīng)驗(yàn),這就是實(shí)踐給予我們的豐厚回報(bào)。下面匯總了我做項(xiàng)目過(guò)程可能出現(xiàn)的故障及解決方法,看看是否與你有共鳴,并對(duì)你有幫助。

第一:常見(jiàn)問(wèn)題解決集錦

1.shell腳本不執(zhí)行 問(wèn)題:

某天研發(fā)某同事找我說(shuō)幫他看看他寫(xiě)的shell腳本,死活不執(zhí)行,報(bào)錯(cuò)。我看了下,腳本很簡(jiǎn)單,也沒(méi)有常規(guī)性的錯(cuò)誤,報(bào)“:badinterpreter:Nosuchfileordirectory”錯(cuò)??催@錯(cuò),我就問(wèn)他是不是在windows下編寫(xiě)的腳本,然后在上傳到linux服務(wù)器的……果然。

原因:

在DOS/windows里,文本文件的換行符為rn,而在*nix系統(tǒng)里則為n,所以DOS/Windows里編輯過(guò)的文本文件到了*nix里,每一行都多了個(gè)^M。解決:1)重新在linux下編寫(xiě)腳本;2)vi:%s/r//g:%s/^M//g(^M輸入用Ctrl+v,Ctrl+m)附:sh-x腳本文件名,可以單步執(zhí)行并回顯結(jié)果,有助于排查復(fù)雜腳本問(wèn)題。

2.crontab輸出結(jié)果控制

問(wèn)題: /var/spool/clientmqueue目錄占用空間超過(guò)100G

原因: cron中執(zhí)行的程序有輸出內(nèi)容,輸出內(nèi)容會(huì)以郵件形式發(fā)給cron的用戶,而sendmail沒(méi)有啟動(dòng)所以就產(chǎn)生了/var/spool/clientmqueue目錄下的那些文件,日積月累可能撐破磁盤(pán)。

解決:1)直接手動(dòng)刪除:ls|xargsrm-f;2)徹底解決:在cron的自動(dòng)執(zhí)行語(yǔ)句后加上>/dev/2>&1

3.telnet很慢/ssh很慢

問(wèn)題:某天研發(fā)某同事說(shuō)10.50訪問(wèn)10.52memcached服務(wù)異常,讓我們檢查下看網(wǎng)絡(luò)/服務(wù)/系統(tǒng)是否有異常。檢查發(fā)現(xiàn)系統(tǒng)正常,服務(wù)正常,10.50ping10.52也正常,但10.50telnet10.52很慢。同時(shí)發(fā)現(xiàn)該機(jī)器的namesever是不起作用的。

原因:becauseyourPCdoesn’tdoareverseDNSlookuponyourIPthen…whenyoutelnet/ftpintoyourlinuxbox,it’lldoadnslookuponyou。

解決:1)修改/etc/hosts使hostname和ip對(duì)應(yīng);2)在/etc/resolv.conf注釋掉nameserver或者找一個(gè)“活的”nameserver。

4.Read-onlyfilesystem

問(wèn)題: 同事在mysql里建表建不成功,提示如下: mysql>createtablewosontest(colddname1char(1));ERROR1005(HY000):Can’tcreatetable‘wosontest’(errno:30)經(jīng)檢查mysql用戶權(quán)限以及相關(guān)目錄權(quán)限沒(méi)問(wèn)題;用perror30提示信息為:OSerrorcode30:Read-onlyfilesystem

可能原因:1)文件系統(tǒng)損壞;2)磁盤(pán)又壞道;3)fstab文件配置錯(cuò)誤,如分區(qū)格式錯(cuò)誤錯(cuò)誤(將ntfs寫(xiě)成了fat)、配置指令拼寫(xiě)錯(cuò)誤等。解決:1)由于是測(cè)試機(jī),重啟機(jī)器后恢復(fù); 2)網(wǎng)上說(shuō)用mount可解決。

5.文件刪了磁盤(pán)空間沒(méi)釋放問(wèn)題:某天發(fā)現(xiàn)某臺(tái)機(jī)器df-h已用磁盤(pán)空間為90G,而du-sh/*顯示所有使用空間加起來(lái)才30G,囧。

原因:可能某人直接用rm刪除某個(gè)正在寫(xiě)的文件,導(dǎo)致文件刪了但磁盤(pán)空間沒(méi)釋放的問(wèn)題解決: 1)最簡(jiǎn)單重啟系統(tǒng)或者重啟相關(guān)服務(wù)。 2)干掉進(jìn)程 /usr/sbin/lsof|grepdeleted ora25575data33uREG65,654294983680/oradata/DATAPRE/UNDOTBS009.dbf(deleted) 從lsof的輸出中,我們可以發(fā)現(xiàn)pid為25575的進(jìn)程持有著以文件描述號(hào)(fd)為33打開(kāi)的文件/oradata/DATAPRE/UNDOTBS009.dbf。在我們找到了這個(gè)文件之后可以通過(guò)結(jié)束進(jìn)程的方式來(lái)釋放被占用的空間:echo>/proc/25575/fd/33 3)刪除正在寫(xiě)的文件一般用cat/dev/null>file

6.find文件提升性能問(wèn)題:在tmp目錄下有大量包含picture_*的臨時(shí)文件,每天晚上2:30對(duì)一天前的文件進(jìn)行清理。之前在crontab下跑如下腳本,但是發(fā)現(xiàn)腳本效率很低,每次執(zhí)行時(shí)負(fù)載猛漲,影響到其他服務(wù)。#!/bin/sh find/tmp-name“picture_*”-mtime+1-execrm-f{};

原因:目錄下有大量文件,用find很耗資源。

解決: #!/bin/sh cd/tmptime=`date-d“2dayago”“+%b%d”` ls-l|grep“picture”|grep“$time”|awk‘{print$NF}’|xargsrm-rf

7.獲取不了網(wǎng)關(guān)mac地址問(wèn)題:從2.14到3.65(映射地址2.141)網(wǎng)絡(luò)不通,但是從3端的其他機(jī)器到3.65網(wǎng)絡(luò)OK。

原因:#arp AddressHWtypeHWaddressFlagsMaskIface192.168.3.254etherincompletCMbond0表面現(xiàn)象是機(jī)器自動(dòng)獲取不了網(wǎng)關(guān)MAC地址,網(wǎng)絡(luò)工程師說(shuō)是網(wǎng)絡(luò)設(shè)備的問(wèn)題,具體不清。

解決:arp綁定,arp-ibond0-s192.168.3.25400:00:5e:00:01:64

8.http服務(wù)無(wú)法啟動(dòng)一例問(wèn)題:

某天研發(fā)某同事說(shuō)網(wǎng)站前端環(huán)境http無(wú)法啟動(dòng),我上去看了下。報(bào)如下錯(cuò):/etc/init.d/httpdstart Startinghttpd:[SatJan2917:49:002011][warn]moduleantibot_moduleisalreadyloaded,skipping Useproxyforwardasremoteip:true. Antibotexcludepattern:.*.[(js|css|jpg|gif|png)] Antibotseedcheckpattern:login (98)Addressalreadyinuse:make_sock:couldnotbindtoaddress[::]:7080 (98)Addressalreadyinuse:make_sock:couldnotbindtoaddress0.0.0.0:7080 nolisteningsocketsavailable,shuttingdown Unabletoopenlog[FAILED

原因: 1)端口被占用:表面看是7080端口被占用,于是netstat-npl|grep7080看了下發(fā)現(xiàn)7080沒(méi)有占用; 2)在配置文件中重復(fù)寫(xiě)了端口,如果在以下兩個(gè)文件同時(shí)寫(xiě)了Listen7080 /etc/httpd/conf/http.conf /etc/httpd/conf.d/t.10086.cn.conf

解決: 注釋掉/etc/httpd/conf.d/t.10086.cn.conf的Listen7080,重啟,OK。

9.toomanyopenfile

問(wèn)題: 報(bào)toomanyopenfile錯(cuò)誤

解決: echo“”>>/etc/security/limits.conf echo“*softnproc65535″>>/etc/security/limits.conf echo“*hardnproc65535″>>/etc/security/limits.conf echo“*softnofile65535″>>/etc/security/limits.conf echo“*hardnofile65535″>>/etc/security/limits.conf echo“”>>/root/.bash_profile echo“ulimit-n65535″>>/root/.bash_profile echo“ulimit-u65535″>>/root/.bash_profile 最后重啟機(jī)器或者執(zhí)行ulimit-u655345&&ulimit-n65535

10.ibdata1和mysql-bin致磁盤(pán)空間問(wèn)題

問(wèn)題: 2.51磁盤(pán)空間報(bào)警,經(jīng)查發(fā)現(xiàn)ibdata1和mysql-bin日志占用空間太多(其中ibdata1超過(guò)120G,mysql-bin超過(guò)80G) 原因: bdata1是存儲(chǔ)格式,在INNODB類型數(shù)據(jù)狀態(tài)下,ibdata1用來(lái)存儲(chǔ)文件的數(shù)據(jù)和索引,而庫(kù)名的文件夾里的那些表文件只是結(jié)構(gòu)而已。 innodb存儲(chǔ)引擎有兩種表空間的管理方式,分別是: 1)共享表空間(可拆分為多個(gè)小的表空間文件),這個(gè)是我們目前多數(shù)數(shù)據(jù)庫(kù)使用的方法;2)獨(dú)立表空間,每一個(gè)表有一個(gè)獨(dú)立的表空間(磁盤(pán)文件)

對(duì)于兩種管理方式,各有優(yōu)劣,具體如下:①共享表空間:優(yōu)點(diǎn):

可以將表空間分成多個(gè)文件存放到不同的磁盤(pán)上(表空間文件大小不受表大小的限制,一個(gè)表可以分布在不同步的文件上)缺點(diǎn):

所有數(shù)據(jù)和索引存放在一個(gè)文件中,則隨著數(shù)據(jù)的增加,將會(huì)有一個(gè)很大的文件,雖然可以把一個(gè)大文件分成多個(gè)小文件,但是多個(gè)表及索引在表空間中混合存儲(chǔ),這樣如果對(duì)于一個(gè)表做了大量刪除操作后表空間中將有大量空隙。對(duì)于共享表空間管理的方式下,一旦表空間被分配,就不能再回縮了。當(dāng)出現(xiàn)臨時(shí)建索引或是創(chuàng)建一個(gè)臨時(shí)表的操作表空間擴(kuò)大后,就是刪除相關(guān)的表也沒(méi)辦法回縮那部分空間了。②獨(dú)立表空間:

在配置文件(my.cnf)中設(shè)置:innodb_file_per_table特點(diǎn):

每個(gè)表都有自已獨(dú)立的表空間;每個(gè)表的數(shù)據(jù)和索引都會(huì)存在自已的表空間中。優(yōu)點(diǎn):

表空間對(duì)應(yīng)的磁盤(pán)空間可以被收回(Droptable操作自動(dòng)回收表空間,如果對(duì)于刪除大量數(shù)據(jù)后的表可以通過(guò):altertabletbl_nameengine=innodb;回縮不用的空間。

缺點(diǎn):

如果單表增加過(guò)大,如超過(guò)100G,性能也會(huì)受到影響。在這種情況下,如果使用共享表空間可以把文件分開(kāi),但有同樣有一個(gè)問(wèn)題,如果訪問(wèn)的范圍過(guò)大同樣會(huì)訪問(wèn)多個(gè)文件,一樣會(huì)比較慢。如果使用獨(dú)立表空間,可以考慮使用分區(qū)表的方法,在一定程度上緩解問(wèn)題。此外,當(dāng)啟用獨(dú)立表空間模式時(shí),需要合理調(diào)整innodb_open_files參數(shù)的設(shè)置。

解決:1)ibdata1數(shù)據(jù)太大:只能通過(guò)dump,導(dǎo)出建庫(kù)的sql語(yǔ)句,再重建的方法。2)mysql-binLog太大:①手動(dòng)刪除:刪除某個(gè)日志:mysql>PURGEMASTERLOGSTO‘mysql-bin.010′;刪除某天前的日志:mysql>PURGEMASTERLOGSBEFORE’2010-12-2213:00:00′;②在/etc/my.cnf里設(shè)置只保存N天的bin-log日志expire_logs_days=30//BinaryLog自動(dòng)刪除的天數(shù)

二、故障排查匯總表





聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • Linux
    +關(guān)注

    關(guān)注

    87

    文章

    11123

    瀏覽量

    207920

原文標(biāo)題:Linux運(yùn)維常見(jiàn)故障排查和處理的33個(gè)技巧匯總

文章出處:【微信號(hào):xx-cyy,微信公眾號(hào):C語(yǔ)言編程基礎(chǔ)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    如何處理時(shí)鐘電路的常見(jiàn)故障

    處理時(shí)鐘電路的常見(jiàn)故障是一個(gè)涉及多個(gè)步驟和細(xì)節(jié)的過(guò)程,需要仔細(xì)分析和逐步排查。時(shí)鐘電路在電子設(shè)備中扮演著至關(guān)重要的角色,負(fù)責(zé)提供穩(wěn)定的時(shí)鐘信號(hào),以確保設(shè)備內(nèi)部各組件能夠協(xié)調(diào)運(yùn)行。
    的頭像 發(fā)表于 09-09 16:49 ?154次閱讀

    雷達(dá)液位計(jì)常見(jiàn)故障處理方法

    雷達(dá)液位計(jì)作為一種高精度的液位檢測(cè)設(shè)備,在實(shí)際應(yīng)用中可能會(huì)遇到多種故障。以下是一些常見(jiàn)故障及其處理方法: 一、常見(jiàn)故障 數(shù)據(jù)不準(zhǔn)確 原因
    的頭像 發(fā)表于 09-07 11:22 ?248次閱讀

    電機(jī)調(diào)速器常見(jiàn)故障處理方法有哪些

    電機(jī)調(diào)速器是一種用于控制電機(jī)轉(zhuǎn)速的設(shè)備,廣泛應(yīng)用于工業(yè)和民用領(lǐng)域。電機(jī)調(diào)速器的故障可能會(huì)導(dǎo)致電機(jī)性能下降、設(shè)備損壞甚至安全事故。因此,了解電機(jī)調(diào)速器的常見(jiàn)故障及其處理方法對(duì)于保障設(shè)備正常運(yùn)行和延長(zhǎng)
    的頭像 發(fā)表于 06-05 10:59 ?2226次閱讀

    繼電器的常見(jiàn)故障及原因分析

    繼電器作為電氣控制系統(tǒng)中不可或缺的重要元件,其穩(wěn)定性和可靠性對(duì)整個(gè)系統(tǒng)的運(yùn)行至關(guān)重要。然而,在實(shí)際應(yīng)用中,繼電器常常會(huì)出現(xiàn)各種故障,導(dǎo)致系統(tǒng)無(wú)法正常工作。本文將詳細(xì)探討繼電器的常見(jiàn)故障及其原因,以期為讀者提供全面的故障
    的頭像 發(fā)表于 05-21 18:21 ?4371次閱讀

    激光入侵探測(cè)器常見(jiàn)故障排查方法

    指示燈有時(shí)閃亮或常亮。 (2) 激光對(duì)射正常工作電壓:DC12-24V; 二、 常見(jiàn)故障現(xiàn)象 (1) 發(fā)射機(jī)或接收機(jī)無(wú)通電跡象。 (2) 接收機(jī) 所有 光束藍(lán)色LED燈常亮 (3) 接收機(jī) 部分 光束藍(lán)色LED燈常亮 三、 故障現(xiàn)象及
    的頭像 發(fā)表于 05-06 15:52 ?193次閱讀

    運(yùn)管理平臺(tái):從基礎(chǔ)運(yùn)到智能運(yùn)的飛躍

    進(jìn)行實(shí)時(shí)監(jiān)控,確保系統(tǒng)的穩(wěn)定運(yùn)行。無(wú)論是服務(wù)器、網(wǎng)絡(luò)設(shè)備、數(shù)據(jù)庫(kù)還是中間件,平臺(tái)都能提供詳盡的監(jiān)控?cái)?shù)據(jù)。 故障定位與處理 :借助強(qiáng)大的數(shù)據(jù)分析能力,平臺(tái)能夠快速定位故障根源,并為運(yùn)
    的頭像 發(fā)表于 04-16 16:26 ?296次閱讀

    SVG無(wú)功補(bǔ)償裝置常見(jiàn)故障

    常見(jiàn)故障、可能的原因和解決方法,旨在為讀者提供有關(guān)SVG無(wú)功補(bǔ)償裝置故障診斷和處理的參考。 一、SVG無(wú)功補(bǔ)償裝置常見(jiàn)故障 電源故障:SV
    的頭像 發(fā)表于 02-27 09:13 ?2678次閱讀

    熱電偶測(cè)回路常見(jiàn)故障處理方法

    確甚至無(wú)法正常工作。本文將介紹熱電偶測(cè)回路常見(jiàn)故障處理方法,以幫助用戶快速排除故障并恢復(fù)正常工作。 第一、接線錯(cuò)誤 接線錯(cuò)誤是熱電偶測(cè)回路中常見(jiàn)
    的頭像 發(fā)表于 02-05 13:46 ?1621次閱讀

    使用相序識(shí)別儀時(shí),常見(jiàn)故障原因以及處理方式概述

    使用相序識(shí)別儀時(shí),常見(jiàn)故障原因以及處理方式概述? 相序識(shí)別儀(Phase Sequence Relay)是一種用于工業(yè)和家庭電氣系統(tǒng)中的設(shè)備,主要用于檢測(cè)和糾正電源的相序錯(cuò)誤。然而,相序識(shí)別儀也
    的頭像 發(fā)表于 12-19 15:04 ?1077次閱讀

    光纖收發(fā)器的8個(gè)故障排查

    介紹光纖收發(fā)器的八個(gè)常見(jiàn)故障,并提供相應(yīng)的排查解決方法。 1. 無(wú)光信號(hào)輸出故障:如果光纖收發(fā)器沒(méi)有輸出光信號(hào),首先需要檢查是否正常連接了光纖輸入端口。如果連接正確,檢查光纖輸入端口是
    的頭像 發(fā)表于 11-28 15:27 ?2047次閱讀

    超聲波探傷儀常見(jiàn)故障處理方法

    超聲波探傷儀常見(jiàn)故障處理方法
    的頭像 發(fā)表于 11-24 10:39 ?1252次閱讀

    安捷倫網(wǎng)絡(luò)分析儀常見(jiàn)故障以及處理方法

    安捷倫網(wǎng)絡(luò)分析儀常見(jiàn)故障以及處理方法
    的頭像 發(fā)表于 11-24 10:14 ?1546次閱讀

    語(yǔ)音芯片ic常見(jiàn)故障分析 如何排查問(wèn)題 聲音不清晰 有爆破聲

    語(yǔ)音芯片ic常見(jiàn)故障分析 如何排查問(wèn)題 聲音不清晰 有爆破聲 這些問(wèn)題可能存在于如下方面: 1、供電電源是否穩(wěn)定 2、PCB板上面電容是否放置位置合適 3、揚(yáng)聲器是否正常 4、生成的音源
    的頭像 發(fā)表于 11-02 14:55 ?674次閱讀
    語(yǔ)音芯片ic<b class='flag-5'>常見(jiàn)故障</b>分析 如何<b class='flag-5'>排查</b>問(wèn)題 聲音不清晰 有爆破聲

    光伏逆變器常見(jiàn)故障分析及處理維修

    光伏逆變器常見(jiàn)故障分析及處理 一、電氣量故障: 1、直流側(cè)過(guò)、欠電壓: 故障原因分析:大氣過(guò)電壓、內(nèi)部電容、電抗元件故障、直流輸入功率低、直
    的頭像 發(fā)表于 10-16 15:55 ?5238次閱讀

    電腦常見(jiàn)故障維修心得

    電子發(fā)燒友網(wǎng)站提供《電腦常見(jiàn)故障維修心得.pdf》資料免費(fèi)下載
    發(fā)表于 10-09 16:35 ?4次下載
    電腦<b class='flag-5'>常見(jiàn)故障</b>維修心得