0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何避免服務(wù)器出現(xiàn)上述的存儲故障

454398 ? 來源:電子元件技術(shù) ? 作者:電子元件技術(shù) ? 2021-03-29 15:06 ? 次閱讀

服務(wù)器支撐著整個企業(yè)的信息數(shù)據(jù),在日常運轉(zhuǎn)過程中,服務(wù)器也會因為其復(fù)雜的硬件結(jié)構(gòu)、繁瑣的運行原理而出現(xiàn)一些大大小小的故障,而如如何快速排查診斷并修復(fù)服務(wù)器的故障事關(guān)整個公司業(yè)務(wù)正常開展與運作。

今天分享一篇讀者來稿,一起來看看他是如何排除和應(yīng)對工控服務(wù)器磁盤陣列常見故障問題的?

工控服務(wù)器磁盤陣列故障排除法

我們生產(chǎn)線有兩個服務(wù)器機房,由于一年四季運行,出現(xiàn)服務(wù)器宕機問題也是常有的事,不過我們生產(chǎn)線服務(wù)器都是雙備份冗余配置,一臺出現(xiàn)問題對生產(chǎn)影響不是太大。這么多年來就遇到的問題和排查方法及注意事項個人做了一些記錄和匯總,正好看到威剛工控舉辦相關(guān)主題征文,在此與大家一起分享。

硬盤每時每刻都在讀取數(shù)據(jù),不間斷的工作使得出現(xiàn)故障的可能性也比較大,而硬盤發(fā)生故障的時候,通常會有一系列表現(xiàn):

1、故障提示:這是最直接的一種故障表現(xiàn)方式,硬盤也具備自我監(jiān)測的能力,當硬盤中的部件與我們設(shè)置的正常范圍值不同時,就會自動發(fā)出提示信息。我們就可以根據(jù)這個提示信息,進行相應(yīng)的維護。整理一下服務(wù)器,檢查內(nèi)部安裝和接口,再觀察一段時間,仍然出現(xiàn)故障提示,更換硬件。雖然有可能是背板或者主板問題引起一般,但這種情況不太多。

2、運行報錯:硬盤運行出錯表現(xiàn)在掃描時自身出現(xiàn)錯誤,顯示壞道等情況,這個時候表示硬盤部件出現(xiàn)問題,需要將其修復(fù)或隔離。我們發(fā)現(xiàn)此類錯誤一般都是更換硬盤,因為即使修復(fù)隔離也說明硬盤帶病工作,很容易罷工,對生產(chǎn)線產(chǎn)品和質(zhì)量會造成損失。

3、硬盤無法讀取或識別: 啟動服務(wù)器時,硬盤無法正常被讀取,或者被識別后,系統(tǒng)仍然無法顯示硬盤,這就證明硬盤出現(xiàn)錯誤。更換硬盤至原先可以正常檢測到的槽位,根據(jù)現(xiàn)象排查故障,如果故障現(xiàn)象一樣,再繼續(xù)排查一下硬盤背板是不是故障,最后硬盤更換一般都是原廠備件更換,避免硬件出現(xiàn)兼容性不匹配問題,運行不穩(wěn)定。這個現(xiàn)象我們也遇到過,著實讓工程師們頭疼。

4、初始化死機: 一旦初始化就出現(xiàn)死機,雖然也有可能是內(nèi)存、病毒感染等問題,但最可能的還是硬盤故障,出現(xiàn)這種情況時,先通過清除CMOS,恢復(fù)資源初始配置,擴展第三方I/O卡屬于該機型兼容列表TPL,仍然不行考慮更換硬盤。

5、藍屏、頻繁重啟:內(nèi)存和主板是導(dǎo)致硬件藍屏的主要原因,可對內(nèi)存進行校驗排查,其他的還有殺毒軟件、驅(qū)動問題等。分析日志記錄排查故障是工程師朋友常用的方法。

6、外設(shè)故障引發(fā)故障:鍵盤會導(dǎo)致開機報錯、顯示器會導(dǎo)致黑屏…

學會利用狀態(tài)指示燈,高端服務(wù)器一般都有狀態(tài)指示燈,不同的機器指示燈含義不同,通過指示燈的顏色、閃爍、亮滅排查故障結(jié)合本身日志記錄確定問題,是工程師人員基本要求。

總的來說,在服務(wù)器安全運行管理中,可能造成服務(wù)器安全運行的威脅因素遠不止以上幾個方面,要保障服務(wù)器安全運行,工程師人員要有一定的技術(shù)能力和維護經(jīng)驗,給企業(yè)營造一個安全穩(wěn)定的運行平臺。

如何避免服務(wù)器出現(xiàn)上述的存儲故障,,選對合適耐用的存儲產(chǎn)品很關(guān)鍵。對此,威剛科技推出一系列高品質(zhì)、高性能存儲解決方案。

PCIe M.2 2280固態(tài)硬盤

● PCIe超高速界面,短時間內(nèi)處理海量數(shù)據(jù),充分滿足IoT物聯(lián)網(wǎng)/云計算/邊緣運算的需求;

● 總擦寫次數(shù)(P/E cycles)達 3K次,耐用可靠;

● LDPC ECC糾錯機制,確保數(shù)據(jù)傳輸準確穩(wěn)定。

DDR4 2666/3200超高速內(nèi)存

● 高效能、低延遲,充分滿足IoT物聯(lián)網(wǎng)/云計算/邊緣運算的需求;

● 高達32GB的大容量,輕松存儲海量數(shù)據(jù);

● 嚴選原廠顆粒,質(zhì)量優(yōu)異,耐用可靠。

編輯:hfy

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 存儲技術(shù)
    +關(guān)注

    關(guān)注

    5

    文章

    727

    瀏覽量

    45764
  • 服務(wù)器
    +關(guān)注

    關(guān)注

    12

    文章

    8943

    瀏覽量

    85058
  • PCIe
    +關(guān)注

    關(guān)注

    15

    文章

    1199

    瀏覽量

    82338
  • 固態(tài)硬盤
    +關(guān)注

    關(guān)注

    12

    文章

    1442

    瀏覽量

    57212
收藏 人收藏

    評論

    相關(guān)推薦

    存儲服務(wù)器出現(xiàn)存儲市場產(chǎn)生了嚴重的打擊

    存儲服務(wù)器出現(xiàn)無疑是對存儲市場的嚴重打擊,搶占了大量的存儲份額。在當今的it環(huán)境中,存儲將被替
    的頭像 發(fā)表于 03-14 14:58 ?2218次閱讀

    存儲服務(wù)器和普通服務(wù)器區(qū)別

    本文主要闡述了存儲服務(wù)器和普通服務(wù)器區(qū)別。
    發(fā)表于 05-06 15:12 ?5179次閱讀

    存儲服務(wù)器怎么配置_存儲服務(wù)器的作用

    在配置存儲服務(wù)器錄像之前請先確認4200客戶端和存儲服務(wù)器都已經(jīng)安裝,即有 電腦 上有兩個圖標生成安裝軟件時,勾選安裝存儲
    發(fā)表于 05-06 15:18 ?5187次閱讀

    解析存儲服務(wù)器之間的區(qū)別和優(yōu)勢

    當我們聊到存儲服務(wù)器的高可用性時,我們通常會想到多控制或雙活動存儲服務(wù)器技術(shù)。在存儲
    發(fā)表于 08-06 09:12 ?1806次閱讀

    服務(wù)器數(shù)據(jù)恢復(fù)】nas存儲服務(wù)器磁盤陣列崩潰的數(shù)據(jù)恢復(fù)案例

    服務(wù)器數(shù)據(jù)恢復(fù)環(huán)境: nas存儲服務(wù)器,14塊硬盤組建raid6磁盤陣列。 服務(wù)器故障&分析:
    的頭像 發(fā)表于 11-30 10:56 ?1315次閱讀

    服務(wù)器數(shù)據(jù)恢復(fù)】服務(wù)器兩塊硬盤故障掉線的數(shù)據(jù)恢復(fù)案例

    某公司服務(wù)器,配備24塊FC硬盤,兩塊硬盤出現(xiàn)故障掉線,導(dǎo)致服務(wù)器上層的卷無法掛載。
    的頭像 發(fā)表于 01-09 15:37 ?849次閱讀

    降低服務(wù)器故障風險的4種方法

    對于所有使用服務(wù)器的用戶來說,最麻煩的可能是服務(wù)器故障。一旦服務(wù)器出現(xiàn)故障,您的業(yè)務(wù)將停止,直到
    的頭像 發(fā)表于 05-24 13:52 ?750次閱讀

    存儲服務(wù)器怎么搭建?

      搭建存儲服務(wù)器需要根據(jù)我們的需求和環(huán)境選擇合適的硬件和軟件,并進行相應(yīng)的配置。那么存儲服務(wù)器怎么搭建?
    的頭像 發(fā)表于 10-31 16:51 ?2841次閱讀

    服務(wù)器數(shù)據(jù)恢復(fù)—EVA存儲數(shù)據(jù)恢復(fù)案例

    服務(wù)器數(shù)據(jù)恢復(fù)環(huán)境: 某品牌EVA某型號存儲,底層是RAID5陣列,劃分了若干lun。 服務(wù)器故障&分析: 該存儲設(shè)備中raid5
    的頭像 發(fā)表于 01-23 13:53 ?398次閱讀

    服務(wù)器數(shù)據(jù)恢復(fù)—EVA存儲異常斷電后出現(xiàn)故障的數(shù)據(jù)恢復(fù)方案

    數(shù)據(jù)庫。 服務(wù)器存儲故障&檢測: 存儲異常斷電重啟后,存儲中一臺虛擬機無法啟動。工作人員推測故障
    的頭像 發(fā)表于 05-28 10:29 ?314次閱讀

    服務(wù)器數(shù)據(jù)恢復(fù)—EqualLogic存儲硬盤故障導(dǎo)致存儲崩潰的數(shù)據(jù)恢復(fù)案例

    。 服務(wù)器故障存儲設(shè)備上兩塊硬盤指示燈顯示黃色,磁盤出現(xiàn)故障導(dǎo)致存儲不可用,
    的頭像 發(fā)表于 05-31 11:35 ?416次閱讀
    <b class='flag-5'>服務(wù)器</b>數(shù)據(jù)恢復(fù)—EqualLogic<b class='flag-5'>存儲</b>硬盤<b class='flag-5'>故障</b>導(dǎo)致<b class='flag-5'>存儲</b>崩潰的數(shù)據(jù)恢復(fù)案例

    Jtti:如何在服務(wù)器擴展時避免單點故障?有哪些常見的高可用性策略?

    服務(wù)器擴展是組織應(yīng)對不斷增長的業(yè)務(wù)需求和數(shù)據(jù)負載的重要手段。然而,隨之而來的卻是更大規(guī)模的風險,存在單點故障可能導(dǎo)致整個系統(tǒng)的宕機,嚴重影響業(yè)務(wù)連續(xù)性和用戶體驗。 避免單點故障的策略
    的頭像 發(fā)表于 07-18 16:02 ?193次閱讀

    服務(wù)器數(shù)據(jù)恢復(fù)—LeftHand存儲結(jié)構(gòu)&amp;raid故障的數(shù)據(jù)恢復(fù)案例

    LeftHand存儲數(shù)據(jù)恢復(fù)案例: 服務(wù)器存儲數(shù)據(jù)恢復(fù)環(huán)境&故障: 該LeftHand存儲中有三組raid,兩個卷,12塊物理硬盤。
    的頭像 發(fā)表于 07-19 10:25 ?280次閱讀
    <b class='flag-5'>服務(wù)器</b>數(shù)據(jù)恢復(fù)—LeftHand<b class='flag-5'>存儲</b>結(jié)構(gòu)&amp;raid<b class='flag-5'>故障</b>的數(shù)據(jù)恢復(fù)案例

    華納云:服務(wù)器擴展中如何避免單點故障

    備份備份是避免單點故障的有效策略。這包括硬件備份(如RAID陣列)、數(shù)據(jù)備份(如服務(wù)器備份)以及網(wǎng)絡(luò)備份(如多路徑路由)。生成備份,即使部分系統(tǒng)發(fā)生故障,仍然能夠保持
    的頭像 發(fā)表于 07-29 14:52 ?182次閱讀

    服務(wù)器數(shù)據(jù)恢復(fù)—EVA存儲誤刪除VDISK的數(shù)據(jù)恢復(fù)案例

    案例審理材料。 服務(wù)器存儲故障&檢測: 該EVA存儲出現(xiàn)故障,無法正常使用。而且經(jīng)過幾家
    的頭像 發(fā)表于 11-05 14:39 ?93次閱讀
    <b class='flag-5'>服務(wù)器</b>數(shù)據(jù)恢復(fù)—EVA<b class='flag-5'>存儲</b>誤刪除VDISK的數(shù)據(jù)恢復(fù)案例