0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

阿里云崩了:企業(yè)未來該怎么選擇云廠商?

jf_81200783 ? 來源:jf_81200783 ? 作者:jf_81200783 ? 2023-11-23 10:18 ? 次閱讀

2023 年 11 月 12 日 17:44 開始,阿里云發(fā)生嚴(yán)重故障,導(dǎo)致阿里巴巴大量產(chǎn)品無法連接,一時(shí)間,“阿里云盤崩了”、“淘寶又崩了”、“閑魚崩了”、“釘釘崩了”等話題相繼登上熱搜。

wKgaomVeA_2AY0gXAAGNlbzRN8g21.jpeg

阿里云出現(xiàn)大規(guī)模故障,也成為政企們熱議的話題,大家關(guān)心的問題在于:公有云到底還安全嗎?是否還能繼續(xù)上云?未來應(yīng)該采取哪些措施來保障穩(wěn)定可靠?

不要?jiǎng)訐u“上云”的方向

一個(gè)不爭(zhēng)的事實(shí)是:阿里云出現(xiàn)嚴(yán)重故障,給上云企業(yè),特別是核心業(yè)務(wù)跑在云上的企業(yè)帶來了損失。

一個(gè)是故障波及的范圍廣,故障期間阿里云控制臺(tái)無法正常登錄,API 調(diào)用異常,導(dǎo)致阿里云全系列產(chǎn)品服務(wù)及全球區(qū)域數(shù)據(jù)中心都受到了影響;另一個(gè)是持續(xù)的時(shí)間長,故障持續(xù)了 3 個(gè)多小時(shí)才基本完全恢復(fù)。據(jù)不完全統(tǒng)計(jì),除了阿里系幾乎全線產(chǎn)品出現(xiàn)故障外,整數(shù)云、理工小蜜蜂、餓樂送、cooleasy、IOTTEC、納思云、語雀等平臺(tái)均受到影響。

如此大的影響規(guī)模,如此嚴(yán)重的程度,在公有云歷史上都非常罕見。于是,有一些人出現(xiàn)了是否繼續(xù)上云的疑慮,甚至有人說應(yīng)該退回到過去自建的模式。

筆者首先給出結(jié)論:千萬不要?jiǎng)訐u“上云”的方向。雖然這次阿里云出現(xiàn)的故障很嚴(yán)重,但我們?nèi)圆荒芊裾J(rèn)云相比物理主機(jī)具有更高的可靠性。

這是因?yàn)閭鹘y(tǒng)服務(wù)器硬件受到廠商品牌、機(jī)型、服務(wù)器運(yùn)行時(shí)間以及部件型號(hào)故障率等諸多因素影響,更容易出現(xiàn)故障,而云服務(wù)提供商通常遵循一對(duì)多的模型,而且具有專業(yè)的基礎(chǔ)運(yùn)維團(tuán)隊(duì)和內(nèi)核團(tuán)隊(duì),能夠在出現(xiàn)問題時(shí)快速恢復(fù)。相比自建機(jī)房的方式,公有云不僅運(yùn)維成本更低,而且運(yùn)維更專業(yè)、可靠。

某電商公司 2018 年投入數(shù)百萬資金自建物理機(jī)房,起初系統(tǒng)穩(wěn)定性連 90%都達(dá)不到,2020 年雙 11 大促活動(dòng)期間,因業(yè)務(wù)中斷兩小時(shí),造成高達(dá) 100 余萬的損失。后來該公司改用移動(dòng)云云主機(jī),公司業(yè)務(wù)系統(tǒng)穩(wěn)定性提高至 99%,建設(shè)維護(hù)成本下降 60%,問題迎刃而解。

更重要的是,上云相比自建機(jī)房更是能為企業(yè)帶來無可比擬的價(jià)值。在數(shù)字化轉(zhuǎn)型的大背景下,云作為數(shù)字化轉(zhuǎn)型的重要支撐技術(shù),具有按需使用、彈性伸縮、資源共享等優(yōu)勢(shì),可以提升企業(yè)的業(yè)務(wù)敏捷性,降低企業(yè)的成本。而且,云計(jì)算也是人工智能的基座,只有在云的基礎(chǔ)上,企業(yè)才能更好地?fù)肀?a href="http://ttokpm.com/v/" target="_blank">智能時(shí)代。

從千行萬業(yè)無數(shù)企業(yè)的實(shí)踐也能看到這一點(diǎn)。例如,對(duì)可靠性要求最為苛刻的金融企業(yè),也在將核心業(yè)務(wù)上云。以郵儲(chǔ)銀行為例,其新一代分布式核心系統(tǒng)為全行 6 億多個(gè)人客戶提供了日均 20 億筆的處理能力,聯(lián)機(jī)交易處理效率提升一倍,批處理效率提升 33%。

正如長江黃河不會(huì)倒流,上云的大方向也不會(huì)因?yàn)槌霈F(xiàn)一些坎坷而發(fā)生改變。

雞蛋不要放在一個(gè)籃子里

上云的方向沒問題,但是上云的路徑和具體策略卻需要借助阿里云故障時(shí)間進(jìn)行重新審視。

比如對(duì)于核心業(yè)務(wù)上云的企業(yè),就有必要警惕云集中的風(fēng)險(xiǎn),實(shí)施多云戰(zhàn)略勢(shì)在必行。

Gartner 公布的 2023 年三季度新興風(fēng)險(xiǎn)報(bào)告顯示,云集中風(fēng)險(xiǎn)連續(xù)第二年進(jìn)入“五大新興風(fēng)險(xiǎn)”綜合榜單,其中中國市場(chǎng)的這種風(fēng)險(xiǎn)尤為突出。正如 Gartner 法律風(fēng)險(xiǎn)與合規(guī)實(shí)踐部門研究總結(jié)徐然所說,“云服務(wù)集中化風(fēng)險(xiǎn)正在成為大多數(shù)企業(yè)的共識(shí),許多企業(yè)和機(jī)構(gòu)現(xiàn)在面臨這樣的處境:一旦單個(gè)云服務(wù)商出現(xiàn)故障,將導(dǎo)致業(yè)務(wù)發(fā)生嚴(yán)重中斷?!?/p>

破局云集中風(fēng)險(xiǎn)的一個(gè)有效途徑,就是實(shí)施多云戰(zhàn)略,就像不要將雞蛋放在同一個(gè)籃子里一樣。Flexera 發(fā)布的《2021 年云計(jì)算市場(chǎng)發(fā)展?fàn)顟B(tài)報(bào)告》顯示,有 92%的企業(yè)采用了多云戰(zhàn)略,就是如此。

采用多云戰(zhàn)略的好處顯而易見,一方面,企業(yè)可以將風(fēng)險(xiǎn)分散,防止出現(xiàn)某個(gè)云廠商出現(xiàn)故障時(shí)企業(yè)業(yè)務(wù)中斷的風(fēng)險(xiǎn),實(shí)現(xiàn)雙保險(xiǎn)、多保險(xiǎn);另一方面,企業(yè)也能選擇各領(lǐng)域最優(yōu)的云服務(wù)廠商,形成最佳組合來滿足業(yè)務(wù)需求。

通過這次阿里云宕機(jī)事件,還有一個(gè)警示意義,那就是必須要重視災(zāi)備。事實(shí)上,災(zāi)備服務(wù)也是云相比自建機(jī)房的重要優(yōu)勢(shì),云服務(wù)提供商通常會(huì)提供災(zāi)備服務(wù),以滿足企業(yè)數(shù)據(jù)安全和業(yè)務(wù)連續(xù)性需求。

但是需要指出的是,不同云廠商的災(zāi)備服務(wù)能力也是有差異的。例如,華為云就具有同城 AZ(AvailableZone,可用區(qū))內(nèi)、跨 AZ、異地跨區(qū)的兩地三中心容災(zāi)方案和 1000 公里以上的城市級(jí)容災(zāi)能力。河鋼集團(tuán),就采用華為云提供的兩地三中心容災(zāi)備份方案,實(shí)現(xiàn)了系統(tǒng)的平穩(wěn)可靠運(yùn)行,任何時(shí)候都能實(shí)現(xiàn)業(yè)務(wù) 0 中斷。

所以,對(duì)于將核心業(yè)務(wù)放在云上的企業(yè),只有不將雞蛋放在一個(gè)籃子里(多云與多地災(zāi)備),才能最大限度保障企業(yè)核心數(shù)據(jù)的安全和業(yè)務(wù)的平穩(wěn)運(yùn)行。

后記:選云,要選可靠的云

毋庸置疑,阿里云這次出現(xiàn)如此大的故障,會(huì)對(duì)其未來的市場(chǎng)開拓帶來負(fù)面影響。野村綜研(上海)數(shù)字化能力中心總監(jiān)陶旭駿就表示,政府和國企央企市場(chǎng)是云市場(chǎng)的非常重要的客戶群,他們對(duì)安全性和穩(wěn)定性的要求是壓倒成本和性能的,阿里云會(huì)在開拓企業(yè)市場(chǎng)時(shí)受到挑戰(zhàn)。

可以預(yù)計(jì),這次事件也會(huì)對(duì)政企在選擇云服務(wù)廠商時(shí)帶來影響,大家會(huì)有一個(gè)強(qiáng)烈的共識(shí):選云,要選可靠的云。因?yàn)椋还苁切阅?,還是成本,都必須有一個(gè)前提,那就是高可靠性、高可用性。打個(gè)比方,高可靠性和高可用性是 1,其他是 0,如果沒有前者,后者也不復(fù)存在。

那么什么是可靠的云呢?我覺得,首先要看企業(yè)的基因。比如華為云,就根植華為的基因,華為從運(yùn)營商業(yè)務(wù)起家,運(yùn)營商對(duì)于產(chǎn)品的可靠性、穩(wěn)定性有極高的要求,如我們經(jīng)常聽到的電信級(jí)要求,要求在不間斷運(yùn)行、高穩(wěn)定性、可靠性上有 5 個(gè) 9 的級(jí)別。正是這樣嚴(yán)苛的要求,讓高可靠性、高可用性刻在了華為、華為云的骨子里,滲透到了血液里。

其次要看企業(yè)在高可靠性、高可用性上的技術(shù)能力,尤其是運(yùn)維安全上的內(nèi)功。事實(shí)上,在軟硬件迭代加速、企業(yè)需求瞬息萬變、不確定性加劇的大背景下,云服務(wù)的運(yùn)維也在發(fā)生變革,運(yùn)維既要保穩(wěn),也要敏捷。令人欣喜的是,業(yè)界的頭部廠商正在身體力行地推動(dòng)運(yùn)維模式的變革,從運(yùn)維組織、人員能力、知識(shí)體系發(fā)展等全維度進(jìn)行變革,強(qiáng)化穩(wěn)定可靠性。

穩(wěn)定可靠一直是各云廠商的業(yè)務(wù)重點(diǎn)和難點(diǎn),為此進(jìn)行了各種組織上和體制上的設(shè)計(jì)。例如,華為云內(nèi)部就專門有一種職業(yè),叫做 SRE(SiteReliabllitiyEngineer,站點(diǎn)可用工程師),還系統(tǒng)定義了包括質(zhì)量管理機(jī)制、運(yùn)維平臺(tái)等 SRE 的能力體系。京東云通過京東云云泰-穩(wěn)定性主動(dòng)管理平臺(tái),為客戶提供全鏈路的云上安全保障,其基于混沌工程原理,可以做到先于用戶發(fā)現(xiàn)問題、先于感知修復(fù)問題。金山云服務(wù)器帶來完善的管理員面板功能,可以讓用戶快速了解實(shí)例情況、配置實(shí)例、掛載和擴(kuò)容硬盤等,隨時(shí)掌控資源使用情況。

總而言之,針對(duì)阿里云出現(xiàn)故障這一事件,需要客觀理性看待:既不能因噎廢食,改變上云的大方向;也不能置若罔聞,需要對(duì)上云的路徑和策略進(jìn)行重新審視,需要對(duì)云服務(wù)廠商進(jìn)行全面審視。

只有這樣,企業(yè)的云上之旅和數(shù)字化轉(zhuǎn)型步伐才能既快又穩(wěn)。

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 服務(wù)器
    +關(guān)注

    關(guān)注

    12

    文章

    8958

    瀏覽量

    85081
  • 云服務(wù)
    +關(guān)注

    關(guān)注

    0

    文章

    803

    瀏覽量

    38850
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    阿里大面積宕機(jī),淘寶、餓了么等多產(chǎn)品“崩了”,機(jī)房運(yùn)行面臨四大挑戰(zhàn)

    電子發(fā)燒友網(wǎng)報(bào)道(文/吳子鵬)11月12日下午,就在雙十一大促的后一天,阿里疑似發(fā)生大規(guī)模、大范圍故障,導(dǎo)致包括淘寶、閑魚、阿里盤、釘釘在內(nèi)的
    的頭像 發(fā)表于 11-14 09:05 ?2655次閱讀

    阿里設(shè)備的物模型數(shù)據(jù)里面始終沒有值是為什么?

    如上圖,不知道講清楚沒有。 IG502自定義TOPIC 上發(fā)到阿里沒問題。采用阿里物模型的格式來上發(fā)就不行。請(qǐng)大佬指教!
    發(fā)表于 07-24 07:49

    ESP32S3連接阿里物聯(lián)網(wǎng)平臺(tái)LinkSDK報(bào)錯(cuò)怎么解決?

    背景:參考阿里官方文檔:樂鑫ESP32開發(fā)板移植(https://help.aliyun.com/document_detail ... 82038.0.i3)進(jìn)行 SDK 移植操作。 環(huán)境
    發(fā)表于 06-28 11:30

    計(jì)算與企業(yè)IT成本治理

    計(jì)算已經(jīng)當(dāng)仁不讓成為企業(yè)IT架構(gòu)的核心。 起初企業(yè)選擇計(jì)算的一大動(dòng)因是廠商宣稱
    的頭像 發(fā)表于 06-19 09:40 ?473次閱讀
    <b class='flag-5'>云</b>計(jì)算與<b class='flag-5'>企業(yè)</b>IT成本治理

    阿里 all in AI 的決心

    “第一個(gè)提出MaaS的阿里,能否成為廠商在AI時(shí)代變革的新范本?”如何抓住AI的機(jī)會(huì)?這是進(jìn)入大模型時(shí)代后,面對(duì)新的起點(diǎn),各大
    的頭像 發(fā)表于 05-17 08:04 ?323次閱讀
    <b class='flag-5'>阿里</b><b class='flag-5'>云</b> all in AI 的決心

    通過STM32+ESP8266 Wifi模塊 +服務(wù)器,做一個(gè)數(shù)據(jù)收發(fā)控制的板子服務(wù)器方面如何選擇?

    通過STM32+ESP8266 Wifi模塊 +服務(wù)器 做一個(gè)數(shù)據(jù)收發(fā)控制的板子 服務(wù)器方面如何選擇?
    發(fā)表于 04-25 08:16

    阿里全面降價(jià),釋放了什么信號(hào)?

    元宵節(jié)剛過,阿里就放了一個(gè)大招——今天(2月29日)上午,阿里發(fā)布通告,宣布全線下調(diào)產(chǎn)品官網(wǎng)售價(jià)。這次降價(jià)涉及計(jì)算、存儲(chǔ)、數(shù)據(jù)庫等在內(nèi)
    的頭像 發(fā)表于 04-16 08:05 ?145次閱讀
    <b class='flag-5'>阿里</b><b class='flag-5'>云</b>全面降價(jià),釋放了什么信號(hào)?

    廠商再次大降價(jià),加速計(jì)算在各行業(yè)的發(fā)展和普及?

    電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎)近年來,計(jì)算市場(chǎng)的競(jìng)爭(zhēng)愈發(fā)激烈,各大廠商紛紛通過降價(jià)來爭(zhēng)奪市場(chǎng)份額。前不久,阿里宣布了全線
    的頭像 發(fā)表于 03-25 09:23 ?1645次閱讀

    阿里推出企業(yè)級(jí)大模型RAG系統(tǒng)

    在國際AI大數(shù)據(jù)峰會(huì)上,阿里重磅推出了企業(yè)級(jí)大模型檢索增強(qiáng)生成(RAG)解決方案。這一解決方案旨在為企業(yè)提供更強(qiáng)大、更智能的大模型應(yīng)用工具,幫助
    的頭像 發(fā)表于 02-05 09:54 ?1090次閱讀

    阿里崩潰損失大?華為耀服務(wù)器 L 實(shí)例為企業(yè)保駕護(hù)航

    十分重要。 從阿里崩潰波及范圍看,很多是數(shù)字電商、在線教育等中小企業(yè),雖然崩潰時(shí)間不長,但是影響到了不少人的正常生活。對(duì)于這種中小企業(yè)數(shù)字化應(yīng)用和轉(zhuǎn)型升級(jí),傳統(tǒng)
    的頭像 發(fā)表于 11-24 09:37 ?307次閱讀
    <b class='flag-5'>阿里</b><b class='flag-5'>云</b>崩潰損失大?華為<b class='flag-5'>云</b>耀<b class='flag-5'>云</b>服務(wù)器 L 實(shí)例為<b class='flag-5'>企業(yè)</b>保駕護(hù)航

    極致安全可靠才是王道!華為這款輕量應(yīng)用服務(wù)器值得相信

    ,阿里就喜提熱搜,不過并不是喜報(bào),多款應(yīng)用集體崩了的情況,在任何互聯(lián)網(wǎng)公司內(nèi)部絕對(duì)算是一次重大事故,這也足以說明技術(shù)的安全和穩(wěn)定才是最終體驗(yàn)的壓艙石。 實(shí)際上,對(duì)于中小
    的頭像 發(fā)表于 11-23 00:58 ?187次閱讀
    極致安全可靠才是王道!華為<b class='flag-5'>云</b>這款輕量應(yīng)用服務(wù)器值得相信

    性能與成本如何兼顧,企業(yè)選擇輕量應(yīng)用服務(wù)器為何推薦華為?

    的需求和預(yù)算來選擇合適的服務(wù)器。 一般來說,服務(wù)器可以分為三種類型:公有、私有云和混合。公有
    的頭像 發(fā)表于 11-21 09:31 ?294次閱讀
    性能與成本如何兼顧,<b class='flag-5'>企業(yè)</b><b class='flag-5'>選擇</b>輕量應(yīng)用<b class='flag-5'>云</b>服務(wù)器為何推薦華為<b class='flag-5'>云</b>?

    華為耀服務(wù)器 L 實(shí)例,是否是企業(yè)簡單上的最佳選擇?

    計(jì)算是當(dāng)今科技領(lǐng)域的重要發(fā)展方向,也是中小企業(yè)和開發(fā)者的創(chuàng)新平臺(tái)。然而,面對(duì)市場(chǎng)上眾多的計(jì)算產(chǎn)品,中小企業(yè)和開發(fā)者如何選擇一款適合自己的
    的頭像 發(fā)表于 11-21 09:19 ?323次閱讀
    華為<b class='flag-5'>云</b>耀<b class='flag-5'>云</b>服務(wù)器 L 實(shí)例,是否是<b class='flag-5'>企業(yè)</b>簡單上<b class='flag-5'>云</b>的最佳<b class='flag-5'>選擇</b>?

    阿里全球宕機(jī):從阿里故障看企業(yè) IT 挑戰(zhàn)

    互聯(lián)網(wǎng)分析師,我將從專業(yè)的角度對(duì)這次事故進(jìn)行觀察和評(píng)論。 首先,我們需要認(rèn)識(shí)到這次故障的規(guī)模之巨大。根據(jù)阿里官方公布的信息,受影響的產(chǎn)品涵蓋了幾乎所有阿里的服務(wù)和功能,從
    的頭像 發(fā)表于 11-13 00:28 ?386次閱讀

    突發(fā)!阿里崩了:全線產(chǎn)品受影響

    剛剛,看到微博熱搜榜,淘寶又崩了、閑魚崩了、阿里崩了、釘釘崩了。。
    的頭像 發(fā)表于 11-13 00:26 ?365次閱讀
    突發(fā)!<b class='flag-5'>阿里</b><b class='flag-5'>云</b><b class='flag-5'>崩了</b>:全線產(chǎn)品受影響