阿裡雲嚴重故障,釘釘、淘寶、閑魚、阿裡雲盤都崩了,阿裡系史詩級故障!!

来源:https://www.cnblogs.com/javastack/archive/2023/11/13/17828673.html
-Advertisement-
Play Games

大家好,我是棧長。 昨天 17 點多,棧長興緻來了,忙裡偷閑正在看了一把 LOL S13 淘汰賽,沒想到比賽還沒看完朋友圈就已經炸鍋了: 朋友圈有人開玩笑說,阿裡 35 歲的人是不是都被優化了?還是雙 11 後都鬆懈了?這大周末的還讓加班?讓不讓人省心點。。 這我看完也有點懵 B ,大家還記得上次的 ...


大家好,我是棧長。

昨天 17 點多,棧長興緻來了,忙裡偷閑正在看了一把 LOL S13 淘汰賽,沒想到比賽還沒看完朋友圈就已經炸鍋了:

朋友圈有人開玩笑說,阿裡 35 歲的人是不是都被優化了?還是雙 11 後都鬆懈了?這大周末的還讓加班?讓不讓人省心點。。

這我看完也有點懵 B ,大家還記得上次的語雀重大故障吧,弄了近 8 小時才完全恢復,這剛過去 10 來天,又來?這不是像阿裡這樣的大廠該有的作為啊!!

這次影響的還不只是語雀,阿裡系大部分產品都受到影響,包括:淘寶、阿裡雲、釘釘、語雀、閑魚、阿裡雲盤……

好家伙,一堆產品都上了微博熱搜,熱度甚至蓋過了 S13 半決賽。。

說到 LOL,這比賽都打的啥啊,太無語了,我上我也行,就這狀態,看得太失望了。

其他影響倒還好,阿裡雲眾多產品都受到了故障影響。。。

LOL 都看完了還沒有完全恢復,直到晚上 21:11 分所有雲產品才基本恢復正常:

阿裡雲確認故障原因與某個底層服務組件有關,這麼大個故障,居然都沒做好各種測試?我也是大寫的服!這次故障後,這位運維同學、總監的年終獎怕是沒有了。

阿裡雲服務狀態查詢網站:

https://status.aliyun.com

棧長寫文時,阿裡雲服務顯示已恢復正常:

說到雲伺服器,為了提升企業開發和運營效率,不少公司都會選擇雲伺服器,相信這次事件會給不少使用雲伺服器的人敲響警鐘。

我個人也用雲伺服器,包括小程式:Java面試庫博客網站、各種課程的後臺系統等,都會用到雲伺服器,期間也出現過服務中斷的情況,也有慘痛的、折騰死我的情況,所以,為了用戶體驗,我做任何操作都十分謹慎。。

為了服務穩定性,我總結了以下幾個要點:

1、數據備份

不要相信任何平臺,數據不在你手裡,就不是你的,可能隨時找不回,所以,如果要使用雲產品,養成定時備份數據的習慣是非常重要的。

數據備份可以是這樣:

  • 使用高可用的雲產品;
  • 定期對系統盤備份鏡像;
  • 做任何敏感運維操作都提前對系統備份鏡像;
  • 每天對數據盤進行快照;
  • 手動備份重要數據到其他安全的地方;
  • ……

2、多雲策略

不要全部依賴單一雲服務提供商,一個平臺出現故障,即使是高可用也是無解。可以考慮分散式部署,比如將一部分服務放在阿裡雲,另一部分放在騰訊雲或其他雲,這樣不至於阿裡雲故障導致所有服務不可用。

其他雲產品也是如此,雞蛋不要放在一個籃子里。

3、鏡像環境 + 灰度發佈

可以做一個鏡像環境,和線上環境一模一樣,系統上線時先在鏡像環境上線,如測試沒事再線上上環境進行灰度發佈,這也不至於影響所有用戶吧?

4、應急預案

不管怎麼樣,處理緊急意外情況的預案還要是有的,提前制定好詳細的應急預案,包括數據備份、緊急切換到備用系統等,做好全方位的監控,確保在系統服務中斷時,業務能迅速恢復,從而不影響到業務。

所以,要做好應急預案,隨時可以回滾,能迅速恢復服務,這是非常重要的,長時間折騰故障分析故障原因對真的不可取,這對企業和用戶來說都是災難。


說說感受:

阿裡這個重大故障,就這事確實挺誇張的,我個人也挺想不通,阿裡是國內的龍頭 IT 大廠,這麼大個企業,這麼多產品受到這麼長時間的故障影響,還一而再再而三的出現重大事故,真的會讓不少人失去信心。

雲伺服器還受這麼長時間影響,更不應該啊,想想全中國有多少企業和開發者都在用,任何一個小故障可能都會導致大量企業業務中斷,造成重大損失,甚至使公司倒閉。

大家還記得,之前有一家以數據為生存的公司因為雲伺服器故障導致數據全部丟失的事件吧,數據全丟了,結果公司也倒閉了,所以,記住,雞蛋不要放在一個籃子里,記得定期對數據進行備份。

上次語雀重大故障,大家都領到了 6 個月的會員補償,這次截止棧長寫文時,我並沒有在看到有類似的補償。當然,補償不是目的,只能安撫人心,我們希望雲產商做好服務穩定是首要的,不要讓大家對雲伺服器提心吊膽。

最後,雞蛋不要放在同一個籃子里!!!

近期熱文推薦:

1.1,000+ 道 Java面試題及答案整理(2022最新版)

2.勁爆!Java 協程要來了。。。

3.Spring Boot 2.x 教程,太全了!

4.別再寫滿屏的爆爆爆炸類了,試試裝飾器模式,這才是優雅的方式!!

5.《Java開發手冊(嵩山版)》最新發佈,速速下載!

覺得不錯,別忘了隨手點贊+轉發哦!


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 1 void meanFilter(BYTE* image, int width, int height, BYTE* outImg) 2 { 3 //均值濾波 4 int smth[9]; 5 int i, j, m, n; 6 BYTE block[9]; 7 8 // 高斯捲積核初始化 9 s ...
  • 原文在這裡。 由 Russ Cox, for the Go team 發佈於2023年11月10日 今天,我們慶祝Go開源發佈的第十四個生日!Go在過去一年裡取得了巨大的進展,發佈了兩個功能豐富的版本,並實現了其他重要的里程碑。 我們發佈了Go 1.20 in February和Go 1.21 in ...
  • 本篇以代碼為核心,在實踐中自學吧年輕人~ 非常好迭代作業,愛來自BUAA File對象 要進行文件處理肯定需要File類啦。 File的實例是一個實例(?),但是可以鏈接到本地的文件、文件夾,並對它們進行操作。 從下麵的一些示例中可以看到,同一份本地文件可以擁有多個File對象;同時,構造一個Fil ...
  • 在處理多個 PDF 文檔時,頻繁地打開關閉文件會嚴重影響效率。因此,對於一大堆內容相關的 PDF 文件,我們可以先將這些 PDF 文件合併起來再操作,從而提高工作效率。比如,在傳送大量的 PDF 文檔時,在處理同一項目下的多個 PDF 文檔時,或在列印一系列 PDF 文檔時,將文檔合併起來可以減少工 ...
  • 1、項目簡介 Chatgpt-Java是OpenAI官方Api的Java SDK,可以快速接入項目使用。支持OpenAI官方全部介面。 目前收穫將2500+star🌟。 開源地址:https://github.com/Grt1228/chatgpt-java 官方文檔:https://chatgp ...
  • 1 簡介 SQLFlow 可跟蹤超過 20 種主要資料庫(包括 Snowflake、Hive、SparkSQL、Teradata、Oracle、SQL Server、AWS Redshift、BigQuery 等)的欄位級數據血緣。 從查詢歷史記錄、ETL 腳本、Github/Bitbucket、本 ...
  • 在 Go 語言中,零值(Zero Value)是指在聲明變數但沒有顯式賦值的情況下,變數會被自動賦予一個預設值。這個預設值取決於變數的類型,不同類型的變數會有不同的零值。零值是 Go 語言中的一個重要概念,因為它確保了變數在聲明後具有一個可預測的初始狀態,減少了未初始化變數引發的問題。 以下是一些常 ...
  • 公眾號「架構成長指南」,專註於生產實踐、雲原生、分散式系統、大數據技術分享。 概述 在之前的教程中,我們看到了使用 RestTemplate 的 Spring Boot 微服務通信示例。 從 5.0 開始,RestTemplate處於維護模式,很快就會被棄用。因此 Spring 團隊建議使用org. ...
一周排行
    -Advertisement-
    Play Games
  • 示例項目結構 在 Visual Studio 中創建一個 WinForms 應用程式後,項目結構如下所示: MyWinFormsApp/ │ ├───Properties/ │ └───Settings.settings │ ├───bin/ │ ├───Debug/ │ └───Release/ ...
  • [STAThread] 特性用於需要與 COM 組件交互的應用程式,尤其是依賴單線程模型(如 Windows Forms 應用程式)的組件。在 STA 模式下,線程擁有自己的消息迴圈,這對於處理用戶界面和某些 COM 組件是必要的。 [STAThread] static void Main(stri ...
  • 在WinForm中使用全局異常捕獲處理 在WinForm應用程式中,全局異常捕獲是確保程式穩定性的關鍵。通過在Program類的Main方法中設置全局異常處理,可以有效地捕獲並處理未預見的異常,從而避免程式崩潰。 註冊全局異常事件 [STAThread] static void Main() { / ...
  • 前言 給大家推薦一款開源的 Winform 控制項庫,可以幫助我們開發更加美觀、漂亮的 WinForm 界面。 項目介紹 SunnyUI.NET 是一個基於 .NET Framework 4.0+、.NET 6、.NET 7 和 .NET 8 的 WinForm 開源控制項庫,同時也提供了工具類庫、擴展 ...
  • 說明 該文章是屬於OverallAuth2.0系列文章,每周更新一篇該系列文章(從0到1完成系統開發)。 該系統文章,我會儘量說的非常詳細,做到不管新手、老手都能看懂。 說明:OverallAuth2.0 是一個簡單、易懂、功能強大的許可權+可視化流程管理系統。 有興趣的朋友,請關註我吧(*^▽^*) ...
  • 一、下載安裝 1.下載git 必須先下載並安裝git,再TortoiseGit下載安裝 git安裝參考教程:https://blog.csdn.net/mukes/article/details/115693833 2.TortoiseGit下載與安裝 TortoiseGit,Git客戶端,32/6 ...
  • 前言 在項目開發過程中,理解數據結構和演算法如同掌握蓋房子的秘訣。演算法不僅能幫助我們編寫高效、優質的代碼,還能解決項目中遇到的各種難題。 給大家推薦一個支持C#的開源免費、新手友好的數據結構與演算法入門教程:Hello演算法。 項目介紹 《Hello Algo》是一本開源免費、新手友好的數據結構與演算法入門 ...
  • 1.生成單個Proto.bat內容 @rem Copyright 2016, Google Inc. @rem All rights reserved. @rem @rem Redistribution and use in source and binary forms, with or with ...
  • 一:背景 1. 講故事 前段時間有位朋友找到我,說他的窗體程式在客戶這邊出現了卡死,讓我幫忙看下怎麼回事?dump也生成了,既然有dump了那就上 windbg 分析吧。 二:WinDbg 分析 1. 為什麼會卡死 窗體程式的卡死,入口門檻很低,後續往下分析就不一定了,不管怎麼說先用 !clrsta ...
  • 前言 人工智慧時代,人臉識別技術已成為安全驗證、身份識別和用戶交互的關鍵工具。 給大家推薦一款.NET 開源提供了強大的人臉識別 API,工具不僅易於集成,還具備高效處理能力。 本文將介紹一款如何利用這些API,為我們的項目添加智能識別的亮點。 項目介紹 GitHub 上擁有 1.2k 星標的 C# ...