SQL Server--疑難雜症之坑爹的Windows故障轉移群集

来源:http://www.cnblogs.com/TeyGao/archive/2017/01/20/6318189.html
-Advertisement-
Play Games

估計是春節前最後一次寫博客,也估計是本年值班最後一次踩雷,感嘆下成也SQL SERVER,敗也SQL SERVER。 場景描述: 操作系統版本 :Windows Server 2012 數據中心版本 資料庫版本 :SQL SERVER 2012 企業版,版本號:11.0.5582.0 問題描述:數據 ...


--==============================================================

估計是春節前最後一次寫博客,也估計是本年值班最後一次踩雷,感嘆下成也SQL SERVER,敗也SQL SERVER。

--==============================================================

場景描述:

操作系統版本 :Windows Server 2012 數據中心版本

資料庫版本 :SQL SERVER 2012 企業版,版本號:11.0.5582.0

問題描述:資料庫配置Alwayson環境,同機房2節點同步自動切換+跨機房非同步,實現高可用性自動故障轉移,由於有四個節點,因此選擇奇數即3節點的群集仲裁,但當其中一節點(仲裁節點或非仲裁節點)發生硬體故障導致重啟,便可能“引發”群集之間香菇丟失通信,然後群集開始對各個群集節點"已從活動故障轉移群集成員身份中刪除群集節點XXX",最終群集把所有仲裁節點刪掉,群集自身掛掉,群集發生故障,導致上層依賴的Alwayson無法正常提供服務,處於“正在解析”狀態,直到重啟的節點恢復正常==>群集正常==》Alwayson正常。

假設有ABCD四個節點,AB和CD分別在兩個機房,ABC三節點配置為仲裁節點,C節點發生故障,從群集時間中發現:

ABC三節點先後從故障群集中被移除,然後仲裁丟失群集服務關閉。

--=====================================================================

根據MS專家給出的分析,懷疑網路問題,事件1135也明顯提示由於網路問題導致,而機房也查出部分出現該類故障的伺服器使用了有問題的AOC線纜。

但是,問題總是在但是之後,為什麼網路中喜歡在伺服器宕機的時候出來湊熱鬧呢?一組Windows故障轉移,當不出現問題的時候,一年多沒有出現網路問題,就偏偏恰好在伺服器宕機的時候網路“抖動”呢?因為伺服器宕機產生的興奮還是恐懼導致抖動呢?

同機房的網路應該比較值得信賴吧,一個異地機房的伺服器宕機導致同一機房的網路抖動也不太科學吧。

--=====================================================================

另外一個錯誤提示為:A與掛掉的C握手未在40秒內完成握手

難道群集節點之間這麼重感情麽?跟一個掛掉的節點握手都等待這麼長時間?要不要等到地老天荒呢?

 

科普下,如果出現類似狀況,如果發生宕機的伺服器無法儘快重啟成功,在故障轉移群集無法正常啟動下,可以使用 net stop clussvc來停止本地群集伺服器,然後再使用net start clussvc /fq來強制將本地群集服務啟動,以便儘快使Alwayson回覆正常提供服務。

 

--====================================================================

一些不太靠譜的建議,供各位參考:

1. 對於跨機房的仲裁節點,能不用還是別用吧,實在不行在同機房弄個伺服器做文件共用仲裁也行

2. 兩節點的故障轉移群集,一定要配置文件共用或磁碟見證

3. 群集屬性中策略一欄,儘量配置下““指定時段內重新啟動的最多次數”:

--====================================================================

吐槽下,Alwayson號稱秒級別的故障轉移啊,很誘惑,的確很多時候這個讓DBA很放心,收到故障簡訊的時候,早已自動轉移並恢復提供服務,DBA可以放心地洗個澡刷個牙換身衣服再來處理故障。但是理想是美好的,現實是殘酷的,AO大部分情況下還算給力,出現BUG無法正常切換的幾率較低(註意是較低不是沒有),但架不住坑爹的Windows故障轉移群集,地基不好,樓再結實也容易塌啊!

期望SQL SERVER能再次崛起,也期望作為SQL SERVER DBA能再像以前那樣驕傲地說“SQL SERVER,肯定沒問題”。

 

又是一年年關,看看身邊小伙伴一個個歸心似箭,突然害怕過年,混好的已經悄然睡去,混的差的早已失眠成習慣。

願各位朋友春節快樂,有錢沒錢,回家過年!

來年再見,來年再戰!

 


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 由[OpenDigg](http://www.opendigg.com/) 出品的iOS開源項目周報第五期來啦。我們的iOS開源周報集合了OpenDigg一周來新收錄的優質的[iOS開源項目](http://www.opendigg.com/tags/ios),方便iOS開發人員便捷的找到自己需要的... ...
  • iOS開發中,我們經常遇到獲取拍照、相冊中圖片的功能,就必然少不了UIImagePickerController,但是我們發現當我們使用它的時候,它的頁面是英文的,看著很彆扭,國人還是比較喜歡看中文界面,下麵來看看我們怎麼把它變成中文界面的吧! 只需下麵兩步就可以了: Project-->Info- ...
  • LinearGradient 線性漸變渲染器 LinearGradient中文翻譯過來就是線性漸變的意思。線性漸變通俗來講就是給起點設置一個顏色值如#faf84d,終點設置一個顏色值如#CC423C,然後在一個區域內繪圖,這個圖像的顏色將呈現非常美妙的效果,顏色會從起點顏色到終點顏色過渡。給一張圖, ...
  • 示例地址 GitHub : https://github.com/ZhangGaoxing/xamarin-android-demo/tree/master/ControlsDemo ...
  • v$session中Command的數字含義。 1 CREATE TABLE 2 INSERT 3 SELECT 4 CREATE CLUSTER 5 ALTER CLUSTER 6 UPDATE 7 DELETE 8 DROP CLUSTER 9 CREATE INDEX 10 DROP INDE ...
  • 當使用 sp_attach_db 系統存儲過程附加資料庫時- - Tag: 當使用 sp_attach_db 系統存儲過程附加資料庫時 //附加資料庫 sp_attach_db 當使用 sp_attach_db 系統存儲過程附加資料庫時。 sp_attach_db:將資料庫附加到伺服器。 語法 sp ...
  • 1.ASCII 返回與指定的字元對應的十進位數; SQL> select ascii(A) A,ascii(a) a,ascii(0) zero,ascii( ) space from dual; A A ZERO SPACE 65 97 48 32 2. CHR 給出整數,返回對應的字元; SQL ...
  • 作用:想要生成整個Oracle資料庫所有表結構WORD文檔(資料庫設計說明書) Oracle資料庫字典介紹 Oracle數據字典是有表和視圖組成的,存儲有關資料庫結構信息的一些資料庫對象。資料庫字典描述了實際數據是如何組織的。對它們可以象處理其他資料庫表或視圖一樣進行查詢,但不能進行任何修改。 Or ...
一周排行
    -Advertisement-
    Play Games
  • 示例項目結構 在 Visual Studio 中創建一個 WinForms 應用程式後,項目結構如下所示: MyWinFormsApp/ │ ├───Properties/ │ └───Settings.settings │ ├───bin/ │ ├───Debug/ │ └───Release/ ...
  • [STAThread] 特性用於需要與 COM 組件交互的應用程式,尤其是依賴單線程模型(如 Windows Forms 應用程式)的組件。在 STA 模式下,線程擁有自己的消息迴圈,這對於處理用戶界面和某些 COM 組件是必要的。 [STAThread] static void Main(stri ...
  • 在WinForm中使用全局異常捕獲處理 在WinForm應用程式中,全局異常捕獲是確保程式穩定性的關鍵。通過在Program類的Main方法中設置全局異常處理,可以有效地捕獲並處理未預見的異常,從而避免程式崩潰。 註冊全局異常事件 [STAThread] static void Main() { / ...
  • 前言 給大家推薦一款開源的 Winform 控制項庫,可以幫助我們開發更加美觀、漂亮的 WinForm 界面。 項目介紹 SunnyUI.NET 是一個基於 .NET Framework 4.0+、.NET 6、.NET 7 和 .NET 8 的 WinForm 開源控制項庫,同時也提供了工具類庫、擴展 ...
  • 說明 該文章是屬於OverallAuth2.0系列文章,每周更新一篇該系列文章(從0到1完成系統開發)。 該系統文章,我會儘量說的非常詳細,做到不管新手、老手都能看懂。 說明:OverallAuth2.0 是一個簡單、易懂、功能強大的許可權+可視化流程管理系統。 有興趣的朋友,請關註我吧(*^▽^*) ...
  • 一、下載安裝 1.下載git 必須先下載並安裝git,再TortoiseGit下載安裝 git安裝參考教程:https://blog.csdn.net/mukes/article/details/115693833 2.TortoiseGit下載與安裝 TortoiseGit,Git客戶端,32/6 ...
  • 前言 在項目開發過程中,理解數據結構和演算法如同掌握蓋房子的秘訣。演算法不僅能幫助我們編寫高效、優質的代碼,還能解決項目中遇到的各種難題。 給大家推薦一個支持C#的開源免費、新手友好的數據結構與演算法入門教程:Hello演算法。 項目介紹 《Hello Algo》是一本開源免費、新手友好的數據結構與演算法入門 ...
  • 1.生成單個Proto.bat內容 @rem Copyright 2016, Google Inc. @rem All rights reserved. @rem @rem Redistribution and use in source and binary forms, with or with ...
  • 一:背景 1. 講故事 前段時間有位朋友找到我,說他的窗體程式在客戶這邊出現了卡死,讓我幫忙看下怎麼回事?dump也生成了,既然有dump了那就上 windbg 分析吧。 二:WinDbg 分析 1. 為什麼會卡死 窗體程式的卡死,入口門檻很低,後續往下分析就不一定了,不管怎麼說先用 !clrsta ...
  • 前言 人工智慧時代,人臉識別技術已成為安全驗證、身份識別和用戶交互的關鍵工具。 給大家推薦一款.NET 開源提供了強大的人臉識別 API,工具不僅易於集成,還具備高效處理能力。 本文將介紹一款如何利用這些API,為我們的項目添加智能識別的亮點。 項目介紹 GitHub 上擁有 1.2k 星標的 C# ...