Configure Always On Availability Group for SQL Server on Ubuntu——Ubuntu上配置SQL Server Always On Availability Group

来源:http://www.cnblogs.com/lavender000/archive/2017/05/25/6906280.html
-Advertisement-
Play Games

下麵簡單介紹一下如何在Ubuntu上一步一步創建一個SQL Server AG(Always On Availability Group),以及配置過程中遇到的坑的填充方法。 目前在Linux上可以搭建兩種類型的SQL Server AG,一種是高可用性的結構同時使用Cluster伺服器提供業務連續 ...


下麵簡單介紹一下如何在Ubuntu上一步一步創建一個SQL Server AG(Always On Availability Group),以及配置過程中遇到的坑的填充方法。

 

目前在Linux上可以搭建兩種類型的SQL Server AG,一種是高可用性的結構同時使用Cluster伺服器提供業務連續性。這種結構包括read-scale節點。接下來就會介紹這種AG的搭建方法。另外一種是沒有Cluster服務的read-scale AG,這種結構僅僅提供只讀的可擴展性,不提供高可用性功能。關於如何創建這種簡單的AG請參考:Configure read-scale availability group for SQL Server on Linux

另外在CREATE AVAILABILITY GROUP時可以指定CLUSTER TYPE:

  • WSFC:Windows server failover cluster。這個是Windows系統上的預設值;
  • EXTERNAL:非Windows server上的failover cluster,比如Linux上的Pacemaker;
  • NONE:不包含cluster manager,指的是創建read-scale類型的Availability Group。

其中Linux可以使用EXTERNAL或NONE,我理解的是EXTENRAL功能就是類似目前SQL Server中的AG,NONE則是一種新類型,沒有Cluster功能的不支持高可用性和災難恢復的AG。主要作用是分擔主伺服器的負載,支持多個只讀備用節點,同時這種類型也支持Windows上使用,是SQL Server 2017新支持的功能。更多詳細的信息請參考這裡:Read-scale availability groups

 

接下來進入主題主要介紹一下高可用性結構的Availability Group的搭建方法。

 

1.      安裝及配置SQL Server

一個SQL AG至少有兩個以上的節點,由於環境有限,這裡只安裝一個最簡單的包含兩個節點的AG。首先是按照SQL Server on Ubuntu——Ubuntu上的SQL Server(全截圖)中的介紹,安裝兩個Ubuntu機器和SQL Server。

Note:同一個AG的多個節點必須都是實體機或者虛擬機,當都是虛擬機的時候也必須都在同一個虛擬化平臺上,原因是由於Linux需要用fencing agent去隔離節點上的資源,不同平臺fencing agent類型是不同的,詳細參考Policies for Guest Clusters

 

2.      創建AG

在Linux上,必須先創建AG才能把它當成一個資源加到Cluster中進行管理。下麵介紹一下如何創建AG。

a)       準備工作:

更新每一個節點伺服器的機器名符合這個要求:15個字元或者更少;網路上是唯一的。如果不符合要求可以使用如下命令更改機器名:

sudo vi /etc/hostname

使用如下命令修改Hosts文件以保證同一個AG中多個節點可以互相通信

sudo vi /etc/hosts

這裡一定註意:修改後可以用ping命令嘗試ping hostname,必須返回對應的真正IP地址才行,也就是Hosts文件中不能包含類似hostname和127.0.0.1的對應記錄,配置後如下,註意其中”127.0.1.1   Ubuntu1604Bob2”這行被我註釋了,否則開啟Cluster 服務的時候可能會有問題:

 

如果不註釋,ping hostname的返回結果是127.0.1.1,註釋後返回的是真正IP:

需要返回真正IP後期配置才好使。

另外可以用這個命令查看當前server的IP:

sudo ip addr show

b)      在所有節點SQL Server上開啟Always On Availability Group功能並重啟服務:

sudo /opt/mssql/bin/mssql-conf set hadr.hadrenabled  1
sudo systemctl restart mssql-server

c)       在所有節點上執行SQL語句開啟AlwaysOn_health事件會話以方便診斷問題:

ALTER EVENT SESSION  AlwaysOn_health ON SERVER WITH (STARTUP_STATE=ON);
GO

更多關於Event Session信息可以參考:AlwaysOn Extended Events

d)      創建db mirroring endpoint使用的用戶:

CREATE LOGIN dbm_login WITH PASSWORD = '**<Your Password>**';
CREATE USER dbm_user FOR LOGIN dbm_login;

e)      創建證書:

Linux上的SQL Server Mirroring Endpoint是用證書去認證通信的。下麵的命令創建一個master key和證書並備份。連接到Primary端SQL Server並執行如下命令:

CREATE MASTER KEY ENCRYPTION BY PASSWORD = '**<Master_Key_Password>**';
CREATE CERTIFICATE dbm_certificate WITH SUBJECT = 'dbm';
BACKUP CERTIFICATE dbm_certificate
   TO FILE = '/var/opt/mssql/data/dbm_certificate.cer'
   WITH PRIVATE KEY (
           FILE = '/var/opt/mssql/data/dbm_certificate.pvk',
           ENCRYPTION BY PASSWORD = '**<Private_Key_Password>**'
       );

f)        把證書的備份複製到所有的非Primary節點上,同時使用它創建證書:

先在Primary節點上執行如下命令複製證書的備份到其它節點上:

cd /var/opt/mssql/data
scp dbm_certificate.* root@**<node2>**:/var/opt/mssql/data/

Note:如果遇到Permission denied,可以使用sz和rz命令通過主機來傳輸文件。

再在目的端Secondary節點上執行如下命令給用戶mssql添加足夠的許可權:

cd /var/opt/mssql/data
chown mssql:mssql dbm_certificate.*

最後在目的端Secondary節點上利用備份的證書創建證書:

CREATE MASTER KEY ENCRYPTION BY PASSWORD = '**<Master_Key_Password>**';
CREATE CERTIFICATE dbm_certificate  
    AUTHORIZATION dbm_user
    FROM FILE = '/var/opt/mssql/data/dbm_certificate.cer'
    WITH PRIVATE KEY (
    FILE = '/var/opt/mssql/data/dbm_certificate.pvk',
    DECRYPTION BY PASSWORD = '**<Private_Key_Password>**'
            );

g)       在所有節點上創建database mirroring endpoint:

CREATE ENDPOINT [Hadr_endpoint]
    AS TCP (LISTENER_IP = (0.0.0.0), LISTENER_PORT = **<5022>**)
    FOR DATA_MIRRORING (
        ROLE = ALL,
        AUTHENTICATION = CERTIFICATE dbm_certificate,
        ENCRYPTION = REQUIRED ALGORITHM AES
        );
ALTER ENDPOINT [Hadr_endpoint] STATE = STARTED;
GRANT CONNECT ON ENDPOINT::[Hadr_endpoint] TO [dbm_login];

Note:這裡Listener IP暫時不能修改,只能是0.0.0.0,目前有BUG,未來可能會修複。

h)      在Primary節點上創建AG:

CREATE AVAILABILITY GROUP [UbuntuAG]
    WITH (DB_FAILOVER = ON, CLUSTER_TYPE = EXTERNAL)
    FOR REPLICA ON
        N'**<node1>**'
        WITH (
            ENDPOINT_URL = N'tcp://**<node1>**:**<5022>**',
            AVAILABILITY_MODE = SYNCHRONOUS_COMMIT,
            FAILOVER_MODE = EXTERNAL,
            SEEDING_MODE = AUTOMATIC
            ),
        N'**<node2>**'
        WITH (
            ENDPOINT_URL = N'tcp://**<node2>**:**<5022>**',
            AVAILABILITY_MODE = SYNCHRONOUS_COMMIT,
            FAILOVER_MODE = EXTERNAL,
            SEEDING_MODE = AUTOMATIC
            );
ALTER AVAILABILITY GROUP [UbuntuAG] GRANT CREATE ANY DATABASE;

Note:執行過程中可能會出現這個警告”Attempt to access non-existent or uninitialized availability group with ID”,暫時忽略即可,未來版本可能會修複。

下圖中UbuntuAG2是新創建的AG,Secondary節點還處於OFFLINE狀態:

i)        把其它Secondary節點加入到AG中:

ALTER AVAILABILITY GROUP [UbuntuAG] JOIN WITH (CLUSTER_TYPE = EXTERNAL);
ALTER AVAILABILITY GROUP [UbuntuAG] GRANT CREATE ANY DATABASE;

下圖為添加完節點後的狀態:

j)        測試:創建一個DB並加入到剛剛創建的AG中:

CREATE DATABASE [db1];
ALTER DATABASE [db1] SET RECOVERY FULL;
BACKUP DATABASE [db1]
   TO DISK = N'var/opt/mssql/data/db1.bak';
ALTER AVAILABILITY GROUP [UbuntuAG] ADD DATABASE [db1];

k)       驗證:在Secondary端查看DB是否已經成功同步過去了:

SELECT * FROM sys.databases WHERE name = 'db1';
GO
SELECT DB_NAME(database_id) AS 'database', synchronization_state_desc FROM sys.dm_hadr_database_replica_states;

這時,一個簡單的AG就創建好了,但是它不能提供高可用性和災難恢復功能,必須配置一個Cluster技術才能好使。如果上述h)和i)步驟的TSQL更換成以下兩個,則創建出來的就是read-scale類型的AG。

  • 創建AG命令:
CREATE AVAILABILITY GROUP [UbuntuAG]
    WITH (CLUSTER_TYPE = NONE)
    FOR REPLICA ON
        N'**<node1>**' WITH (
            ENDPOINT_URL = N'tcp://**<node1>**:**<5022>**',
            AVAILABILITY_MODE = ASYNCHRONOUS_COMMIT,
            FAILOVER_MODE = MANUAL,
            SEEDING_MODE = AUTOMATIC,
                    SECONDARY_ROLE (ALLOW_CONNECTIONS = ALL)
            ),
        N'**<node2>**' WITH (
            ENDPOINT_URL = N'tcp://**<node2>**:**<5022>**',
            AVAILABILITY_MODE = ASYNCHRONOUS_COMMIT,
            FAILOVER_MODE = MANUAL,
            SEEDING_MODE = AUTOMATIC,
            SECONDARY_ROLE (ALLOW_CONNECTIONS = ALL)
            );
ALTER AVAILABILITY GROUP [UbuntuAG] GRANT CREATE ANY DATABASE;

把Secondary節點加到AG中命令:

ALTER AVAILABILITY GROUP [UbuntuAG] JOIN WITH (CLUSTER_TYPE = NONE);
ALTER AVAILABILITY GROUP [UbuntuAG] GRANT CREATE ANY DATABASE;

Note:這時的AG是沒有Listener的,目前版本也暫時無法創建Listener。

 

3.      配置一個集群資源管理器,如Pacemaker

具體步驟如下:

a)       在所有的Cluster節點上安裝和配置Pacemaker:

先設置防火牆允許相關埠通過(包括Pacemaker high-availability service、SQL Server Instance和Availability Group Endpoint),

sudo ufw allow 2224/tcp
sudo ufw allow 3121/tcp
sudo ufw allow 21064/tcp
sudo ufw allow 5405/udp
sudo ufw allow 1433/tcp # Replace with TDS endpoint
sudo ufw allow 5022/tcp # Replace with DATA_MIRRORING endpoint
sudo ufw reload

或者也可以直接禁用防火牆:

sudo ufw disable

在所有節點上安裝Pacemaker軟體包:

sudo apt-get install pacemaker pcs fence-agents resource-agents

設置Pacemaker和Corosync軟體包在安裝時創建的預設用戶的密碼,需保證所有節點上密碼一樣:

sudo passwd hacluster

b)      啟用並開啟pcsd和Pacemaker服務:

sudo systemctl enable pcsd
sudo systemctl start pcsd
sudo systemctl enable pacemaker

執行過程中可能出現這個錯誤”pacemaker Default-Start contains no runlevels, aborting.”,可以暫時忽略。

c)       創建Cluster並啟動:

首先為了防止有Cluster的殘餘配置文件影響後期搭建,可以先執行如下命令刪除已經存在的Cluster:

sudo pcs cluster destroy # On all nodes
sudo systemctl enable pacemaker

然後創建並配置Cluster:

sudo pcs cluster auth **<nodeName1>** **<nodeName2>**  -u hacluster -p **<password for hacluster>**
sudo pcs cluster setup --name **<clusterName>** **<nodeName1>** **<nodeName2…>**
sudo pcs cluster start --all

這時可能會出現這個錯誤”Job for corosync.service failed because the control process exited with error code. See "systemctl status corosync.service" and "journalctl -xe" for details.”診斷解決方法如下:

  • 根據2-a)中的描述查看是否有問題;
  • 使用如下命令查看配置文件中的Log路徑是什麼。
vi /etc/corosync/corosync.conf

  • 查看相關文件是否存在,如不存在,則創建相關文件,假設上圖中logfile路徑為/var/log/cluster/corosync.log同時該文件還不存在,則執行如下命令,
sudo mkdir /var/log/cluster
sudo chmod 777 /var/log/cluster
sudo echo >> /var/log/cluster/corosync.log

d)      配置隔離:STONITH。目前測試環境為了簡單,暫時不配置了,以後會更新。正常來說生產環境需要一個fencing agent去隔離資源,關於支持信息請參考這裡:Support Policies for RHEL High Availability Clusters - Virtualization Platforms

另外我們這裡先執行以下命令禁用隔離:

sudo pcs property set stonith-enabled=false

e)      設置start-failure-is-fatal為false:

pcs property set start-failure-is-fatal=false

預設值是true,當為true的時候,如果Cluster第一次啟動資源失敗,在自動Failover操作後,需要用戶手動清空資源啟動失敗的數量記錄,使用這個命令重置資源配置:

pcs resource cleanup <resourceName>

 

4.      添加AG到Cluster集群中

具體步驟如下:

a)       在所有節點上安裝與Pacemaker集成的SQL Server資源包:

sudo apt-get install mssql-server-ha

b)      在所有節點上創建Pacemaker用的SQL Server登錄用戶:

USE [master]
GO
CREATE LOGIN [pacemakerLogin] with PASSWORD= N'<Your Password>'
ALTER SERVER ROLE [sysadmin] ADD MEMBER [pacemakerLogin]

也可以不給sysadmin許可權,給上如下足夠的許可權即可:

GRANT ALTER, CONTROL, VIEW DEFINITION ON AVAILABILITY GROUP::UbuntuAG TO pacemakerLogin

c)       在所有節點上,保存SQL Server Login的信息:

echo 'pacemakerLogin' >> ~/pacemaker-passwd
echo '<Your Password>' >> ~/pacemaker-passwd
sudo mv ~/pacemaker-passwd /var/opt/mssql/secrets/passwd
sudo chown root:root /var/opt/mssql/secrets/passwd
sudo chmod 400 /var/opt/mssql/secrets/passwd # Only readable by root

d)      在Cluster中Primary節點上創建AG的資源:

sudo pcs resource create ag_cluster ocf:mssql:ag ag_name=UbuntuAG --master meta notify=true

e)      在Cluster中Primary節點上創建虛擬IP資源:

sudo pcs resource create virtualip ocf:heartbeat:IPaddr2 ip=**<10.2.38.204>**

f)        配置Cluster資源的依賴關係和啟動順序:

sudo pcs constraint colocation add virtualip ag_cluster-master INFINITY with-rsc-role=Master
sudo pcs constraint order promote ag_cluster-master then start virtualip

g)       最後查看Cluster狀態如下:

sudo pcs status

可以用虛擬IP(10.2.38.204)訪問這個AG:

 

至此,Ubuntu上的Cluster管理的SQL Server Always On Availability Group就搭建完成了。

 

Note:

  • 當把AG加入到Cluster中作為一個資源的時候,就不能再使用TSQL去failover AG了。SQL Server服務端是不知道Cluster的存在的,整個系統是通過Linux Cluster來控制的,在Ubuntu和RHEL中用pcs命令,在SLES中用crm命令。
  • 全部配置完成後,可以使用虛擬IP去訪問整個AG,這時可以在DNS中手動註冊一個Listener名字指向這個虛擬IP,就可以當成Windows中的AG Listener使用了。
  • SQL Server 2017 CTP 1.4中新引入了一個sequence_number的概念防止數據丟失,詳細參考Understand SQL Server resource agent for pacemaker(https://docs.microsoft.com/en-us/sql/linux/sql-server-linux-availability-group-cluster-ubuntu)。

參考鏈接:

 

本文主要介紹瞭如何配置AG以及如何解決配置過程中遇到的問題,關於AG的管理使用上以後再詳細介紹,如有錯誤或者介紹不夠,敬請見諒。

 

[原創文章,轉載請註明出處,僅供學習研究之用,如有錯誤請留言,如喜歡請推薦,謝謝支持]

[原文:http://www.cnblogs.com/lavender000/p/6906280.html,來自永遠薰薰]


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 一概述 1.什麼是Mybatis? ⑴Mybatis是Apache的一個開源項目,原名為ibatis,移植到google code後改名為Mybatis,目前遷移到了Github。 ⑵Mybatis是一個支持定製化SQL、存儲過程以及高級映射的優秀持久層框架,避免了幾乎所有的JDBC代碼、手動設置參 ...
  • 5. 圖的轉換操作 圖的轉換操作主要有以下的方法: (1) Graph.mapVertices():對圖的頂點進行轉換,返回一張新圖; (2) Graph.mapEdges():對圖的邊進行轉換,返回一張新圖。 代碼: 運行結果: 6. 圖的結構操作 圖的結構操作主要有: (1) Graph.sub ...
  • Itpub上遇到一個求助寫SQL的帖子,感覺很有意思,於是寫出來看看,要求如下: 於是建表插數據,表結構如下: 語句如下: 用到了nvl,case when,not in,over partition,sum,union,left join,with as等寫法,常年寫SQL的應該有更加效率的寫法, ...
  • 首先請確認正確安裝好MySQL. 1- 先配置環境變數path 1.1 打開終端,輸入: cd ~ 會進入~文件夾, 1.2 然後輸入:touch .bash_profile 回車執行後, 1.3 再輸入:open -e .bash_profile 會在TextEdit中打開這個文件(如果以前沒有配 ...
  • 《大數據時代》是國外大數據系統研究的先河之作,本書作者維克托.邁爾.舍恩伯格被譽為“大數據商業應用一人”,擁有在哈佛大學、牛津大學、耶魯大學和新加坡國立大學等多個互聯網研究重鎮任教的經歷,早在2010年就在《經濟學人》上發佈了長達14頁對大數據應用的前瞻性研究。 維克托.爾耶.舍恩伯格在本書中前瞻性 ...
  • 本文出處:http://www.cnblogs.com/wy123/p/6913055.html 執行計劃的緩存與重用 在通過SQL Profile觀察一個SQL語句或者存儲過程是否有可用的緩存執行計劃的時候,通過SP:CacheMiss和SP:CacheHit事件可以說明是否發生了編譯/重編譯和是 ...
  • 關於這三個類在字元串處理中的位置不言而喻,那麼他們到底有什麼優缺點,到底什麼時候該用誰呢?下麵我們從以下幾點說明一下 1.三者在執行速度方面的比較:StringBuilder > StringBuffer > String 2.String <(StringBuffer,StringBuilder) ...
  • oracel服務經常會出現各種監聽問題,很多情況是 listener.ora和tnsnames.ora 的配置有問題 D:\app\Administrator\product\11.2.0\dbhome_1 oracel安裝路徑徑參考自己的 listener.ora配置 tnsnames.ora配置 ...
一周排行
    -Advertisement-
    Play Games
  • 示例項目結構 在 Visual Studio 中創建一個 WinForms 應用程式後,項目結構如下所示: MyWinFormsApp/ │ ├───Properties/ │ └───Settings.settings │ ├───bin/ │ ├───Debug/ │ └───Release/ ...
  • [STAThread] 特性用於需要與 COM 組件交互的應用程式,尤其是依賴單線程模型(如 Windows Forms 應用程式)的組件。在 STA 模式下,線程擁有自己的消息迴圈,這對於處理用戶界面和某些 COM 組件是必要的。 [STAThread] static void Main(stri ...
  • 在WinForm中使用全局異常捕獲處理 在WinForm應用程式中,全局異常捕獲是確保程式穩定性的關鍵。通過在Program類的Main方法中設置全局異常處理,可以有效地捕獲並處理未預見的異常,從而避免程式崩潰。 註冊全局異常事件 [STAThread] static void Main() { / ...
  • 前言 給大家推薦一款開源的 Winform 控制項庫,可以幫助我們開發更加美觀、漂亮的 WinForm 界面。 項目介紹 SunnyUI.NET 是一個基於 .NET Framework 4.0+、.NET 6、.NET 7 和 .NET 8 的 WinForm 開源控制項庫,同時也提供了工具類庫、擴展 ...
  • 說明 該文章是屬於OverallAuth2.0系列文章,每周更新一篇該系列文章(從0到1完成系統開發)。 該系統文章,我會儘量說的非常詳細,做到不管新手、老手都能看懂。 說明:OverallAuth2.0 是一個簡單、易懂、功能強大的許可權+可視化流程管理系統。 有興趣的朋友,請關註我吧(*^▽^*) ...
  • 一、下載安裝 1.下載git 必須先下載並安裝git,再TortoiseGit下載安裝 git安裝參考教程:https://blog.csdn.net/mukes/article/details/115693833 2.TortoiseGit下載與安裝 TortoiseGit,Git客戶端,32/6 ...
  • 前言 在項目開發過程中,理解數據結構和演算法如同掌握蓋房子的秘訣。演算法不僅能幫助我們編寫高效、優質的代碼,還能解決項目中遇到的各種難題。 給大家推薦一個支持C#的開源免費、新手友好的數據結構與演算法入門教程:Hello演算法。 項目介紹 《Hello Algo》是一本開源免費、新手友好的數據結構與演算法入門 ...
  • 1.生成單個Proto.bat內容 @rem Copyright 2016, Google Inc. @rem All rights reserved. @rem @rem Redistribution and use in source and binary forms, with or with ...
  • 一:背景 1. 講故事 前段時間有位朋友找到我,說他的窗體程式在客戶這邊出現了卡死,讓我幫忙看下怎麼回事?dump也生成了,既然有dump了那就上 windbg 分析吧。 二:WinDbg 分析 1. 為什麼會卡死 窗體程式的卡死,入口門檻很低,後續往下分析就不一定了,不管怎麼說先用 !clrsta ...
  • 前言 人工智慧時代,人臉識別技術已成為安全驗證、身份識別和用戶交互的關鍵工具。 給大家推薦一款.NET 開源提供了強大的人臉識別 API,工具不僅易於集成,還具備高效處理能力。 本文將介紹一款如何利用這些API,為我們的項目添加智能識別的亮點。 項目介紹 GitHub 上擁有 1.2k 星標的 C# ...