本期課程將從管理平臺的架構出發,結合平臺的實例管理、實例升級、容災管理和監控告警的功能和操作介紹,全面覆蓋日常運維操作,帶您理解並熟練運用GaussDB運維平臺完成運維工作。 ...
本文分享自華為雲社區《GaussDB輕量化運維管理工具介紹》,作者: Gauss松鼠會小助手。
一、GaussDB 運維管理平臺簡介
開放生態層
- 友好Web界面,多雲皮膚個性化定製
- 豐富的原子API
- 公有雲、合運營、HCSO、邊緣雲IES、HCS、輕量化、統一版本
基礎+智能運維能力
- 豐富的基礎運維能力
- 打造端到端全鏈路的智能自製運維平臺,覆蓋自監控、自診斷、自調優、自恢復和自安全全量功能,一鍵部署,精準實施;
標準化代理層
- 全方位多層安全防護,精細隔離設計
- 精準管理進程資源消耗控制,極少性能損耗
- 標準化南向介面規範各引警插件化接入原子操作
通過授權,登錄到GaussDB運維管理平臺,我們可以看到如下界面:
1、實例總覽界面
2、實例詳情頁面
二、GaussDB 運維管理平臺功能介紹
1、平臺管理功能
作為管控平臺,雲資料庫GaussDB管理平臺具備完善的安全防護策略。主要是通過用戶角色和用戶組劃分,細粒度的控制各個角色的訪問執行許可權,守護運維的安全。
基本功能:
1、管理用戶(user): 支持管理員對普通用戶進行增加、刪除、鎖定、重置密碼、用戶和實例(Instance)、用戶組的綁定等操作
2、管理用戶組(user_group): 可以將用戶加入用戶組中,針對整個用戶組可以設置統一的角色,用戶可以同時加到多個用戶組中
3、角色管理(Role): 可以自定義角色,增加對應的許可權(permission),支持細粒度許可權
4、管理活躍用戶會話: 可以查看當前登錄中的用戶,管理員可以結束會話
5、後臺功能: 提供鑒權、校驗弱密碼等介面,密碼會校驗規則和弱密碼,加密後存入元庫中。
2、實例管理功能
1、實例納管
2、實例解除納管
3、實例啟停
4、實例擴容
5、實例升級管理
6、實例容災管理
7、實例告警管理
8、實例巡檢管理
三、GaussDB管理平臺實例管理基本功能
1、納管實例
- 資料庫實例安裝完成後,狀態為Normal>則可以使用GaussDB管理平臺將實例進行納管。
- 納管前需將實例主機錄入主機管理中進行管理。
- 輸入實例節點任意一個管理IP地址,點擊檢查實例節點,檢查主機是否已經錄入主機管理,主機狀態線上則已經錄入允許導入,主機狀態離線則未錄入,無法執行導入。
- 所有主機都線上後。輸入實例名稱,管理員用戶名,管理員密碼點擊提交按鈕下發納管流程。
1.1 添加主機
1.2 納管實例
2、取消納管實例
- GaussDB 運維管理平臺可以取消納管已經導入並納管的資料庫實例。
- 首先在主頁上找到要取消納管的實例
- 點擊“更多”->“取消納管”
- 頁面彈出對話框進行管理員密碼的輸入
3、實例啟停
GaussDB 運維管理平臺支持對所納管的資料庫實例進行基本的啟停操作,主要包括停止實例啟動實例、重啟實例等。
- 在主頁找到需要管理的實例,點擊“更多”–>“停止實例”來停止實例運行
- 對於已經停止運行的實例,點擊“更多”–>“啟動實例”來啟動實例運行
- 也可以直接點擊“更多”–>“重啟實例”來快速對實例進行重啟
4、實例卸載
GaussDB 運維管理平臺支持對所納管的資料庫實例進行一鍵式卸載。
註:刪除實例屬於高危操作,需要輸入“delete”進行二次確認。
- GaussDB 運維管理平臺可以一鍵式刪除已經導入並納管的資料庫實例。
- 首先在主頁上找到要刪除的實例,然後點擊“更多”->“刪除實例”。
- 頁面彈出對話框進行二次確認。
5、節點擴容
隨著業務的增長,資料庫在運行性能及存儲上逐漸會達到瓶頸。此時,需要通過增加節點來提升實例的性能及存儲能力。GaussDB支持節點擴容操作。擴容方案如下:
線上擴容主要分為加節點和數據重分佈兩個階段,除切換元數據外均支持線上業務。
- 加節點階段:主要完成新的CN/DN節點的安裝、元信息同步、啟動等操作。
- 數據重分佈階段:主要完成基線數據搬遷、增量數據搬遷(線上業務)、切換元數據等操作。
註:同步元信息的目的在於為後續數據重分佈做準備
向新增的DN、CN節點同步元數據:
1、同步基礎元信息:資料庫、模式、表空間
2、同步普通元信息:用戶表、函數
3、建立新的nodegroup(為擴容後的新集群)
4、元信息同步完成後切換installation group為新建nodegroup
GaussDB 運維管理平臺支持對所納管的分散式資料庫實例進行節點擴容。
- “實例管理”界面,單擊具體實例名稱,進入“基本信息”界面。
- 在“資料庫信息”模塊的“節點數量”後,單擊“添加”進入“節點擴容”頁面。
- 選擇節點數量和管理地址,管理地址數量需要與新增節點數量一致,管理地址可用區分佈需要符合部署方案。
- 確認“實例擴容過程中會有鎖表操作,可能會阻塞業務,屬於高危操作。請選擇在業務低峰期進行該操作。” 風險提示信息,並勾選“我已確認閱讀上述風險提示”。
- 單擊“下一步”進入“規格確認”界面。
- 確認無誤後,單擊“提交”,進行擴容。
- 資料庫實例狀態將顯示為“添加節點中”,則說明擴容指令下發成功。
註意事項
- 擴容是指分片擴容,擴容的節點僅包含CN、DN,不含有其他組件。
- 擴容以節點組為單位,擴容節點的組件分佈形態與擴容前實例分佈規律相同。
- 主備版部署模式暫時不支持擴容。
- 存在故障節點的實例不允許擴容。
- 實例擴容過程中會有鎖表操作,可能會阻塞業務,屬於高危操作。請選擇在業務低峰期進行該操作。
- 擴容前,需要滿足所有DN節點剩餘可用空間大於DN節點的最大單表空間。
四、GaussDB管理平臺實例升級功能
1、GaussDB升級方式
升級過程涉及系統表和數據表變更,重啟進程,有版本相容風險和業務中斷問題,根據升級方式,業務中斷時間,風險評估對比如下:
大小版本升級方式比較
2、就地升級
- 找到需要升級的實例點擊更多進行版本升級
- 版本升級選擇就地升級方式
- 選擇對應的目標版本
3、灰度升級
灰度升級分為兩種方式:
1、升級自動提交方式: 所有節點一起升級,在升級過程中有大概10秒的業務中斷
2、升級待觀察後提交方式: 將資料庫升級過程細分為升級待觀察和升級提交兩個階段
- 升級待觀察階段
升級待觀察階段可以按照AZ升級,也可以對升級的AZ進行回滾,所有AZ升級完成後可以對實例進行業務測試
- 升級提交階段
提交當前的升級,提交後不可回滾
3.1 灰度升級-升級自動提交
- 在實例管理主頁找到需要升級的實例點擊“版本升級”。
- 在彈窗中選擇升級自動提交的操作方式和目標版本進行升級。
3.2 灰度升級-升級待觀察階段
- 灰度升級選擇升級待觀察
- 選擇升級可用區中AZ進行升級
- 選擇目標版本進行升級
3.3 灰度升級-升級待提交階段
- 升級完所有可用區的AZ之後,選擇提交升級,對實例進行真正的升級
- 觀察階段發現升級的版本有問題,可以選擇升級回退
五、GaussDB 運維管理平臺實例容災管理
GaussDB 運維管理平臺流式容災管理的主要功能:
- 容災搭建
- 容災狀態查看
- 容災倒換
- 災備升主
- 容災解除
- 容災演練(規劃中)
- 容災快速加回(規劃中)
流式容災:基於流複製的容災解決方案
1、容災搭建
- 主資料庫實例配置災備資料庫實例信息,等待災備資料庫實例連接過來進行全量複製
- 災備資料庫實例完成全量build之後,將與主資料庫實例建立流式複製進行日誌的增量複製
2、容災狀態查看
在容災管理界面,可以查看到已經創建好的容災關係組,並支持對容災實例進行容災倒換、災備升主、容災解除等操作。
如上圖,在容災詳情頁面,可以查看容災基本信息,容災RTO、RPO數值,以及災備狀態指標;災備實例分片日誌差距、災備實例分片日誌落盤速率、災備實例分片待回放日誌量、災備實例分片日誌回放速率。
3、容災倒換
- 可以通過容災倒換,將容災關係中主備實例角色互換,原來的主變為備實例,原來的備變為主實例
- 容災倒換命令不會解除容災關係
4、災備升主
可以通過災備升主,將容災備實例提升為一個包含主DN的實例,使其可以對外提供服務,升主成功後,之前的容災關係將失效。
5、容災解除
- 容災解除,是使得主實例清除維護的對端容災信息。
- 清除後,主實例可以重新建立新的容災關係。
6、容災演練
1.準備兩個正常的實例
2.創建兩個實例的容災關係
3.主實例發生嚴重故障
4.對備實例進行升主,對外提供服務
5.對主實例進行維修,然後執行容災解除
6.重新搭建容災關係
7.進行容災倒換,恢復初始的容災關係
六、GaussDB管理平臺實例監控告警
1、告警統計
實時告警與歷史告警:
- 告警基本信息:告警id,告警名稱,告警類型,告警狀態類型、告警實例
- 告警表現:告警時間、告警級別、告警描述、告警持續時間、告警節點IP、通知狀態
- 告警數據分析:告警可能原因、影響、優化建議
2、告警管理
告警模板管理:預設模板包括預設文本模板以及預設JSON模板
3、監控大盤
列表看板:
通過將實例進行平鋪展示的方式,橫向對比各個實例的基本指標信息,包括CPU使用率、記憶體使用率等。
趨勢看板:
- 展示單個實例的全方位詳細監控指標。
- 指標範圍包括:CPU/記憶體、磁碟/存儲、網路、連接、業務負載鎖、同步狀態、進程資源等。
希望本節課程對大家對GaussDB運維管理平臺的工具有所瞭解,歡迎大家共同學習交流。