greenplum集群某台機器磁碟占用100%處理方式

来源:https://www.cnblogs.com/qiannianyuan/archive/2018/04/10/pg_resetxlog.html
-Advertisement-
Play Games

一、問題描述 使用gpfdist往集群中導入大量數據, 一段時間後連接退出,集群無法連接 二、問題定位 使用如下命令查看: 連接到相應機器,查看磁碟狀況: 說明此時磁碟占用滿了。 三、問題解決 處理這種情況有如下幾種方式: 3.1 擴容磁碟 由於本人是將數據目錄直接放在根目錄下,可以通過添加一塊新磁 ...


一、問題描述

使用gpfdist往集群中導入大量數據, 一段時間後連接退出,集群無法連接

 二、問題定位

使用如下命令查看:

gpstate -s
mdw-1:gpadmin-[INFO]:-   Segment Info
mdw-1:gpadmin-[INFO]:-      Hostname                          = sdw-1
mdw-1:gpadmin-[INFO]:-      Address                           = sdw-1
mdw-1:gpadmin-[INFO]:-      Datadir                           = /home/mirror/gpseg2
mdw-1:gpadmin-[INFO]:-      Port                              = 50000
mdw-1:gpadmin-[INFO]:-   Mirroring Info
mdw-1:gpadmin-[INFO]:-      Current role                      = Mirror
mdw-1:gpadmin-[INFO]:-      Preferred role                    = Mirror
mdw-1:gpadmin-[WARNING]:-   Mirror status                     = Out of Sync                    <<<<<<<<
mdw-1:gpadmin-[INFO]:-   Status
mdw-1:gpadmin-[INFO]:-      PID                               = 10227
mdw-1:gpadmin-[WARNING]:-   Configuration reports status as   = Down                           <<<<<<<<
mdw-1:gpadmin-[WARNING]:-   Segment status                    = Down in configuration          <<<<<<<<

連接到相應機器,查看磁碟狀況:

 

說明此時磁碟占用滿了。

 三、問題解決

處理這種情況有如下幾種方式:

3.1 擴容磁碟

由於本人是將數據目錄直接放在根目錄下,可以通過添加一塊新磁碟的方式直接擴容空間

 

3.2 清理文件

往往,線上的環境不會有足夠的時間進行磁碟的擴容,甚至一些其他因素導致根本你就接觸不到伺服器。那麼這時候只能進行文件的清除。

3.2.1 清理日誌文件

系統長時間運行後,一般占用比較大的會是pg_log文件夾下日誌文件,這裡推薦的做法是日誌文件的磁碟和數據目錄掛載在不同的磁碟路徑下,若在同一路徑下,可將日誌文件備份到其他路徑,騰出一部分空間,讓系統正常啟動。操作如下:

1)使用gpstop停止集群

2)處理日誌文件移動到其他位置,或者認為可以不要的直接刪除

3)gpstart啟動集群,啟動後就可以將一些頻繁變化的表執行 vacuum動作,或者刪除一些無用的表

4)若以上動作做完,並不能釋放出空間,則需要考慮下一種方法

3.2.2 清理pg_xlog文件

 在segment下,會有pg_xlog文件夾,這個文件夾里存儲的是wal日誌信息,記錄事務信息,類似oracle的redo日誌,數據在進入greenplum資料庫前,都是先進入到該日誌文件中,所以該文件非常重要,千萬不能手工操作該目錄下的文件,如果直接手工刪除了該文件,資料庫就無法啟動。所以刪除該文件要謹慎,可以使用該命令:pg_resetxlog 。只有在xlog占用了大量空間的情況下才考慮清理,否則不建議清理。操作步驟:

1)停止greenplum集群

2)使用pg_controldata命令

pg_controldata $segment_directory
......
Latest checkpoint's NextXID:          0/1874
Latest checkpoint's NextOID:          111252
......

這裡$segment_directory是安裝集群是的segment目錄,也就是gpstate -s命令看到的路徑,如果找不到可以搜索pg_control,該文件所在的位置即為需要的目錄位置通過上述命令獲取到標紅的兩處關鍵性信息

3)執行如下命令:

pg_resetxlog -o 111252 -x 1874 -f $segment_directory

註意,以上命令需要資料庫管理員賬戶執行,上述命令完成後,能夠有不少的空間釋放出來。

4)啟動greenplum集群

 四、實踐建議

1、清理xlog日誌是在不得已的情況下才這麼做,待集群正常啟動後,需要謹慎驗證數據的完整性

2、需要有自己的一套監控機制監控磁碟使用率,儘可能的避免磁碟使用100%的情況發生,一旦由於這種情況導致了集群崩潰,甚至丟失數據,可能是災難性的

3、如果是由於誤刪了pg_logs的文件導致集群無法啟動,也可以使用pg_resetxlog命令使集群恢復啟動,但一定要謹慎驗證數據的完整性


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 1、功能上的區別 mv:用戶可以使用該命令為文件或目錄重命名或將文件由一個目錄移入另一個目錄中。 cp: 該命令的功能是將給出的文件或目錄拷貝到另一文件或目錄中。 2、從inode角度來區分 mv:會將存儲於indoe索引節點上的文件元信息也移動到新文件中。 cp : 只會複製文件數據,不會複製in ...
  • 1、安裝Python包管理工具(easy_install) wget --no-check-certificate https://bootstrap.pypa.io/ez_setup.py -O - | sudo python 2、安裝supervisor easy_install supervi ...
  • 本文內容: 完整語法 去重選項 欄位別名 數據源 where group by having order by limit 首發日期:2018-04-11 完整語法: select 去重選項 欄位列表 [as 欄位別名] from 數據源 [where子句] [group by 子句] [havin... ...
  • 1.PL/SQL PL/SQL是Oracle對 ql語言的過程化擴展,指在 SQL 命令語言中增加了過程處理語句,使SQL語言具有過程處理能力。把 SQL 語言的數據操縱能 力與過程語言的數據處理能力結合起來,使得 PLSQL 面向過程但比過程語言簡單、高效、靈活和實用。 基本語法結構: [decl ...
  • 一、索引簡介 再來老生常談一番,什麼是索引呢?資料庫索引與書籍的索引類似。有了索引就不需要翻整本書,資料庫可以直接在索引中查找,在索引中找到條目以後,就可以直接跳轉到目標文檔的位置,這能使查找速度提高幾個數量級。 然而,使用索引是有代價的:對於添加的每一個索引,每次寫操作(插入、更新、刪除)都將耗費 ...
  • yum groupinstall "X Window System" 啟動 vncserver 添加用戶 groupadd oinstall groupadd dba useradd -g oinstall -G dba oracle passwd oracle 修改內核 /etc/sysctl.c ...
  • Welcome to the MySQL monitor. Commands end with ; or \g.Your MySQL connection id is 5Server version: 5.7.12 MySQL Community Server (GPL)Copyright (c) ...
  • HDFS Snapshots HDFS Snapshots. 1 1. 概述... 1 1.1 Snapshottable目錄... 1 1.2 快照路徑... 1 2. 帶快照的更新... 1 3. 快照操作... 1 3.1 管理操作... 1 3.2 用戶操作... 1 1. 概述 HDFS快 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...