linux伺服器系統盤壞且系統盤為軟raid的修複方法

-Advertisement-

1 需要換新盤的情況 1.1 一塊盤grub損壞修複（可通過另一塊盤進入系統的情況）更換硬碟的方式，可以熱插拔，也可以伺服器斷電後更換，但如果是熱插拔，可能會導致盤符變更。壞了一塊硬碟的情況下，軟raid1恢復方法(以sdb為新更換的硬碟為例)： 1.1.1 拷貝正常的那塊硬碟分區信息到新的硬碟 ...

1 需要換新盤的情況

1.1 一塊盤grub損壞修複

一塊盤grub損壞修複（可通過另一塊盤進入系統的情況）。更換硬碟的方式，可以熱插拔，也可以伺服器斷電後更換，但如果是熱插拔，可能會導致盤符變更。壞了一塊硬碟的情況下，軟raid1恢復方法(以sdb為新更換的硬碟為例)：

1.1.1 拷貝硬碟分區信息

拷貝正常的那塊硬碟分區信息到新的硬碟

[root@ ~]#sfdisk -d /dev/sda | sfdisk -f /dev/sdb

1.1.2 查看sdb的分區與sda是否一致

[root@ ~]# fdisk -l /dev/sdb

Disk /dev/sdb: 300.0 GB, 300000000000 bytes

255 heads, 63 sectors/track, 36472 cylinders

Units = cylinders of 16065 * 512 = 8225280 bytes

Sector size (logical/physical): 512 bytes / 512 bytes

I/O size (minimum/optimal): 512 bytes / 512 bytes

Disk identifier: 0x00000000

Device Boot Start End Blocks Id System

/dev/sdb1 1 523 4194304 82 Linux swap / Solaris

Partition 1 does not end on cylinder boundary.

/dev/sdb2 * 523 36473 288773120 fd Linux raid autodetect

[root@ ~]# fdisk -l /dev/sda

Disk /dev/sda: 300.0 GB, 300000000000 bytes

255 heads, 63 sectors/track, 36472 cylinders

Units = cylinders of 16065 * 512 = 8225280 bytes

Sector size (logical/physical): 512 bytes / 512 bytes

I/O size (minimum/optimal): 512 bytes / 512 bytes

Disk identifier: 0x000dafc6

Device Boot Start End Blocks Id System

/dev/sda1 1 523 4194304 82 Linux swap / Solaris

Partition 1 does not end on cylinder boundary.

/dev/sda2 * 523 36473 288773120 fd Linux raid autodetect

1.1.3 讓內核重載分區表

（若可以重啟伺服器不需執行此部）

[root@ ~]# partprobe /dev/sdb

1.1.4 把第二塊盤加入raid1中

[root@ ~]# mdadm /dev/md0 -a /dev/sdb2

等數據同步到SDB 完成之後執行

1.1.5 複製操作系統的引導程式

（複製操作系統的前512位元組的引導程式到新的硬碟，最關鍵一步，否則開機無法正常引導，現場軟raid同步後沒法啟動就是這個原因）

[root@ ~]# dd if=/dev/sda of=/dev/sdb bs=512 count=1

ps：硬碟上第0磁軌第一個扇區被稱為MBR，也就是Master Boot Record，即主引導記錄，它的大小是512位元組，裡面卻存放了預啟動信息、分區表信息。
系統找到BIOS所指定的硬碟的MBR後，就會將其複製到0×7c00地址所在的物理記憶體中。被覆制到物理記憶體的內容就是Boot Loader，即grub。

1.1.6 添加新盤swap

[root@ ~]# mkswap /dev/sdb1

[root@ ~]# swapon /dev/sdb1

上面命令只在未重啟時生效

1.1.7 修改fstab

修改fstab中已經被換掉的硬碟的UUID為新swap的UUID，保證swap重啟伺服器可以生效

[root@ ~]# cat /etc/fstab

UUID可通過blkid查看

1.2 兩塊盤grub均損壞（無法進入系統）

有一些之前已經換過系統盤，沒有按照上面的操作，然後另一塊也壞了，此時兩塊硬碟都沒法進入系統，採用如下方法：

掛載光碟，進應急模式修複

Bash-4.1# chroot /mnt/sysimage

Sh-4.1# grub

Grub > root (hd0,1)

Grub> setup (hd0)

Grub> quit

Sh-4.1# exit

Bash-4.1# reboot

成功

2 不需要換盤的情況

現場存在硬碟沒問題，但是掉raid的情況（大部分是這種情況）

檢測方法

2.1 檢查硬碟的是否正常

2.1.1 smartctl -a /dev/sdb

註意上面得輸出，標註位置沒有錯誤，表示硬碟沒問題

2.1.2 smartctl -H /dev/sdb

一般用這個查就可以了，health為ok即表示硬碟沒問題

2.1.3 badblocks -sv /dev/sdb

全盤掃，很慢，不建議

2.2若硬碟沒問題，重新同步即可

2.2.1 檢查raid狀態

[root@ ~]# mdadm -D /dev/md0

/dev/md0:

Version : 1.0

Creation Time : Tue Apr 29 15:19:50 2014

Raid Level : raid1

Array Size : 288772984 (275.40 GiB 295.70 GB)

Used Dev Size : 288772984 (275.40 GiB 295.70 GB)

Raid Devices : 2

Total Devices : 2

Persistence : Superblock is persistent

Intent Bitmap : Internal

Update Time : Mon Jul 4 15:05:56 2016

State : active, degraded

Active Devices : 1

Working Devices : 1

Failed Devices : 1

Spare Devices : 0

Name : example.sz.fonsview.com:0

UUID : 8c78cdee:b6be167c:85cce8f9:9e2fe8e8

Events : 26915749

Number Major Minor RaidDevice State

0 0 0 0 removed

1 8 18 1 active sync /dev/sdb2

0 8 2 - faulty spare /dev/sda2

若紅色字體部分為faulty，執行：

[root@ ~]# mdadm /dev/md0 -r /dev/sdb

[root@ ~]# mdadm /dev/md0 -a /dev/sda2

若紅色字體部分為remove，執行：

[root@ ~]# mdadm /dev/md0 -a /dev/sda2

2.2.1 查看同步狀態

[root@ ~]# cat /proc/mdstat

您的分享是我們最大的動力!

-Advertisement-

更多相關文章

AsnycLocal與ThreadLocal

AsnycLocal與ThreadLocal AsnyncLocal與ThreadLocal都是存儲線程上下文的變數，但是，在實際使用過程中兩者又有區別主要的表現在： AsyncLocal變數可以在父子線程中傳遞，創建子線程時父線程會將自己的AsyncLocal類型的上下文變數賦值到子線程中，但是， ...
C#/.Net判斷是否為周末/節假日

判斷節假日請求的Api：http://tool.bitefu.net/jiari/ /// <summary> /// 判斷是不是周末/節假日 /// </summary> /// <param name="date">日期</param> /// <returns>周末和節假日返回true，工作日 ...
grep sed awk 3個Linux中對文件內容操作的命令

在學習Linux命令中，發現3個有關於文件內容操作的命令grep，sed和awk，在這裡簡單彙總這3個命令主要作用，在實際中找到最合適的情景應用，詳細用法可以參考其他文章。 1、grep命令主要作用：用於搜索文件中特定字元串，並輸出整行內行命令格式：grep [選項參數] "搜索內容" 文件(選 ...
Mac安裝HomeBrew

Homebrew是mac上的軟體包管理工具，類似一些發行版Linux上的yum、apt get等。安裝Homebrew 1、安裝Xcode，到appstore搜索。 2、打開終端，執行以下命令：軟體安裝目錄軟體都會安裝到基本選項安裝完成後，執行，就有提示 ...
【原創】訪問Linux進程文件表導致系統異常複位的排查記錄

前提知識： Linux內核、Linux 進程和文件數據結構、vmcore解析、彙編語言問題背景：這個問題出自項目的一個安全模塊，主要功能是確定某進程是否有許可權訪問其正在訪問的文件。實現功能時，需要在內核里通過掃描該進程打開的文件表，獲取文件的路徑，和安全模塊里配置的可訪問文件的進程白名單進行匹 ...
LVS詳解

一、LVS介紹簡介 LVS是Linux Virtual Server的簡稱，即Linux虛擬伺服器，創始人前阿裡雲首席科學家章文嵩(現已經在滴滴)，官方網站：www.linuxvirtualserver.org。從內核版本2.4開始，已經完全內置了LVS的各個功能模塊，無需給內核打任何補丁，可以直 ...
飛控入門之C語言指針回顧

指針何為指針？來個官方定義：指針是一個值為記憶體地址的變數（或數據對象）。一、指針的聲明註意，指針的值雖然是地址，指針本身也是有自己的地址和大小的。在電腦中，指針的大小為8位元組，在stm32中，為4位元組。二、指針的賦值與解引用賦值要符合指針的定義，要向指針賦一個地址三、指針的操作取址操 ...
如何用RSS訂閱？

本文由雲+社區發表摘要：我們常常會有訂閱別人文章的需求，有更新的時候希望能有提醒的功能，RSS就是這樣一個訂閱的方式。很多網站上看到RSS的入口，點進去以後總是顯示一堆的XML代碼，我們來看看怎麼使用這個功能。在本次的學習過後你將學會使用RSS來訂閱別人的網站，而且你還能學會給不能用RSS網站的創 ...