Wojciech Błaszkowski

Motto: trust, but check

Archive for April, 2008

reaktywacja mdadm

Po aktualizacji kernela dla PLD Ac do kernel-grsecurity-2.6.16.60-10.i686 przyszedł mail z informacją od mdadm - wyleciał jeden z dysków. Co zrobić ?

# cat /proc/mdstat
Personalities : [raid1]
md0 : active raid1 hdb1[0] hda1[1]
96256 blocks [2/2] [UU]
md1 : active raid1 hda3[1]
38523776 blocks [2/1] [_U]
unused devices:<none>

Reakcja:
# mdadm /dev/md1 -a /dev/hdb3
mdadm: re-added /dev/hdb3
# cat /proc/mdstat
Personalities : [raid1]
md0 : active raid1 hdb1[0] hda1[1]
96256 blocks [2/2] [UU]md1 : active raid1 hdb3[2] hda3[1]
38523776 blocks [2/1] [_U]
[>....................] recovery = 0.0% (3328/38523776) finish=377.6min speed=1664K/sec
unused devices:<none>

Rebuild raida nie zajął więcej niż 120 minut.

Szukamy winnego:
w /var/log/kernel znajduję:

Apr 27 09:13:17 exploder kernel: hda: hda1 hda2 hda3
Apr 27 09:13:17 exploder kernel: hdb: max request size: 512KiB
Apr 27 09:13:17 exploder kernel: hdb: 78242976 sectors (40060 MB) w/2048KiB Cache, CHS=16383/255/63, UDMA(100)
Apr 27 09:13:17 exploder kernel: hdb: cache flushes supported
Apr 27 09:13:17 exploder kernel: hdb: hdb1 hdb2 hdb3
Apr 27 09:13:17 exploder kernel: SGI XFS with ACLs, security attributes, large block numbers, no debug enabled
Apr 27 09:13:17 exploder kernel: SGI XFS Quota Management subsystem
Apr 27 09:13:17 exploder kernel: md: md1 stopped.
Apr 27 09:13:17 exploder kernel: md: bind
Apr 27 09:13:17 exploder kernel: md: bind
Apr 27 09:13:17 exploder kernel: md: kicking non-fresh hdb3 from array!
Apr 27 09:13:17 exploder kernel: md: unbind
Apr 27 09:13:17 exploder kernel: md: export_rdev(hdb3)
Apr 27 09:13:17 exploder kernel: raid1: raid set md1 active with 1 out of 2 mirrors

co sugeruje, że raid nie poskładał się przy starcie systemu i problem istniał już przed podmianą kernela. Sugestia: pamiętaj o wpisaniu poprawnego adresu e-mail MDADM_EMAIL w /etc/sysconfig/mdadm.