7 Mei 2013

MDADM - tukar hard disk rosak dengan HOT SWAP di atas linux slackware 14



Assalamualaikum WBT

 Puji-pujian yang terlayak hanyal untuk Allah Yang Maha Esa. Dialah yang Maha Menciptakan alam ini dan selayaknya untuk deberi segala Pujian. Dialah yang merajai Hari Pembalasan, Yang Maha Mengetahui dan Maha Melihat.

Dengan nama Allah yang Maha Pemurah dan Pengasihani. Dengan nama-nama Allah yang Agung dan Dia Agungkan..


*UPDATE
- aku dah cuba beberapa kali untuk tukar HD secara terus semasa server masih lagi  hidup dan sistem masih lagi jalan.

langkah secara ringkas
1. guna

mdadm --manage /dev/mdX --fail /dev/sdaX

2. guna
mdadm --manage /dev/mdX --remove /dev/sdaX

3. guna

hdparm -Y /dev/sda ( @ hdparm -y /dev/sda ?)

4. pastikan status HD dengan

fdisk -l. 

5. Cabut HD tanpa matikan server

6. Biarkan seketika / tengok /var/log/message

7. pasang semula HD

8. biarkan seketika / tengok status dengan

fdisk -l

9. tambah semula HD kedalam tindanan RAID sedia ada

mdadm --manage /dev/mdX --add /dev/sdaX


10. pastikan status RAID

cat /proc/mdstat



Cubaan pertama : GAGAL
- sebabnya raid sedang dalam keadaan kemaskini data. Oleh kerana bahagian HD yang ketiga adalah sangat besar ( kurang lebih dalam 900G), maka prosesnya memakan masa agak lama.
- masa aku buat cubaan pertama, HD masih dalam kemaskini.

Cubaan Kedua: BERJAYA
- sebabnya : HD telah dikemaskini.
- ikut step yang betul; mdadm --fail, mdadm --remove, hdparm -Y /dev/sdX

Cubaan Ketiga : Gagal
- sebabnya: tidak dapat dipastikan. Mungkin salah pada hdparm -Y. Mungkin sepatutnya guna hdparm -y .. ( -Y : sleep mode, -y: standby mode)

Cubaan keempat: Berjaya
- sebabnya: Step dah betul.. mula-mula guna hdparm -Y dan kemudian hdparm -y. Tapi dah pastikan dengan hdparm -C ( untuk tengok status HD)




Apa nak buat jika salah satu HD kita dalam tindanan RAID kita rosak dan perlu diganti baru?


Persoalan yang seringkali berlegar dalam kepala dan agak merunsingkan hati. Namun, Alhamdulillah hari ini diberi peluang olehNya untuk meneroka satu lagi ilmu dalam bidang IT dan Ins Sya Allah saya akan nukilkan di sini.


Situasi untuk tutorial ini

1. Server adalah Dell High performance yang sokong HD hot swap ( tukar HD secara terus tanpa perlu off kan server )

2. Tindanan RAID adalah seperti berikut

/dev/md0 = raid 1 (mirror)
bilangan HD = 6
devices = /dev/sda1 /dev/sdb1 /dev/sdc1 /dev/sdd1 /dev/sde1 /dev/sdf1
mount : swap partition


/dev/md1 = raid 1 (mirror)
 bilangan HD = 6
devices = /dev/sda2 /dev/sdb2 /dev/sdc2 /dev/sdd2 /dev/sde2 /dev/sdf2
 mount : / (root)

/dev/md1 = raid 5 (stripe)
 bilangan HD = 6
devices = /dev/sda3 /dev/sdb3 /dev/sdc3 /dev/sdd3 /dev/sde3 /dev/sdf3
 mount : /var (sistem, data, web, mysql, dll...)



Kes : katakan /dev/sda rosak dalam /dev/md2 iaitu apabila dilarikan arahan

cat /proc/mdstat

maka statusnya keluar : 

 md2 : active raid5 sdf3[6] sde3[4] sdd3[3] sdc3[2] sda3[0] sdb3[1]
      4112330240 blocks level 5, 512k chunk, algorithm 2 [6/5] [UUUUU_]
      [====>................]  recovery = 22.4% (184683648/822466048) finish=578.1min speed=18384K/sec

maka adapun status ini menunjukkan salah satu HD tidak aktif dan mungkin rosak..

jadi, tutorial ini akan menunjukkan secara terperingkat cara-cara untuk menggantikan HD ini ( /dev/sda) dengan yang baru

3. HD lama dan HD baru adalah SAMA saiz, brand dan model.


TUTORIAL TUKAR HD DARI TINDADAN RAID MDADM


1. matikan bahagian HD dalam bahagian raid menggunakan araham mdadm

mdadm --manage /dev/md0 --fail /dev/sda1
mdadm --manage /dev/md1 --fail /dev/sda2
mdadm --manage /dev/md2 --fail /dev/sda3

2. Buangkan drive tersebut daripada senarai raid

 

mdadm --manage /dev/md0 --remove /dev/sda1
mdadm --manage /dev/md1 --remove /dev/sda2
mdadm --manage /dev/md2 --remove /dev/sda3

3. Setkan HD yang rosak itu sebagai tidak aktif 

hdparm -Y /dev/sda

4. Buka dan tukarkan HD dengan yang baru

4.1 Sebelum cabut HD daripada pelabuh, gunakan arahan di bawah ini untuk menyalakan lampu LED mengikut nama HD. Larikan arahan di bawah dan lampu led untuk HDD /dev/sda akan menyala.

dd if=/dev/sda of=/dev/null

tekan ctrl+c untuk hentikan arahan di atas

bolehlah cabut HDD itu dan gantikan yang baru.


5. Apabila HD telah dipasang semula, Slackware akan kenalpasti HD tersebut secara automatik.

6. pastikan HD telah dikenalpasti dengan fdisk -l fdisk -l

7. Bina bahagian HD dengan sfdisk sfdisk -d /dev/sdb | sfdisk /dev/sda

8. Tambah semula kedalam raid

mdadm --manage /dev/md0 --add /dev/sda1
mdadm --manage /dev/md1 --add /dev/sda2
mdadm --manage /dev/md2 --add /dev/sda3


* Perhatian ! 1. pastikan HD yang anda setkan tidak aktif adalah HD yang anda cabut dari server 2. Pastikan RAID anda bukan RAID 5 JIKA anda ingin tukarkan lebih daripada satu HD. Jika RAID 5, pastikan HD telah selesai kemaskini data 3. Sentiasa pastikan aktiviti RAID anda dengan melihat pada /proc/mdstat


Jika seluruh Tindanan RAID anda rosak!

contohnya untuk RAID 5, jika terdapat lebih daripada satu HD rosak pada satu-satu masa, dan, anggap anda telah ada backup di tempat (sever) lain, maka anda perlu bina semula sekeluruhan tindanan RAID.


1. Pastikan status tindanan RAID anda

cat /proc/mdstat

2. buang tindanan yang rosak.

mdadm --remove /dev/mdX

 3. Bina semula tindanan RAID anda

mdadm --create /dev/mdX --level 5 --raid-devices 6 /dev/sd[a-f]3 --metadata 0

*jika sistem berikan peringatan seperti "devices already in a raid array. continue?"

tekan y ( yes )

4. tengok status semula

cat /proc/mdstat


InsyaAllah raid anda akan terbina semula dan anda bolehlah buat salinan daripada data backup ke server sekarang.



 


Tiada ulasan:

Catat Ulasan

Demo sero guano?