Для тестирования массива /dev/md0 мы будем помечать один диск как сбойный и извлекать его из массива, а потом - подключать его обратно!
Пометим диск /dev/sdf1 как сбойный и посмотрим что получилось:
root@backup:~# mdadm /dev/md0 -f /dev/sdf1 mdadm: set /dev/sdf1 faulty in /dev/md0 root@backup:~# cat /proc/mdstat Personalities : [raid6] [raid5] [raid4] md0 : active raid6 sdh1[0] sdf1[6](F) sde1[5] sdd1[4] sdc1[3] sdb1[2] sda1[1] 14651317760 blocks super 1.2 level 6, 512k chunk, algorithm 2 [7/6] [UUUUUU_] unused devices: <none>
Теперь у нас появился сбойный диск.
Удалим его из массива, сделаем вид, что сбегали в магазин, купили новый винт, разбили по всем правилам и установили на законное место в 8-й слот.
root@backup:~# mdadm /dev/md0 -r /dev/sdf1 mdadm: hot removed /dev/sdf1 from /dev/md0 root@backup:~# mdadm /dev/md0 -a /dev/sdf1 mdadm: re-added /dev/sdf1 root@backup:~# cat /proc/mdstat Personalities : [raid6] [raid5] [raid4] md0 : active raid6 sdf1[6] sdh1[0] sde1[5] sdd1[4] sdc1[3] sdb1[2] sda1[1] 14651317760 blocks super 1.2 level 6, 512k chunk, algorithm 2 [7/6] [UUUUUU_] [>....................] recovery = 0.0% (301708/2930263552) finish=647.4min speed=75427K/sec unused devices: <none>
Ура, массив пересобирается!
Проверку целостности программного массива можно запустить так:
echo 'check' >/sys/block/md0/md/sync_action
Ошибки, возникшие в процессе проверки программного RAID-массива (check или repair), можно поглядеть так:
cat /sys/block/md0/md/mismatch_cnt
Скорость восстановления (recovery) можно изменить так:
echo 100000 > /sys/block/md0/md/sync_speed_min
Если диск был отключен физически, то при любых попытках что-то сделать (например пометить диск как сбойный) будет ошибка:
mdadm: cannot find /dev/sda1: No such file or directory
Для предотвращения этого надо выполнить detach:
mdadm /dev/md1 -r detached
Если mdadm /dev/md1 -r detached выполняется, но заканчивается ничем, то нужно убедить mdadm в том. что диска больше нет. для этого вполняем принудительный resync:
echo check > /sys/block/mdX/md/sync_action
В результате мертвые диски пометятся как Failed.
Discussion