Cambio disco defectuoso Imprimir

  • 28

IMPORTANTE

No ejecutar si no se disponen de los conocimientos apropiados, una acción erronea puede provocar la perdida de datos TOTAL en su servidor.

Si no dispone de conocimientos le recomendamos contactar con nuestro equipo de soporte para programar una intervención de sistemas.

Tenga siempre un backup externo antes de continuar.

Más información en  https://raid.wiki.kernel.org/index.php/A_guide_to_mdadm

Accedemos por ssh y ejecutamos

cat /proc/mdstat

 
Personalities : [raid1]
md3 : active raid1 sda4[0]
      1822442815 blocks super 1.2 [2/1] [U_]

md2 : active raid1 sda3[0]
      1073740664 blocks super 1.2 [2/1] [U_]

md1 : active raid1 sda2[0]
      524276 blocks super 1.2 [2/1] [U_]

md0 : active raid1 sda1[0]
      33553336 blocks super 1.2 [2/1] [U_]

unused devices: <none>

El raid esta degradado

/ dev/sdb es la unidad defectuosa en este caso.

Una unidad faltante o defectuosa se muestra con [U_] y / o [_U]. Si el array RAID está intacta, muestra [UU].

Los cambios en el software RAID se pueden realizar mientras el sistema está en funcionamiento. Si proc / mdstat muestra que la unidad está fallando, como en el ejemplo aquí, entonces se puede programar una cita con los técnicos de soporte para reemplazar la unidad.

Instalamos la herramienta  smartmontools para comprobar tambien los discos

Ejecutando yum install smartmontools

para ver los seriales y todos los datos del disco, ejecutamos

smartctl -a /dev/sda  ( DISCO A )

smartctl -a /dev/sdb  ( DISCO B )

El resultado mas importante es test result: PASSED  ( aprobado )

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

Pero en este caso al estar degradado el resultado sera

“SMART overall-health self-assessment test result: FAILED”

Antes de que se pueda agregar una nueva unidad, la unidad vieja defectuosa debe retirarse de la matriz RAID. Esto debe hacerse para cada partición individual.

# mdadm /dev/md0 -r /dev/sdb1
# mdadm /dev/md1 -r /dev/sdb2
# mdadm /dev/md2 -r /dev/sdb3
# mdadm /dev/md3 -r /dev/sdb4

 

El siguiente comando muestra las unidades que forman parte del array
 
mdadm --detail /dev/md0

Para poder cambiar la unidad defectuosa, es necesario concertar una cita con el soporte con antelación. Será necesario desconectar el servidor durante un breve período de tiempo.
 
 
Preparando la nueva unidad

Ambas unidades del array deben tener exactamente la misma partición. Dependiendo del tipo de tabla de particiones usado (MBR o GPT), se deben usar las utilidades apropiadas para copiar la tabla de particiones. La tabla de particiones GPT se usa generalmente en unidades más grandes que 2TiB (por ejemplo, HDD de 3TB en EX4 y EX6)
 
Copia de seguridad del MBR / GPT

Antes de copiar el MBR / GPT a una nueva unidad, debe realizar una copia de seguridad. De esa manera, si algo sale mal durante la copia, el original aún se puede restaurar.

Copia de seguridad con MBR
 
sfdisk --dump /dev/sda > sda_parttable_mbr.bak
sfdisk --dump /dev/sdb > sdb_parttable_mbr.bak
sfdisk --dump /dev/sdX > sdX_parttable_mbr.bak
 
Restaurar con MBR
 
sfdisk /dev/sda < sda_parttable_mbr.bak
sfdisk /dev/sdb < sdb_parttable_mbr.bak
sfdisk /dev/sdX < sdX_parttable_mbr.bak
Copia de seguridad con GPT

sgdisk --backup=sda_parttable_gpt.bak /dev/sda
sgdisk --backup=sdb_parttable_gpt.bak /dev/sdb
sgdisk --backup=sdX_parttable_gpt.bak /dev/sdX

Restaurar con GPT

sgdisk --load-backup=sda_parttable_gpt.bak /dev/sda
sgdisk --load-backup=sdb_parttable_gpt.bak /dev/sdb
sgdisk --load-backup=sdX_parttable_gpt.bak /dev/sdX
 
Las particiones también se pueden crear manualmente usando fdisk, cfdisk u otras herramientas.
 
Una vez que se ha quitado la unidad defectuosa y se ha instalado la nueva, debe integrarse en el  array RAID.
Esto debe hacerse para cada partición.
 
# mdadm /dev/md0 -a /dev/sdb1
# mdadm /dev/md1 -a /dev/sdb2
# mdadm /dev/md2 -a /dev/sdb3
# mdadm /dev/md3 -a /dev/sdb4
 
Dependiendo del tamaño de las particiones, este procedimiento puede llevar algún tiempo.
El estado de la sincronización se puede observar utilizando de nuevo
 
cat /proc/mdstat

Personalities : [raid1]
md3 : active raid1 sdb4[1] sda4[0]
      1028096 blocks [2/2] [UU]
      [==========>..........]  resync =  50.0% (514048/1028096) finish=97.3min speed=65787K/sec

md2 : active raid1 sdb3[1] sda3[0]
      208768 blocks [2/2] [UU]

md1 : active raid1 sdb2[1] sda2[0]
      2104448 blocks [2/2] [UU]

md0 : active raid1 sdb1[1] sda1[0]
      208768 blocks [2/2] [UU]

unused devices: <none>
 
 
Dado que el número de serie del disco cambió, necesitamos generar un nuevo mapa de dispositivo con GRUB2:
 
Si está haciendo esta reparación en un sistema iniciado, entonces para GRUB2 ejecutar grub-install en la nueva unidad es suficiente. Por ejemplo:
 
grub-install /dev/sdb
 
 
 

¿Te fue útil la respuesta?

« atrás