Hace un par de días encontré una mención a unos SSD que fallaban a los 3 años, 270 días y 8 horas de uso. Eran de una serie de modelos que HP vendía dentro de su gama de soluciones profesionales. Así que solían ser utilizados en servidores o incluso en RAID, con lo que habitualmente estaban encendidos 24/7, por lo que esos algo menos de cuatro años tampoco eran tanto tiempo. El asunto viene de que el firmware –el software incrustado que llevan dentro– almacena el tiempo de funcionamiento, medido en horas, en una variable que, por como está definida por el estándar SMART, puede llegar a alcanzar un valor máximo de 65. 535. Eso, sin meternos en afinar con posibles años bisiestos, son 6 años, 175 días y 16 horas de uso. Cuando la unidad alcanza una hora más de uso que esas 65. 535 la variable se debería poner a cero, igual que el cuentakilómetros de un coche cuando da la vuelta. Pero en esas unidades HP un fallo de programación hacía que al alcanzar la mitad de ese valor máximo el firmware se volviera loco. Pero muy loco, de tal forma que no sólo la unidad dejaba de funcionar sino que la información contenida resultaba corrompida. Es cierto que HP detectó el problema –no sé si antes de que empezaran a fallar unidades– y ofreció una actualización de firmware que solucionaba el problema. ¡Pero vaya susto! Y sospecho que también vaya disgusto en algún caso que otro. Leer acerca de este fallo me ha hecho pensar en la regla del 3-2-1 de las copias de seguridad que llevo mucho tiempo aplicando: hay que mantener al menos tres copias de en al menos dos soportes distintos y al menos una de ellas en un lugar remoto. Y también hay que comprobar que, llegado el caso, puedes recuperar tus datos de esas copias. En mi caso lo tengo organizado así:- Copia 1: un RAID Drobo. Tiene más de 10 años y el fabricante ha cerrado, así que debería irme planteando sustituirlo. Además, lo tengo ya a tope de capacidad y su firmware no soporta discos más grandes que los que tiene, con lo que no puedo cambiarlos por otros para que quepan más datos en él.
- Copia 2: cada noche el RAID se sincroniza con un disco duro externo WD Black mediante un proceso automático de Carbon Copy Cloner. Aquí lo importante es que las dos copias están en distintos soportes por si alguno de ellos viniera con un bug en el firmware o lo que sea.
- Copia 3 (y remota): varios discos duros portátiles de 1 o 2 TB de distintas marcas y modelo que he ido comprando según he ido necesitando y que guardo en mi despacho en el trabajo. Uso un disco «mensajero» para ir llevando los datos más recientes de casa al despacho o para actualizar lo que haga falta. Además, tengo dos discos externos, uno en casa y otro en el despacho, que se conectan a mi portátil en cuanto lo pongo en mi mesa, en los que macOS mantiene copias de seguridad con TimeMachine. Como digo por ahí arriba, tenía claro lo de los dos soportes distintos por si alguno viniera con un fallo de software o de hardware. Pero hasta leer sobre el fiasco de los SSD de HP no había caído en la cuenta de que, para estar completamente protegido, también se aplica a los discos con los que montas un RAID. A estas alturas el mío tiene cuatro discos distintos de distintos fabricantes porque los he ido cambiando con el tiempo para irle añadiendo capacidad, así que estoy cubierto en lo de los soportes distintos en él. Pero al principio lo monté con discos iguales. Que bien podían haber tenido un problema de firmware que los hiciera fallar a la vez, con lo cual ni RAID ni gaitas. ¿Ya has hecho copia de seguridad hoy?
El curioso caso de los SSD que fallaban a los 3 años, 270 días y 8 horas de uso

Iruzkinak
Hasi saioa iruzkin bat argitaratu ahal izateko.