Respaldos ("Backups and Redundancy")
Clasificación de Respaldos
- Copias de Información, comúnmente llamados (Backups).
- Duplicados de Información en linea (Implementación RAID)
Copias de Información (Backups)
Estos respaldos son sólo duplicados de archivos que se guardan en "Tape Drives" de alta capacidad (30-40 GB aprox). Los archivos que son respaldados pueden variar desde archivos del sistema operativo, bases de datos , hasta archivos de un usuario común. Existen varios tipos de Software que automatizan la ejecución de estos respaldos, pero el funcionamiento básico de estos paquetes depende del denominado archive bit .
Este archive bit indica un punto de respaldo y puede existir por archivo o al nivel de "Bloque de Información" (típicamente 4096 bytes), esto dependerá tanto del software que sea utilizado para los respaldos así como el archivo que sea respaldado.
Este mismo archive bit es activado en los archivos (o bloques) cada vez
que estos sean modificados y es mediante este bit que se llevan acabo los tres tipos de respaldos comúnmente utilizados :
- Respaldo Completo ("Full"): Guarda todos los archivos que sean especificados al tiempo de ejecutarse el respaldo. El archive bit es eliminado de todos los archivos (o bloques), indicando que todos los archivos ya han sido respaldados.
- Respaldo de Incremento ("Incremental"): Cuando se lleva acabo un Respaldo de Incremento, sólo aquellos archivos que tengan el archive bit serán respaldados; estos archivos (o bloques) son los que han sido modificados después de un Respaldo Completo. Además cada Respaldo de Incremento que se lleve acabo también eliminará el archive bit de estos archivos (o bloques) respaldados.
- Respaldo Diferencial ("Differential"): Este respaldo es muy similar
al "Respaldo de Incremento" , la diferencia estriba en que el archive bit permanece intacto.
Respaldo |
Archivos en Respaldo |
Archive Bit |
Ventajas |
Desventajas |
Completo ("Full") |
Todos |
Eliminado en todos los archivos |
Con este respaldo únicamente es posible recuperar toda la información | Tiempo de Ejecución |
De Incremento ("Incremental") |
Archivos con archive bit activo.(Aquellos que hayan cambiado desde el último Respaldo Completo) |
Eliminado en los archivos que se respaldan |
Velocidad |
Requiere del último Respaldo Completo y de todos los Respaldos de Incremento que le siguieron para recuperar el Sistema |
Diferencial ("Differential") |
Archivos con archive bit activo.(Aquellos que hayan cambiado desde el último Respaldo Completo) |
Intacto |
Sólo requiere del último Respaldo Completo y del último respaldo Diferencial |
Ocupa mayor espacio en discos comparado con Respaldos de Incremento |
Secuencia de Respaldo GFS (Grandfather-Father-Son)
Esta secuencia de respaldo es una de las más utilizadas y consiste en Respaldos Completos cada semana y Respaldos de Incremento o Diferenciales cada día de la semana. Suponiendo la siguiente semana:
Domingo (1) |
Lunes (2) |
Martes (3) |
Miércoles (4) |
Jueves (5) |
Viernes (6) |
Sábado (7) |
Diferencial/ de Incremento
o NADA |
Diferencial/ de Incremento |
Diferencial/ de Incremento |
Diferencial/ de Incremento |
Diferencial/ de Incremento |
Completo |
Diferencial/ de Incremento
o NADA |
Domingo (8) |
Lunes (9) |
Martes (10) |
Miércoles (11) |
Jueves (12) |
Viernes (13) |
Sábado (14) |
Diferencial/ de Incremento
o NADA |
Diferencial/ de Incremento |
Diferencial/ de Incremento |
Diferencial/ de Incremento |
Diferencial/ de Incremento |
Completo |
Diferencial/ de Incremento
o NADA |
En caso de fallar el Sistema en Jueves(12):
Será necesario el Respaldo completo del Viernes(6) y :
- Si se utilizaron Respaldos Diferenciales: Sólo el Respaldo Diferencial del Miércoles(11).
- Si se utilizaron Respaldos de Incremento: Se necesitaran todos los Respaldos de Incremento desde el Sábado(7) hasta el Miércoles(11)
Claro esta que los respaldos completos de cada Viernes pasan a formar parte del "Archivo" mensual de Información.
Duplicado de Información en Linea (RAID)
RAID ("Redundant Array of Inexpensive Disks") en términos sencillos
es: un conjunto de 2 o más "Discos Duros" que operan como grupo y
logran ofrecer una forma más avanzada de respaldo ya que:
- Es posible mantener copias en linea ("Redundancy").
- Agiliza las operaciones del Sistema (sobre todo en
bases de datos
.)
- El sistema es capaz de recuperar información sin intervención de un Administrador.
Existen varias configuraciones de Tipo RAID, sin embargo, existen 4 tipos
que prevalecen en muchas Arquitecturas:
- RAID-0 : En esta configuración cada archivo es dividido ("Striped") y sus fracciones son colocadas en diferentes discos. Este tipo de implementación sólo agiliza el proceso de lectura de archivos, pero en ningún momento proporciona algún tipo de respaldo ("redundancy").
- RAID-1 : En orden ascendente, este es el primer tipo de RAID que otorga cierto nivel de respaldo; cada vez que se vaya a guardar un archivo en el sistema éste se copiara integro a DOS discos (en linea), es por esto que RAID-1 también es llamado "Mirroring".
Además de proporcionar un respaldo en caliente ("hot") en dado caso de fallar algún disco del grupo , RAID-1 también agiliza la lectura de archivos (si se encuentran ocupadas las cabezas de un disco "I/O") ya que otro archivo puede ser leído del otro disco y no requiere esperar a finalizar el "I/O" del primer disco.
- RAID-3 : Esta configuración al igual que RAID-0 divide la información de todos los archivos ("Striping") en varios discos, pero ofrece un nivel de respaldo que RAID-0 no ofrece. En RAID-0 si falla un disco del grupo, la Información no puede ser recuperada fácilmente, ya que cada disco del grupo contiene una fracción del archivo, sin embargo RAID-3 opera con un disco llamado "de paridad" ("parity disk").
Este "disco de paridad" guarda fracciones de los archivos necesarias para recuperar toda su Información, con esto, es posible reproducir el archivo que se perdió a partir de esta información de paridad.
- RAID-5 : El problema que presenta RAID-3 es que el "disco de paridad" es
un punto critico en el sistema; que ocurre si falla el disco de paridad ?
Para resolver este problema RAID-5, no solo distribuye todos los archivos en un grupo de discos ("Striping"), sino también la información de paridad es guardada en todos los discos del sistema ("Striping"). Este configuración RAID suele ser usada en sistemas que requieren un "alto nivel" de disponibilidad, inclusive con el uso de "Hot-Swappable Drives" es posible substituir y recuperar la Información de un disco dañado, con mínima intervención del Administrador y sin la necesidad de configurar o dar "reboot" al sistema.