Was ist ein Backup oder eine Datensicherung?
Ein Backup ist, wie der deutsche Begriff „Datensicherung“ impliziert, eine Sicherungskopie gespeicherter Daten auf einem zusätzlichen Medium wie einem Tape, einer Festplatte, einer SSD oder in der Cloud. Diese Kopie dient dazu, Informationen vor Verlust durch Hardware-Ausfälle, Software-Fehler, Naturkatastrophen oder Bedrohungen wie Malware zu schützen. Während das Magnetband (Tape) ein traditionelles Sicherungsmedium darstellt, sind heute vor allem externe Festplatten (HDD) und zunehmend SSDs sowie Cloud-Speicher weit verbreitet.Da auch ein Backup-Medium selbst nicht vor Defekten gefeit ist, benötigt eine professionelle Strategie immer mehr als nur eine einzige Kopie. Hierbei gilt die 3-2-1-Backup-Regel als Goldstandard für eine wirklich sichere Datensicherung. Tritt der Ernstfall tatsächlich ein, erfolgt der sogenannte Restore – die Wiederherstellung der Daten aus der Sicherungskopie in das produktive System.
Murphy’s Law und die Realität der IT
Eine Datensicherung ist im Kern der institutionalisierte Ausdruck von Misstrauen gegenüber der Hoffnung, dass „schon alles gutgehen wird“. Nach Murphy’s Law wird alles, was schiefgehen kann, irgendwann auch schiefgehen. Die einzige Chance, seine digitale Existenz in einem solchen Moment zu retten, besteht in einer funktionsfähigen und aktuellen Kopie Ihrer Daten. Dabei stellt sich jedoch die Frage nach dem Umfang: Reicht es, nur Dokumente zu sichern, oder müssen auch Programme und das gesamte Betriebssystem für einen schnellen Wiederanlauf (Disaster Recovery) gesichert werden?Beim Planen eines Backups stehen zwei Kernfragen im Mittelpunkt:
- Welche Daten müssen zwingend gesichert werden?
- In welchem Intervall muss die Sicherung erfolgen?
Ein Rechenexempel zur Backup-Performance
Das Hauptproblem eines permanenten Voll-Backups ist der enorme Zeitaufwand. Legt man eine (historische) Sicherungsrate von 1 MB pro Sekunde zugrunde, lassen sich pro Stunde etwa 3,6 Gigabyte (GB) übertragen. Bei einem Datenbestand von 100 GB würde ein einziger Sicherungslauf bereits über 27 Stunden dauern.Neben der zeitlichen Überlappung der Sicherungen würde die Netzwerklast ein produktives Arbeiten am Server nahezu unmöglich machen. In einem klassischen 10-Mbit-Ethernet wäre die Bandbreite vollständig erschöpft; selbst in modernen Gigabit-Netzwerken erzeugt ein kontinuierlicher Datenstrom erhebliche Latenzen. Obwohl moderne Bandlaufwerke heute Transferraten von bis zu 300 MB/s erreichen, bleibt das Grundproblem bei exponentiell wachsenden Datenmengen im Petabyte-Bereich bestehen: Die Hardware allein kann das Zeitproblem nicht lösen.
Standardverfahren in der Übersicht
Um das Backup-Volumen und das Zeitfenster zu reduzieren, haben sich verschiedene technische Verfahren etabliert:- Kombinierte Backups: Ein Voll-Backup als Basis, ergänzt durch inkrementelle oder differenzielle Teilsicherungen.
- Snapshots: „Einfrieren“ eines Datenzustands zu einem bestimmten Zeitpunkt als Merkzettel für Änderungen.
- Deduplizierung: Identifizierung und Entfernung doppelter Datenblöcke, um den Speicherbedarf massiv zu senken.
- Continuous Data Protection (CDP): Fortlaufende Erfassung jeder kleinsten Änderung in Echtzeit.
Beim inkrementellen Backup wird nach der Vollsicherung nur das gespeichert, was sich seit der letzten Sicherung geändert hat. Dies spart Zeit und Platz, erfordert beim Restore jedoch die gesamte Kette aller Teilsicherungen. Das differenzielle Backup hingegen sichert alle Änderungen seit dem letzten Voll-Backup, was die Wiederherstellung beschleunigt, da nur zwei Datensätze benötigt werden.