Wie speichert man die Big Data korrekt?
Jedes Unternehmen, sogar jede Privatperson kennt es: In der Digitalisierung sammeln sich immer mehr Daten an, die sicher gespeichert und zu archiviert werden müssen. Doch wie bewahrt man seine Daten korrekt und vor allem sicher auf? Hier eine Hilfestellung.
Wenn es um das Thema Datensicherung geht, sind zahlreiche Aspekte und Auflagen zu beachten. Wer alle strategischen, organisatorischen, technischen und gesetzlichen Bedingungen beachten möchte, verzweifelt oft daran das richtige Speichermedium für seine Daten auszuwählen. Doch kann man pauschalisiert sagen, dass der technische Charakter der Daten ausschlaggebend für das Speichermedium ist – sensible und kritische Daten sollten möglichst in Data Warehouses und Online-Datenbanken gesichert werden, wohingegen Massendaten gut über Transaktionssysteme und Streaming-Analytics gespeichert werden können.
Archivierung der Big Data
Zur Speicherung von Massendaten werden vor allem Offline-Storage-Systems wie Tape Libraries favorisiert. Das Speichervolumen lässt sich einfach durch weitere Datenträger erweitern und bietet deswegen eine dauerhafte und robuste Lösung zum speichern der Big Data. Die Technologie ist bewährt, lässt sich bis in den Exabytesbereich erweitern und hat eine hohe Datenübertragungsrate.
Eine virtuelle Version der Tape Libraries würde sich für viele Unternehmen als die perfekte Lösung zur Speicherung der Big Data herauskristallisieren. Die Funktionalität der klassischen Tape Library, kombiniert mit dem Komfort virtueller Systeme ist zwar für das kurzfristige speichern von Backups geeignet, werden für die längerfristige Archivierung aber eher weniger benötigt. Zudem ist es schwierig in dem Bereich einen Anbieter zu finden, welcher die Verfügbarkeit und Haltbarkeit des virtuellen Speichers zusichern würde.
Wichtige Aspekte bei der Systemwahl
Insbesondere die Verfügbarkeit der Speichersysteme ist ausschlaggebend für die Auswahl für die Archivierung. Archive sind die Daten, die langfristig revisionssicher aufbewahrt werden müssen, aber nicht mehr verändert werden dürfen. Oft müssen Unternehmensdaten aus rechtlichen Gründen bis zu 30 Jahre archiviert werde. Allerdings wird sich kein Anbieter finden, der virtuelle Speichersysteme mit der Kapazität und einer Gewährleistung von 30 Jahren anbieten wird. Die Idee von virtuellen Tape Libraries ist also nachvollziehbar – bislang aber leider noch nicht realisierbar.
Auf die Dateiart kommt es an
Nicht allen Daten sind solch lange Aufbewahrungsfristen auferlegt. Bevor man sich über die Archivierungsart und den Anbieter Gedanken macht, sollte man deswegen die zu archivierenden Daten untersuchen und feststellen, um welchen Datentyp es überhaupt handelt. Neben dem Dateityp sind die Informationen, welche die Daten enthalten ausschlaggebend für die Aufbewahrungsfrist. Sind originäre Informationen enthalten oder wird nur über die originären Informationen diskutiert? Besonders bei Big Data Projekten fallen sehr viele Daten an, die von ganz unterschiedlichen Algorithmen unternehmensweit und -übergreifend angehäuft werden.
Falls sich ermitteln lässt, welche Informationen als welche Datei archiviert werden müssen, wird auch deutlich, ob eine große Bandbibliothek oder andere Speichermedien die schlussendlich gescheite Wahl sind und wie die Systeme dimensioniert werden sollten.
Dieser Beitrag basier auf einer Pressemitteilung der Information Services Group.
Titelbild: iStock/ Jirsak
[plista]