Wozu E-Mail Archivierung? (Teil1)

.. wir haben doch ein Backup!

Mehr als 90% der geschäftlichen Kommunikation wird heute über E-Mail abgewickelt. Die Datenschutzgrundverordnung (DSGVO) verpflichtet Unternehmen jeder Größenordnung zur Aufbewahrung dieser Korrespondenz.

Ein regelmäßiges Backup Ihres Mail-Systems ist eine absolute Notwendigkeit, um die Wiederherstellung Ihres Betriebes im Fehlerfall zu gewährleisten. Im Gegensatz zur E-Mail Archivierung ist ein Backup-System allerdings für die sichere Archivierung von E-Mails über viele Jahre aus mehreren Gründen ungeeignet. Warum das so ist, versuchen wir mit drei Beiträgen zu diesem Thema verständlich zu erläutern und starten mit der einfachen Frage

Was heißt eigentlich Backup?

Backup, zu Deutsch "Datensicherung" bezeichnet das Kopieren von Daten in der Absicht, diese im Fall eines Datenverlustes zurückkopieren zu können. Somit ist Datensicherung eine elementare Maßnahme zur Datensicherheit. (Quelle: Wikipedia)
Diese Definition von Backup ist wohl jedermann bekannt und grundsätzlich natürlich richtig. Im privaten Kontext, wo es beispielsweise darum geht, sich gegen den Verlust von Urlaubserinnerungen zu schützen, ist dieses Definition auch völlig ausreichend und Mann/Frau verbindet damit, beispielsweise die zusätzliche Kopie der eigenen Fotos auf einer externen USB- Festplatte oder DVD.

Im betrieblichen Umfeld ist es allerdings unumgänglich, sich mit weiteren Begriffen detaillierter zu befassen!

Um ein besseres Verständnis für die Unterschiede zwischen Backup und Archivierung zu erhalten gilt es im ersten Schritt einmal um die Klärung, um welchen Typ von Daten es sich bei E-Mails eigentlich handelt. Bei E-Mails handelt es sich um sogenannte ´strukturierte Daten´ im Gegensatz zu sogenannten ´unstrukturierten Daten´. Obwohl diese Unterscheidung geradezu elementar ist, sind diese beiden Begriffe allen ´Nicht IT-lern´ wohl weniger bzw. gar nicht geläufig. Zum einfacheren und besseren Verständnis beschränken wir uns bei den nachfolgenden Erklärungen auf die wesentlichsten und auch nachvollziehbaren Unterschiede.

Unstrukturierte Daten (unstructured data):

Unter unstrukturierte Daten fällt alles, was als Einzel-Datei vorliegen kann und wohl allen, sowohl aus dem betrieblichen als auch aus dem privaten Umfeld gut bekannt ist. Dazu zählen alle Dokumente, die beispielsweise mit einem Textverarbeitungsprogramm erstellt werden (.doc) genauso wie Kalkulationstabellen (.xls), Präsentationen (.ppt) und natürlich alle Audio-, Video- und Bilddateien (.mp3, .jpg, .mp4, etc.). Unstrukturiert deshalb, weil diese Dateien für sich gesehen bereits den ganzen „Content“ beinhalten und in keiner Abhängigkeit zu anderen Dateien stehen. Unstrukturierte Daten können daher mit einfachen Kopier-Befehlen auf andere Datenträger verschoben und ebenso einfach wieder hergestellt werden.

unstrukturierte Daten

Strukturierte Daten (structured data)

Bei „strukturierte Daten“ handelt es sich um eine Kombination mehrerer unterschiedlicher Dateien und Dateiformaten (Datenbanken, Konfigurationsdateien, Log-Dateien etc.) die zueinander in Abhängigkeit stehen und nur zusammen den reibungslosen Betrieb garantieren. Bei strukturierten Daten handelt es sich somit um ein, mehr oder weniger geschlossenes System, das die jeweilige Basis für praktisch jede betriebswirtschaftlichen Anwendung darstellt. Egal ob es sich dabei um ein Warenwirtschaftssystem (ERP), ein Kunden-Management-System (CRM) oder um ein Messaging-, sprich E-Mail System handelt.

strukturierte Daten, z.B. Datenbanken

Die vordringlichste Aufgabe beim Backup solcher Applikationen, wie in diesem Fall beim Backup des E-Mail-Systems, besteht daher darin, ein vollständiges, sprich konsistentes Abbild des kompletten Systems zu erzeugen, das im Fehlerfall eine rasche Wiederherstellung und damit die Wiederaufnahme des Betriebs ermöglicht.

Bei solchen vollständigen System-Abbildern (System-Image, Full-Backup) ist das einzelne Mail aber keine separat „physisch angreifbare“ Datei, wie zum Beispiel ein Text-Dokument, sondern steckt als Datensatz irgendwo in den Datenbanken mit Referenzen zu Status- und Log-Files. Diesem Umstand werden wir etwas weiter unten noch mehr Aufmerksamkeit widmen.

Zuvor ist es jedoch erforderlich, dass wir uns noch mit zwei weiteren Begriffen beschäftigen, die gemeinsam den Dreh- und Angelpunkt jeder Backup-Strategie bzw. jeder Betriebskontinuitätsplanung darstellen.

RTO (Recovery Time Objective), RPO (Recovery Point Objective)

Die Bedeutung dieser beiden sperrigen Begriffe lässt sich natürlich auch ins Deutsche übersetzen und verständlich erklären.

RTO (Recovery Time Objective) beschreibt den Zeitraum, der notwendig ist ein ausgefallenes System wieder herzustellen. Bei diesem Zeitraum kann es sich um Minuten, Stunden oder sogar Tagen handeln und abhängig von der vorhandenen Infrastruktur ist damit ein teilweiser oder vollständiger Betriebsstillstand verbunden. Obwohl man in erster Linie an eine defekte Hardware als Ursache für einen Systemausfall denkt (defekte Festplatten, Netzteile etc.), sind Software-Probleme (fehlerhaftes Update, zu wenig Speicherplatz etc.) mindestens genauso häufig. Unabhängig von der Fehlerursache bedeutet der RTO-Wert im Falle eines E-Mail-Systems also, „Wie lange ist es für ein Unternehmen gerade noch akzeptabel PER E-MAIL NICHT ERREICHBAR ZU SEIN?“

RPO (Recovery Point Objective) beschreibt den Zeitraum, der hinsichtlich eines Datenverlustes gerade noch akzeptabel ist. Dieser Zeitraum wird ebenfalls in Minuten, Stunden oder sogar Tagen angegeben und hängt unmittelbar mit der Häufigkeit von Backup-Vorgängen zusammen. Mit anderen Worten, wie oft werden Ihre Daten gesichert, alle 30 Minuten, alle 4 Stunden, einmal täglich ? Alle Daten und damit beispielsweise alle E-Mails, die Sie in der Zeit zwischen Ihrem letzten Backup erhalten oder geschrieben haben, sind bei einem Systemausfall unwiederbringlich verloren. Wird beispielsweise 2x täglich ein Backup durchgeführt, können im Fehlerfall alle E-Mails aus einem Zeitraum von >= 12 Stunden verloren gehen.

Die nachfolgende Grafik zeigt beispielsweise ein Unternehmen, das 2x täglich ein Backup durchführt, und zwar einmal tagsüber um 12:00 und einmal nach Geschäftsschluss um 22:00. Kommt es nun um 11:00 zu einem Systemausfall, beträgt der Wert für RPO 13 Stunden und alle E-Mails, die in diesem Zeitraum gesendet oder empfangen wurden sind damit verloren.

RTO bzw. RPO - diese wichtigsten Werte für Backup & Disaster Recovery

Alle Mails der letzten 13 Stunden verloren ! .. das könnte für viele Unternehmen bereits geschäftsschädigende Auswirkungen haben.

So schlimm muss es natürlich nicht sein, den mit Hilfe einer modernen Backup- und DR Lösung können die RTO- und RPO-Werte deutlich verbessert werden. Mit den Details dazu befassen wir uns im Beitrag Wozu E-Mail Archivierung? (Teil2)

Lassen Sie uns zuvor, nochmals einen Blick auf unser Beispielszenario werfen, das wir nun mit einem E-Mail Archivierungssystem erweitert haben. Da im E-Mail Archivierungssystem ständig eine zusätzliche Kopie jedes empfangenen und gesendeten E-Mails enthalten ist, reduziert sich der RPO-Wert auf 0 (Null), da keine E-Mails durch den Ausfall des E-Mails System verloren gegangen sind. Innerhalb der angenommen RTO-Zeit von 9 Stunden, sprich dem Zeitraum, der notwendig ist um den E-Mail Server zur reparieren oder zu ersetzen, können natürlich auch mit einem parallel laufenden E-Mail Archivierungssystem keine neuen Emails gesendet oder empfangen werden. Allerdings bleibt in dieser Zeit für alle Benutzer der Zugriff auf alle E-Mails bis zum Absturzzeitpunkt erhalten. Darüber hinaus ermöglicht das E-Mail Archivsystem eine sehr rasche Wiederherstellung aller Mails, sobald der E-Mail Server wieder funktionsfähig ist.

E-Mail Archivierung schützt Sie gegen Datenverlust

Wie wir mit dem ersten Teil unserer Beitragsserie bereits zeigen konnten, erfährt jede betriebliche Infrastruktur durch den Einsatz eines E-Mail Archivierungssystems eine wertvolle Ergänzung. Ein E-Mail Archivierungssystem stellt daher einmal grundsätzlich eine Erweiterung zum einem vorhandenen Backup dar.

Scroll to top