Home Menü

Mac OS – Datensicherung mit Amazon S3 – Teil 3

In den ersten beiden Teilen der Artikelserie Datensicherung mit Amazon S3 unter Mac OS X wurden bereits die notwendigen Grundlagen geklärt und die Anmeldung zum Amazon Simple Storage Service (Amazon S3) erfolgreich abgeschlossen. Im dritten und letzten Teil geht es nun konkret um die Datensicherung in der Amazon Cloud mit der Mac OS X Software Arq.

Mittlerweile gibt es zahlreiche Softwareprodukte zur Datensicherung unter Mac OS X in der Amazon Cloud. Einige davon habe ich für diese Artikelserie untersucht und bin zum Ergebnis gekommen, dass die Software Arq für meine Anforderungen aus folgenden Gründen die optimale Lösung darstellt:

  • Verschlüsselung der zu sichernden Daten bereits auf Client-Seite (mit AES-256)
  • Wahl zwischen Amazon S3, Glacier und Amazon RSS (Reduced Redundancy Storage) möglich
  • Mac OS X angepasste Softwareoberfläche und einfache Usability
  • Möglichkeit der Kostenkontrolle

Die Details und die Kosten für Arq wurden bereits im ersten Teil dieser Artikelserie genauer erläutert. Im Folgenden wird nun speziell auf die Einzelheiten der Software Bezug genommen.

Vorbereitung der Datensicherung

Bevor Sie sich jetzt gleich an die Sicherung Ihrer Daten stürzen, sollten Sie noch einige Vorkehrungen treffen. Es ist zum Beispiel empfehlenswert, wenn Sie sich bereits vorab Gedanken darüber machen, welche Daten Sie in der Amazon Cloud prinzipiell sichern möchten. Ich empfehle Ihnen dabei, die Daten in Kategorien zu unterteilen:

  • Kategorie 1: Sehr wichtige Dateien, täglicher Gebrauch, sofortige Verfügbarkeit notwendig
  • Kategorie 2: Wichtige Dateien, nicht täglich benötigt, keine sofortige Verfügbarkeit notwendig
  • Kategorie 3: Tendenziell eher unwichtige Dateien, Verlust unter Umständen verkraftbar

Je nach Kategorie können Sie eine entsprechende Speicherart zuweisen:

  • Kategorie 1: Sicherung im Amazon S3 Speicher
  • Kategorie 2: Sicherung im Amazon Glacier Speicher
  • Kategorie 3: Sicherung auf eine externe Festplatte

Wie Sie vielleicht bemerkt haben, habe ich mich bewusst gegen die Speicherung der Daten im Amazon Reduced Redundancy Storage (RRS) entschieden. Warum? Zwei Gründe:

  • Das Preis- / Leistungsverhältnis ist bei den beiden anderen Speicherarten (Amazon S3, Amazon Glacier) wesentlich besser, da der Amazon RRS mit seiner geringeren Zuverlässigkeit (99,99%) fast ähnlich viel kostet wie der traditionelle Amazon S3 Speicher.
  • Das Backup-Programm Arq macht es dem Nutzer recht schwer, zwischen Amazon S3 und Amazon RRS zu wählen (mehr dazu weiter unten im Artikel)

Zusätzlich zur vorgeschlagenen Kategorisierung der Dateien sollten Sie bereits frühzeitig prüfen, ob größere Dateien in den Ordnern vorhanden sind, für die vielleicht überhaupt nicht die Notwendigkeit besteht, in der Cloud eine Sicherungskopie abzulegen. Das spart Zeit (Upload-Zeit) und vor allem Geld.

Konfiguration von Arq

Nach dem Programmstart von Arq müssen als erstes die Zugriffsdaten für die Amazon Web Services eingegeben werden. Wo Sie diese finden, wurde bereits in Teil 2 näher beschrieben.

In der zweiten Maske legen Sie anschließend den Ort bzw. die Region fest, wo ihre Daten gespeichert werden. Für in Europa lebende Personen kommt hier faktisch nur Irland in Frage, da  innerhalb von Europa keine Datenübertragungsgebühren anfallen und dies zudem die einzige Möglichkeit ist, die Datenschutzbestimmungen der EU einzuhalten.

Sobald die Maske zur Einstellung der Region mit Continue verlassen wird, erscheint eine Art Popup-Fenster zur Eingabe des Verschlüsselungs-Passworts. Dieser Schritt ist von essentieller Bedeutung, da dadurch Ihre Daten vor dem Upload in die Amazon Cloud verschlüsselt werden. Dadurch kann keiner Ihre Daten auf dem Übertragungsweg oder in der Amazon-Cloud unverschlüsselt einsehen. 

Bitte beachten Sie bei diesem Schritt, dass Sie ein ausreichend langes und sicheres Passwort verwenden. Leider überprüft Arq an dieser Stelle nicht, ob das eingegebene Passwort geeignet und sicher ist.

Die anschließende Möglichkeit zur Festlegung eines Budgets für das monatliche Backup ist zwar ganz nett, allerdings noch nicht sehr ausgereift. So wird das Budget lediglich anhand der S3 Speichernutzung (nicht Glacier) kalkuliert  und die Anfragengebühr bleibt gänzlich unberücksichtigt. Nutzen sollten Sie diese Option aber auf jeden Fall, da dadurch unnötige Versionierungsbackups regelmäßig gelöscht werden (mehr dazu weiter unten im Artikel).

Im letzten Schritt des Konfigurationsprozesses stehen Ihnen noch unterschiedliche Möglichkeiten zur Verfügung um eine Auswahl der Ordner zu treffen, welche Sie regelmäßig sichern möchten.

Haben Sie auch die letzte Maske erfolgreich mit Continue abgeschlossen, so werden Sie noch mit zwei weiteren Masken beglückt. In der ersten Maske werden Sie von der Anwendung gefragt, ob Sie damit einverstanden sind, dass im Hintergrund bei jedem Neustart automatisch der Arq Agent gestartet wird.

An dieser Stelle sehr lobenswert: Hohe Transparenz und ausführliche Hilfe. In letzterer findet sich nämlich auch gleich prompt die Information, für was dieser Agent eigentlich benötigt wird:

Arq Agent is a background app contained within the Arq.app bundle. It shows up as a small icon in the menu bar and backs up your files to S3. 

The first time you run Arq it asks if you would like to add Arq Agent to the „login items“ so that backups happen as scheduled. You can also add or remove Arq Agent from „login items“ later by toggling the „Start Arq Agent at login“ checkbox in the Arq Preferences.

In der zweiten Maske fragt die Anwendung noch nach Administratorrechten. Um zukünftige Probleme mit Dateiberechtigungen bereits im Voraus zu vermeiden, können Sie Arq die notwendigen Rechte mit einem Klick auf Add administrator privileges gewähren.

Konfiguration der Datensicherung unter Mac OS X

Wenn Sie die im vorherigen Abschnitt beschriebenen Schritte alle durchgeführt haben und in der Maske Select Folders ebenfalls die manuelle Option gewählt haben, dann sollten Sie nun eine spartanisch gefüllte Maske vorfinden.

Mit einem Klick auf „Add a Folder to Backups …“ können Sie nun einen neuen Ordner Ihrem Backup hinzufügen. Sobald Sie den gewünschten Ordner über die Finder-Navigation ausgewählt haben, werden Sie nach der Speicherart (Storage Typ) gefragt:

 

Die im obigen Bild gezeigte Maske stellt zugleich die Hauptmaske des Programms dar. Hier können Sie alle notwendigen Ordner definieren und bestimmte Strukturen oder Dateien auch ausschließen:

Mac OS – Datensicherung mit Amazon S3 - Arq Backup-Auswahl

Was allerdings nicht funktioniert und das ist an dieser Stelle etwas bedauerlich: Wenn man einen Ordner mit der Speicherart Amazon S3 definiert und in diesem einen anderen Ordner ausschließt (weil dieser beispielsweise zu groß ist und man Gebühren sparen möchte), dann kann dieser ausgeschlossene Ordner später nicht mehr als separater Ordner (beispielsweise mit Amazon Glacier) gesichert werden. In dem erwähnten Szenario verweigert das Programm einfach das Anlegen eines neuen Backup-Ordners.

Wichtig für die kontinuierliche und vertrauensvolle Datensicherung mit Arq sind zuletzt noch die Einstellungen. Unter Arq –> Preferences findet man im ersten Tab bereits eine der wichtigsten Einstellungen: 

Mithilfe dieser Checkbox kann man entscheiden, ob zukünftige Objekte (Backup-Ordner) anstatt des zuverlässigeren Amazon S3 den Amazon RRS verwenden sollen. Aktiviert man die Checkbox, so bleiben alle bereits vorhandenen Ordner von der Veränderung unberührt, nur die neu angelegten Backup-Ordner machen von dieser Einstellung Gebrauch. Um auch die bereits vorhandenen Ordner mit der neuen Einstellung zu „aktualisieren“, bedarf es eines expliziten Klicks auf den Button Update Storage Class of Existing Objects.

Vor allem zu Beginn, wenn Sie alle neuen Ordner zuerst in die Amazon Cloud hochladen müssen, wird die Internetverbindung sehr stark beeinträchtigt. Hier empfiehlt sich im Reiter Network die Geschwindigkeit entweder automatisch durch das Programm definieren zu lassen oder auf eine konstante KB-Rate zu reduzieren. 

In den nächsten beiden Einstellungsmasken können Sie nun differenziert nach den Speichermethoden Amazon S3 und Amazon Glacier das Backup-Intervall festlegen. Leider lassen an dieser Stelle die Einstellungen nur eine geringe Flexibilität zu und die Definition eines Zeitplans ist in der aktuelle Version nicht möglich.

Erwähnenswert bei S3 Schedule ist noch die Option „Trim S3 data to budget every x hours“. Hier können Sie ein wiederkehrendes Zeitintervall definieren, bei dem Arq bei Überschreiten Ihres definierten Budgets die alten Backup-Versionen (tägliche, wöchentliche, monatliche Versionsbackups) verwirft. Das letzte Backup bleibt allerdings immer erhalten, auch wenn dadurch das monatliche Budget überschritten wird (Link).

Im letzten Tab Advanced können Sie abschließend noch unterschiedlichste Einstellungen – die meisten davon sind sehr ausführlich und verständlich erklärt – vornehmen.

Interessante Hintergrundinformationen zu Arq

Sicherheit

Über die Sicherheit bei der Datenverschlüsselung kann letztlich keine genaue Aussage getroffen werden. Der Entwickler Stefan Reitshamer gibt zwar an, den offenen Verschlüsselungsstandard AES-256 zu verwenden, wie dieser allerdings konkret implementiert ist, darüber kann aufgrund des fehlenden Quellcodes nur gemutmaßt werden. Fakt ist allerdings, dass die Verschlüsselung in jedem Fall angewandt wird, wenn man einen Blick auf den Amazon S3 Speicher mittels eines FTP-Clients wirft:

S3 Backup Strategie

Über die Backup-Strategie von Arq gibt die Hilfe der Software in der Rubrik S3 Backup Storage Policy eine sehr gute Auskunft:

For S3 backups only, Arq retains backups in the same manner as Apple’s Time Machine.

Arq automatically makes incremental backups every hour (if you’ve set the schedule to hourly backups). It „de-duplicates“ your files when it stores them in S3, so the same file contents are never stored more than once.

Arq saves the hourly backups for the past 24 hours, daily backups for the past month, and weekly backups until the amount of data stored in S3 reaches the budget you’ve set in the Preferences.

Fazit

Die Notwendigkeit von Datensicherungen wird auch im Jahre 2013 noch viel zu sehr unterschätzt. Spätestens wenn die ersten Daten aufgrund eines Festplattenausfalls verloren gehen, wundert sich so mancher Anwender verdutzt, warum er seine Daten nicht regelmäßig gesichert hat. Wie einfach es im Prinzip funktionieren kann, hat diese Artikelserie gezeigt. Zu Beginn gibt es mit Amazon S3 zwar eine gewisse Hemmschwelle, welche allerdings spätestens verfliegt, wenn man sieht, wie einfach und genial die Datensicherung mit Amazon S3 über Arq gelöst wurde.

Zum Abschluss dieser Artikelserie gibt es – wie versprochen – noch ein kleines Gewinnspiel, in der Sie eine Arq-Lizenz im Wert von aktuell 39,99 $ (etwa 30 €) gewinnen können. Mitmachen geht wie immer ganz einfach: Mit einem Like auf unsere Facebook-Seite, einem Follow auf Twitter oder mit einem Kommentar in diesem Blog-Artikel können Sie Punkte sammeln und somit Ihre Chance auf den Gewinn erhöhen.

Update: Das Gewinnspiel ist bereits beendet.

Welche Erfahrungen haben Sie mit Ihrer Backup-Strategie gemacht? Sind Sie mittlerweile ebenfalls auf eine Backup-Lösung in der Cloud umgestiegen?

Getestet unter Mac OS X Mountain Lion 10.8(.4) und Arq 3.2.5

Veröffentlicht von Josef Seidl

Josef Seidl hat an der TU München und der Stanford University Wirtschaftsinformatik studiert, bevor er mit INNOSPOT sein eigenes Unternehmen gründete. Er ist begeistert von Technik, schätzt performante Webseiten und ist gerne in den Bergen unterwegs. Zu finden ist er auch bei LinkedIn und privat bei Twitter.