rsync | |
---|---|
Basisdaten
| |
Hauptentwickler | Wayne Davison |
Entwickler | Andrew Tridgell, Paul Mackerras |
Erscheinungsjahr | 19. Juni 1996 |
Aktuelle Version | 3.3.0[1] (6. April 2024) |
Betriebssystem | Unix und Unix-artig (z. B. Linux, macOS, Solaris); Portierungen: u. a. OS/2, Windows |
Programmiersprache | C[2] |
Kategorie | Synchronisation |
Lizenz | GPL (Freie Software) |
rsync.samba.org |
rsync ist sowohl ein Netzwerkprotokoll als auch ein unter der GPL stehendes Programm zur Synchronisation von Daten, meistens über ein Rechnernetz. Die Synchronisation läuft bei rsync nur unidirektional ab, also von einem Quell- zu einem Zielverzeichnis.
Ein wichtiges Merkmal von rsync ist, dass es nicht nur ganze Dateien kopieren kann, sondern auch Teile von Dateien. Wurde auf dem Quell-Datenträger eine Datei verändert, werden nur die geänderten Teile dieser Datei auf das Zielsystem übertragen (Delta-Kodierung), womit Zeit gespart wird. rsync wurde unter anderem von Paul Mackerras und Andrew Tridgell aus dem Samba-Team entwickelt.
Rsync überträgt eine Datei (die Quelldatei) von einem Server auf eine Zieldatei auf einem Client. Existiert diese Zieldatei bereits, so überprüft rsync, ob diese gegenüber der Quelldatei verändert vorliegt und gleicht daraufhin die Zieldatei an die Quelle an. Dabei werden Dateigröße und -datum verglichen. Ruft man rsync mit entsprechenden Parametern auf, können die Dateien auch anhand ihrer Checksummen verglichen werden. Das ist jedoch deutlich zeitaufwändiger.
Um die Daten anzugleichen, wird als erstes die Zieldatei in Blöcke einer bestimmten Länge unterteilt, für die jeweils zwei Prüfsummen gebildet werden. Die erste dieser Prüfsummen ist rollierend und daher dazu geeignet, schnell eine gegebenenfalls verschobene Bytesequenz mit der gleichen Prüfsumme in der Quelldatei aufzuspüren. Da sie allerdings anfällig für Kollisionen ist, wird bei ihrer Übereinstimmung zunächst noch die zweite Prüfsumme getestet. Bei der zweiten Prüfsumme ist im Gegensatz zur rollierenden Prüfsumme eine Kollision praktisch ausgeschlossen,[3] allerdings ist ihre Berechnung sehr viel aufwändiger. Diese zweite Prüfsumme wurde im ursprünglichen Entwurf mit dem MD4-Verfahren berechnet;[4] seit dem Release 3.0.0 von rsync wird stattdessen MD5 benutzt.[5]
Mit den Prüfsummen werden Anweisungen generiert, wie eine Kopie der Quelldatei aus den Datenblöcken der Zieldatei generiert werden kann. Für bereits auf dem Zielsystem vorhandene Blöcke werden Verschiebe-Vorschriften übertragen. Nur Daten, die sich nicht aus Blöcken der Zieldatei zusammensetzen lassen, werden direkt gesendet. Damit erhält das Zielsystem nun durch Befolgen dieser Vorschriften eine exakte Kopie der Quelldatei.
Zur Kommunikation wird der TCP-Port 873 verwendet. Aber auch ein Zugriff über eine Remoteshell – etwa SSH (verschlüsselt) oder rsh (unverschlüsselt) – ist problemlos möglich.
Hauptanwendungsgebiete von rsync sind Datensicherung und Spiegelserver ("mirror"), wie z. B. bei rsnapshot und Datenübertragung für den Umzug der Software auf eine neue Hardware.[6] Auch für einen Datenabgleich zu Firmenaußenstellen mit geringer Datenrate der Netzwerkanbindung, z. B. ISDN/ADSL, eignet es sich. rsync ist kompatibel zu rcp und kann deshalb auch für cvs verwendet werden – vorausgesetzt, ein rsyncd-Server ist vorhanden. rsync selbst kennt zwar keine Verschlüsselung, diese kann jedoch von ssh übernommen werden.
rsync ist für alle gängigen Unix- bzw. unixoide Betriebssysteme und OS/2 verfügbar; auf der Basis von Cygwin ist es auch auf Windows-Systemen lauffähig.
Daneben gibt es andere Programme – auch grafische – wie Unison (GTK+/Win), DeltaCopy (Win) oder RsyncX (macOS), die das rsync-Protokoll unterstützen. Die derzeit aktuelle RsyncX-Version unterstützt allerdings nur eine veraltete Version von rsync.
Der rsync-Algorithmus wird in der Backup-Lösung rdiff-backup[7] eingesetzt. Diese Software wird für Linux, macOS und Windows angeboten.
Damit können auf lokalen oder entfernten Rechnern liegende Dateien oder Verzeichnisse in einem Backup-Mirror gesichert werden. Zusätzlich lässt sich jede ältere Version einer Datei oder eines Verzeichnisses wiederherstellen, da rdiff-backup reverse deltas in platzsparender Weise speichert – nur die Teile der Quelldateien, die sich verändert haben, werden übertragen. Das macht rdiff-backup zur bevorzugten Backup-Software für große Dateien, die sich nur wenig verändern (z. B. E-Mail-Postfächer auf dem lokalen Rechner, virtuelle Maschinen).
Mit dem Werkzeug archfs kann ein mit rdiff-backup erstelltes Backup-Verzeichnis als virtuelle Festplatte eingebunden (engl. "mount") werden. Alle gesicherten Daten sind nun als "snapshots" zugänglich, ähnlich wie bei Rsnapshot und Back In Time.[8]
Als Teil der Sammlung GAdmintools gibt es mit GADMIN RSYNC eine grafische Benutzeroberfläche zur Administration des rsync-Servers und dessen Clients.
Rsync wird außerdem als Grundlage für BackInTime verwendet – eine einfache grafische Backup-Software, ähnlich Apples Time Machine.
Weitere grafische Oberflächen sind bei den Linux-Versionen von QtdSync[9] und Unison zu finden.[10]
Unter macOS steht neben Unison[10] als grafische Oberfläche die Open-Source-Programme arRsync[11] und grsyncx[12] zur Verfügung.
Grafische Oberflächen für Windows – die sowohl Client- als auch Server- oder Daemon-Funktionen unterstützen – sind beispielsweise DeltaCopy,[13] QtdSync[9] oder Unison.[10]
HardlinkBackup[14] (früher RsyncBackup) bietet eine ähnliche Funktionalität wie Rsync (beispielsweise Hardlinks) und kann zur lokalen Sicherung verwendet werden. Es ist aber nicht mit rsync kompatibel und kann deshalb nicht als Client für einen Rsync-Server eingesetzt werden.
Mit Acrosync[15] gibt es eine eigenständige Win32-Rsync-Implementierung, die nicht auf dem rsync-Sourcecode aufbaut.
Rsync läuft auch mit Cygwin, einer POSIX-API und Toolsammlung für Windows, sowie mit Hilfe des Windows Subsystem for Linux.