Die inhaltsbasierte Deduplizierung (Content-Defined Chunking oder CDC) ist eine fortgeschrittene Methode der Datendeduplizierung, die Dateien in variable Blöcke oder Stücke aufteilt, die anhand ihres Inhalts und nicht anhand ihres festen Speicherorts oder ihrer Größe identifiziert werden.
Diese Technik analysiert den Inhalt der Daten, um die optimalen Schnittpunkte zu bestimmen, wodurch eine genauere Identifizierung und die Beseitigung von Duplikaten über einen größeren Datensatz hinweg ermöglicht wird.
Die CDC-Deduplizierung verbessert die Effizienz der Deduplizierung, indem sie die Blockgröße dynamisch an die Datenmuster anpasst, wodurch die Übertragung der Daten zum Sicherungsraum optimiert und der für die Sicherung benötigte Speicherplatz erheblich reduziert wird.
Diese Deduplizierungstechnik wird von der neuesten Generation von Backup-Engines wie Restic, Borg und …. verwendet.