Active Backup for Business fornisce una tecnologia di deduplicazione integrata per migliorare notevolmente l'efficienza di archiviazione dei dati. Inoltre, l'archiviazione dati sintetici completa, che sfrutta il file system Btrfs, consente anche di ridurre l'uso dell'archivio.
La deduplicazione dati riduce le dimensioni dei file di backup e viene abilitata automaticamente. È possibile ottimizzare notevolmente lo spazio di archiviazione durante il backup di numerose VM che presentano grandi quantità di spazio libero nei dischi logici o di VM con blocchi dati simili. La deduplicazione dati funziona anche fra dispositivi e piatteforme, quindi consente di eliminare blocchi identici nel PC/server/VM. Con questa funzione abilitata, sarà possibile migliorare notevolmente l'efficienza di archiviazione.
Di seguito è riportato un esempio sul funzionamento:
Viene eseguito il primo backup completo di una VM che esegue Windows Server 2016 da Hypervisor One e, allo stesso tempo, si dispone di un server fisico che esegue Windows Server 2016. Quando si creano due attività di backup per questi due dispositivi differenti, solo una copia di Windows Server 2016 sarà scritta su Synology NAS in quanto l'altra sarà duplicata quasi completamente. Anche quando si esegue il backup di due dispositivi Windows che eseguono sistemi operativi differenti, come Windows 8 e 10, se i blocchi sono identici, saranno comunque eliminati.
In commercio, sono disponibili differenti meccanismi di deduplicazione. Per garantire la massima efficienza di archiviazione e risorse, Synology Active Backup for Business usa la deduplicazione in linea target con rilevamento duplicati basato su hash.
La deduplicazione in linea scansiona i dati elimina i blocchi di deduplicazione prima che siano scritti su un repository di backup. Dal momento che questa tecnica comporta la cancellazione dei dati di backup ripetuti, contribuisce a ridurre la richiesta di spazio di archiviazione in un repository. Per identificare blocchi identici, questa tecnica utilizza degli algoritmi crittografici, quali SHA-256, per calcolare uno hash per ogni blocco, che corrisponde ai dati di backup a lunghezza fissi divisi. I blocchi con gli stessi hash sono considerati identici e quindi eliminati.