středa 25. června 2014

Deduplikace

V MS Windows Server 2012 byla poprvé uvedena nová technologie pro úsporu místa na HDD, která byla dosud známa pouze ve světě dražších diskových polích (i když dosud i  někteří velmi známí výrobci diskových polí tuto technologii stále nenabízí).

A v dalších verzích operačního systému se již stala nedílnou součástí serverového operačního systému.
A doufejme, že se již brzo stane nedílnou součástí klientského operačního systému rodiny MS Windows.

Máme několik druhů DEDUPLIKACE DAT.
 1. in-line deduplikace
 2. post-procesní deduplikace
 3. klientský založena deduplikace
 4. deduplikace na straně cile
 5. deduplikace založena na NAS
 6. deduplikace založena na SAN
 7. globalni deduplikace

In-line deduplikace:
Zpracovává veškerá data zapisovaná do cíle deduplikačním procesem v reálném čase, aby se minimalizovalo velikost úložiště.

Nevýhody:
 • zatěžuje procesor (či je výkonnější, tím je i deduplikační průběh rychlejší)
 • deduplikuje vše, nelze z deduplikačního procesu vyřadit data, které ze své podstaty nelze deduplikovat
 • snižuje deduplikační poměr (míchá ne-deduplikovatelná data s deduplikovatelnými)
 • obtížné sdílení indexu a metadat
 • obvykle nenabízí vysokou dostupnost
Výhody:
 • snadné nasazení
 • omezení potřeby diskové vyrovnávací paměti cache

Postprocesní deduplikace
Spoléhá na rychlou vyrovnávací diskovou paměť, která zachytává data v cíli před zahájením deduplikace.

Výhody:
 • vyšší výkon
 • rychlejší dokončení zálohy
 • lze vyřadit definovaná data z deduplikačního procesu
 • možnost sdílení metadat a indexu
 • lze vytvořit cluster (vysokou dostupnost)
 • lze účinně replikovat data
 • z dlouhodobého pohledu je efektivnější (z hlediska nákladů)
Nevýhody:
 • potřeba rychlé vyrovnávací paměti
 • vysoká počáteční pořizovací cena

Klientsky založená deduplikace
K deduplikaci dochází ještě před přesunem dat do cíle (typicky např. u přírůstkového zálohování)

Výhody:
 • deduplikac na straně klienta
 • snížení požadavků na zdroje (šířka pásma sítě při přenosech)
 • zasílá se méně dat ... rychlejší přenos
Nevýhody:
 • Zatížení procesoru na straně klienta

Deduplikace na straně cíle
Data se deduplikují po zaslání do cílového zařízení.

Výhody:
 • odpadá režie, zatízení na straně klienta při deduplikaci
Nevýhody
 • veškeré zatížení při deduplikaci přebírá cílové zařízení
 • klient musí zaslat všechny nededuplikovaná data do cíle skrz síť

Deduplikace založená na NAS
Data se do deduplikačního cíle zasílají skrz IP síť (obvykle rychlost 10 Gbps).

Výhody:
 • snadná implementace
 • vícenásobné čtení a zápis
Nevýhody:
 • zabezpečení, viry, ...
 • změny pro uživatele

Deduplikace založená na SAN

Výhody:
 • nabízí nejvyšší možný výkon
 • velmi bezpečné ... pod plnou kontrolou administrátora (síťová izolace)
 • snadná implementace
 • žádné nebo velmi malé změny pro uživatele

Globální deduplikace
Kombinuje různé druhy deduplikace - zdrojovu, cílovou a další. Snižují se požadavky na velikost úložiště, šířku síťového pásma. Jedná se trend budoucnosti.

Výhody:
 • značně snižuje požadavky na síťové pásmo
 • snižuje objem dat
 • používá inteligentní metodu komunikace mezi zařízeními
 • s rostoucím počtem lokalit pracuje rychleji a zasílá se menší objem dat
Nevýhody:
 • nákladné řešení
 • možné problémy při komunikaci s ostatním zařízení.

Žádné komentáře:

Okomentovat