středa 25. června 2014

Deduplikace

V MS Windows Server 2012 byla poprvé uvedena nová technologie pro úsporu místa na HDD, která byla dosud známa pouze ve světě dražších diskových polích (i když dosud i  někteří velmi známí výrobci diskových polí tuto technologii stále nenabízí).

A v dalších verzích operačního systému se již stala nedílnou součástí serverového operačního systému.
A doufejme, že se již brzo stane nedílnou součástí klientského operačního systému rodiny MS Windows.

Máme několik druhů DEDUPLIKACE DAT.
  1. in-line deduplikace
  2. post-procesní deduplikace
  3. klientský založena deduplikace
  4. deduplikace na straně cile
  5. deduplikace založena na NAS
  6. deduplikace založena na SAN
  7. globalni deduplikace

In-line deduplikace:
Zpracovává veškerá data zapisovaná do cíle deduplikačním procesem v reálném čase, aby se minimalizovalo velikost úložiště.

Nevýhody:
  • zatěžuje procesor (či je výkonnější, tím je i deduplikační průběh rychlejší)
  • deduplikuje vše, nelze z deduplikačního procesu vyřadit data, které ze své podstaty nelze deduplikovat
  • snižuje deduplikační poměr (míchá ne-deduplikovatelná data s deduplikovatelnými)
  • obtížné sdílení indexu a metadat
  • obvykle nenabízí vysokou dostupnost
Výhody:
  • snadné nasazení
  • omezení potřeby diskové vyrovnávací paměti cache

Postprocesní deduplikace
Spoléhá na rychlou vyrovnávací diskovou paměť, která zachytává data v cíli před zahájením deduplikace.

Výhody:
  • vyšší výkon
  • rychlejší dokončení zálohy
  • lze vyřadit definovaná data z deduplikačního procesu
  • možnost sdílení metadat a indexu
  • lze vytvořit cluster (vysokou dostupnost)
  • lze účinně replikovat data
  • z dlouhodobého pohledu je efektivnější (z hlediska nákladů)
Nevýhody:
  • potřeba rychlé vyrovnávací paměti
  • vysoká počáteční pořizovací cena

Klientsky založená deduplikace
K deduplikaci dochází ještě před přesunem dat do cíle (typicky např. u přírůstkového zálohování)

Výhody:
  • deduplikac na straně klienta
  • snížení požadavků na zdroje (šířka pásma sítě při přenosech)
  • zasílá se méně dat ... rychlejší přenos
Nevýhody:
  • Zatížení procesoru na straně klienta

Deduplikace na straně cíle
Data se deduplikují po zaslání do cílového zařízení.

Výhody:
  • odpadá režie, zatízení na straně klienta při deduplikaci
Nevýhody
  • veškeré zatížení při deduplikaci přebírá cílové zařízení
  • klient musí zaslat všechny nededuplikovaná data do cíle skrz síť

Deduplikace založená na NAS
Data se do deduplikačního cíle zasílají skrz IP síť (obvykle rychlost 10 Gbps).

Výhody:
  • snadná implementace
  • vícenásobné čtení a zápis
Nevýhody:
  • zabezpečení, viry, ...
  • změny pro uživatele

Deduplikace založená na SAN

Výhody:
  • nabízí nejvyšší možný výkon
  • velmi bezpečné ... pod plnou kontrolou administrátora (síťová izolace)
  • snadná implementace
  • žádné nebo velmi malé změny pro uživatele

Globální deduplikace
Kombinuje různé druhy deduplikace - zdrojovu, cílovou a další. Snižují se požadavky na velikost úložiště, šířku síťového pásma. Jedná se trend budoucnosti.

Výhody:
  • značně snižuje požadavky na síťové pásmo
  • snižuje objem dat
  • používá inteligentní metodu komunikace mezi zařízeními
  • s rostoucím počtem lokalit pracuje rychleji a zasílá se menší objem dat
Nevýhody:
  • nákladné řešení
  • možné problémy při komunikaci s ostatním zařízení.

Žádné komentáře:

Okomentovat