úterý 14. srpna 2012

Windows Server 2012 - deduplikace v praxi

V MS Windows Server 2012 je poprvé implemetovaná nová funkce DATA DEDUPLICATION.

ws03-01Stručně o co jde:
"Jedná se o součást File Server role, která po své aktivaci v Server Manager umožňuje pravidelnou optimalizaci diskového úložiště. Jedná se o možnost vyhledávat duplicitní data na úložišti a možnost bez narušení integrity tyto duplicitní data tzv. deduplikovat."
Tolik ve v článku Týden novinek ve Windows Serveru “8”: Data Deduplication

(poznámka: Windows Server 8 byl později přejmenován na MS Windows Server 2012).
Mne však napadlo zjistit (a porovnat) jaké jsou opravdu výsledky v praxi.
Konkrétně u mne v práci.
Naistaloval jsem si tedy na testovací server zkušební verzi MS Windows Server 2012 RC.
A spustil jsem noční kopírování dat z firemního serveru.
Snad jen pro úplnost ještě dodám - souborový systém byl NTFS.
A co řekl průzkumník (po zkopírování všech dat):
  • Size: 1,62 TB (velikost překopírovaných dat ze souborového serveru)
  • Contains Folders: 199 132 (počet adresářů)
  • Contains Files: 1 105 724 (počet souborů)
Zapnul a nakonfguroval jsem deduplikaci a pak již jen zbývalo čekat na výsledek.
A jak to dopadlo?
Kopírování dat z hlavního serveru jsem vzhledem k značnému obejmu musel rozdělit na několik částí.
Po zkopírování první části (jednalo se zejména o data týkající se zakázek a vnitřní agendy) byl deduplikační poměr (rating) až na překvapujících 55% (hlášení o úspoře místa znělo 224 GB).
Po zkopírování zbávajícíh dalších dat (uživatelských, pracovních, instalačních adresářů) poměr klesnul na 22%.
Vyčkal jsem tedy na spuštění závěrečné noční deduplikace:
A co řekl Server manager od disku (na kterém je zapnutá deduplikaci):
  • Deduplication Rate: 40%
  • Deduplication Savings: 681 GB

Úspora je tedy velmi zajimavá.
Zbývá už jen zjistit, jak je na tom výkonostně
(u zapnuté komprese šel výkon rapidně dolů - při zápisových operacích).

Z již výše zmíněného článku si tedy ještě vypůjčím toto:
  • Nevýhodou deduplikace dat je nekompatibilita s cluster shared volumes, není tedy možné tuto funkci využít např. pro Hyper-V cluster, u kterého bychom chtěli využít live migration virtuálních počítačů.
  • Je však možné použít deduplikaci pro běžné cluster oddíly.
  • V případě zápisu na disk nedochází k žádnému zpomalení, protože deduplikace je proces, který běží plánovaně v pozadí, při čtení však může ke zpomalení v řádu 2 – 5% docházet.
  • Optimalizována mohou být pouze datová NTFS úložiště, boot a system oddíly deduplikaci využívat nemohou.
  • Při využití deduplikace není možné zároveň využívat NTFS kompresi či NTFS šifrování.

Žádné komentáře:

Okomentovat