Deduplication

Deduplication

همانطور که در شکل زیر مشاهده می شود در مرحله اول دیتایی که تا به حال ذخیره نشده است به روی ذخیره ساز رفته و عمل رایت انجام می شود.

در مرحله دوم مقداری از دیتاها تکراری می باشند (دیتاهای آبی رنگ) و مقداری دیتای جدید داریم،

در مرحله سوم دیتاهایی که تکراری هستند روی ذخیره ساز رایت نمی شوند

در مرحله چهارم فقط دیتاهای جدید ذخیره می شوند.

همانطور که در شکل بالا نشان داده شده است و در مقدمه توضیح داده شده، Deduplication عملی می باشد که طی آن ذخیره سازی دیتا را بصورت هوشمند انجام می شود. بدین معنی که دیتاهای تکراری ذخیره نمی شود و همچنین برای Backup گیری نیز از آنها نسخه پشتیبان تهیه نمی شود به این دلیل که یکبار این عمل صورت پذیرفته است. استفاده از deduplication باعث می شود حجم بیشتری برای ذخیره سازی و Backup برای سازمان باقی بماند. همچنین هنگام Replication بین دو سایت استفاده از این تکنولوژی باعث می شود پهنای باند کمتری اشغال شود و عمل Replication با سرعت بالاتری انجام پذیرد.

برای عمل Deduplication از الگوریتم های مختلفی استفاده می شود که در زیر نام برده شده است:

  • File-level deduplication
  • Fixed-size block deduplication
  • Variable-size block deduplication

چانک های تکراری بصورت Hash درآمده و در یک جدول ذخیره می شوند (index میشوند)، و از این جدول برای مقایسه دیتاهای تکراری در آینده استفاده می شود. واحد مقایسه فایل ها می تواند در سطح فایل و یا Sub-file باشد.

ارسال دیدگاه

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *