در مقالات پیشین دژپاد، دررابطه با ذخیره سازی مستقیم (DAS)، ذخیره سازی متصل به شبکه (NAS) و شبکه فضای ذخیره سازی (SAN) صحبت کردیم، سه پیکربندی ذخیره سازی که به طور گسترده در مراکز داده و مراکز داده پیادهسازی شدهاند. بر اساس نوع تنظیمات اداری در بیشتر موارد، این پیکربندیها نشاندهنده اتخاذ رویکردهای سنتی برای ذخیره سازی دادهها هستند، یعنی برای مدتهای طولانی بخشی از چشمانداز ذخیره سازی بودهاند. اما به مرور زمان قدیمی بودن خود را شروع به نشان دادن میکنند.
این بدان معنا نیست که این روشها در راه منسوخ شدن هستند اما با توسعه تکنولوژی و ارائهی روشهای جدید ذخیره سازی، نیاز مبرمی به باز کردن فضا برای استفاده از این روشهای جدید است.
در این مقاله، قصد دارم پنج فناوری مهم را به شما معرفی کنم که به طور پیوسته در زیرساختهای فناوری اطلاعات نفوذ کردهاند: ذخیرهسازی تعریفشده توسط نرمافزار (Software Defined Network)، شبکه فضای ذخیرهسازی مجازی (VSAN)، ذخیرهسازی هوشمند (Intelligent Storage)، ذخیرهسازی محاسباتی (Computing Storage) و حافظه کلاس ذخیرهسازی (Storage Class Memory). برخی از این فناوریها نسبت به دیگر المانها، بیشتر و سریعتر مورد استفاده قرار میگیرند، یا وسعت پذیرش فتاوری تازه از یکی به دیگری متفاوت است، اما همگی نشاندهنده روندهای مهم در ذخیرهسازی دادهها هستند و در حال تبدیل شدن به یک زیرساخت با اهمیت روز افزون هستند.
ذخیره سازی مبتنی بر نرم افزار – Software Defined Storage (SDS)
اگرچه پیکربندیهای ذخیرهسازی سنتی هنوز نقش حیاتی ایفا میکنند، اما برای پاسخگویی به نیازهای حجم عظیم دادههای پویا، توزیعشده و ناهمگن امروزی طراحی نشدهاند. برخی از تیمهای فناوری اطلاعات با روی آوردن به ذخیرهسازی نرمافزاری تعریفشده (SDS-Software Defined Storage)، یک راهحل مبتنی بر نرمافزار که وظیفهی آن فراهم کردن یک لایه انتزاعی (abstraction) بین برنامهها و دستگاههای ذخیرهسازی است، به این چالشها میپردازند و در واقع نرمافزار ذخیرهسازی را از سختافزار زیربنایی جدا میکند.
در حالت ایدهآل، یک راهحل SDS روی سرورهای کالا اجرا میشود و از طیف وسیعی از دستگاههای ذخیرهسازی پشتیبانی میکند و هرگونه وابستگی اختصاصی به سختافزار یا نرمافزار آن را حذف میکند. SDS درخواست های ذخیره سازی از طریق برنامه را کنترل میکند، و خود منابع ذخیره سازی را مدیریت میکند. جداسازی بخش داده از بخش کنترل به این روش میتواند به چابکی عملیاتی و کنترل بیشتر بر محل و نحوه ذخیره دادهها منجر شود.
اگرچه فروشندگان رویکردهای متفاوتی برای SDS دارند، راهحلها معمولا از روش مجازی سازی (Virtualization) برای ادغام دستگاههای ذخیره سازی فیزیکی در منابع منطقی استفاده میکنند که میتوانند به صورت پویا کنترل شوند و به برنامههایی که به آنها نیاز دارند تخصیص داده شوند. یک راه حل SDS ، API مبتنی بر استانداردهای مختلف را برای تهیه و مدیریت منابع در دسترس قرار میدهد، اتوماسیون عملیات را آسان تر میکند، از تلاشهای توسعه مانند زیرساخت به عنوان کد (IaC) پشتیبانی میکند و با ابزارهای هماهنگ سازی کانتینر مانند Kubernetes ادغام میشود.
یکی از بزرگترین مزایای SDS انعطاف پذیری است. نه تنها تیمهای فناوری اطلاعات انتخابهای سختافزاری بیشتری دارند، بلکه برنامهها نیز از SDS سود میبرند، زیرا منابع ذخیرهسازی را میتوان در صورت تقاضا تخصیص داد و مقیاسبندی کرد. علاوه بر این، یک راهحل SDS میتواند بهتر از منابع فیزیکی استفاده کند، که میتواند هزینههای کمتری را به همراه داشته باشد (بهویژه زمانی که سیستمهای ذخیرهسازی اختصاصی و قفل فروشنده همراه با آنها حذف شوند). SDS حتی گاهی اوقات میتواند عملکرد را از طریق موازیسازی، ردیفبندی دادهها و ذخیرهسازی داده بهبود بخشد.
با این حال SDS بدون چالش نیست. برای شروع، پیادهسازی و نگهداری یک راهحل SDS میتواند فرایند پیچیدهای باشد، بهویژه هنگام کار با چندین محصول ذخیرهسازی از فروشندگان مختلف. این سناریوهای دارای چند فروشنده همچنین می توانند دریافت پشتیبانی برای فروشنده یا حتی شناسایی منبع یک مشکل خاص را دشوارتر کنند (تشدید مشکلات فروشنده). علاوه بر این، راهحلهای SDS ممکن است آنطور که گاهی اوقات پیشنهاد میشود سختافزاری نداشته باشند، و برخی از محصولات SDS ممکن است همه ویژگیهای موجود برای سیستمهای اختصاصی اختصاصی را نداشته باشند، اگرچه این مساله به طور پیوسته در حال بهبود بوده است.
SAN مجازی – VSAN (Virtual SAN)
فناوری دیگری که سازمانها برای کمک به رسیدگی به Workload مدرن از آن استفاده میکنند، شبکه فضای ذخیرهسازی مجازی (VSAN) است، مکانیزمی که برای جداسازی و جداسازی ترافیک در شبکههایی مانند کانال فیبر یا اترنت به کار میرود. در یک پیکربندی VSAN، SAN فیزیکی به پارتیشنهای منطقی تقسیم میشود که دستگاههای متصل به همان فابریک را جدا میکند. برای مثال، میتوان VSAN ها را برای جداسازی تیمهایی با الزامات امنیتی یا عملکرد متفاوت ایجاد کرد، یا میتوان از آنها برای جداسازی ترافیک پشتیبان از ترافیک تولید استفاده کنید.
این نوع VSAN با آنچه در محصولاتی می بینید متفاوت است و کارشناسان از عبارت SAN مجازی، VSAN یا حتی vSAN برای توصیف قابلیتهای SDS استفاده میکنند. به عنوان مثال، VMware محصولی به نام vSAN (که قبلا Virtual SAN بود) ارائه میکند، یک راهحل SDS که همراه با VMware vSphere استفاده میشود تا پایهای برای زیرساختهای hyperconverged فراهم کند. VMware vSAN منابع منطقی متشکل از دستگاههای DAS متصل به کلاسترهای vSphere در بخش زیرساخت ایجاد میکند و سپس آن منابع را در اختیار ماشینهای مجازی کلاستر قرار میدهد.
VSAN در متن این مقاله ریشه در سیستمهای Cisco دارد و مختص پیادهسازی SAN است. هر VSAN منطقی از همان عملیات و پیکربندیهای موجود برای SAN فیزیکی پشتیبانی میکند، اما میتوان آنها را بهطور مستقل برای رفع نیازهای خاص پیکربندی کرد. دستگاههای داخل vSAN میتوانند آزادانه با یکدیگر ارتباط برقرار کنند، اما نمیتوانند با دستگاههای خارج از VSAN خود ارتباط برقرار کنند، حتی اگر به همان SAN فیزیکی متصل باشند. به این ترتیب، یک سازمان میتواند یک توپولوژی SAN واحد بسازد، اما همچنان از مزایای توپولوژیهای منطقی برخوردار است که از موقعیت جغرافیایی سوئیچهای SAN و دستگاههای متصل متاثر نیستند.
VSAN سیسکو به عنوان استاندارد موسسه استانداردهای ملی آمریکا (ANSI) در اکتبر 2004 تایید شد و اهمیت آن را در مرکز داده تایید کرد. اگرچه یک VSAN ممکن است به عنوان یک فناوری مدرن واجد شرایط نباشد، اما نقش مهمی در محاسبات ابری و محیطهای مجازی ایفا می کند زیرا تغییرات توپولوژی SAN را بدون نیاز به تغییر ساختار فیزیکی واقعی امکان پذیر میکند. VSAN ها همچنین مقیاس منابع ذخیره سازی را برای پشتیبانی از نوسانات Workload ها و اطمینان از افزونگی (Redundancy) شبکه آسانتر می کنند. اگر یک VSAN از کار بیفتد، میتوان سرویسها را به VSAN دیگری در همان شبکه فیزیکی تغییر داد.
ذخیره سازی هوشمند – Intelligent Storage
حجم روزافزون دادههای ناهمگون مجموعهای از نگرانیهای مرتبط با عملکرد، نگهداری و امنیت را با خود به همراه دارد. برای کمک به رفع این مشکلات، فروشندگان به طور پیوسته استفاده از مدلها و روشهای intelligent را در راهحل های ذخیره سازی خود را مد نظر قرار میدهند. ذخیره سازی هوشمند از هوش مصنوعی (AI) و سایر فناوریهای پیشرفته برای مدیریت فعال سیستمها، بهینه سازی عملکرد و رفع مشکلات احتمالی قبل از وقوع آنها استفاده میکند.
یک سیستم هوشمند به طور مداوم با جمع آوری و تحلیل دادهها، آموزش میبیند و به طور خودکار رفتار خود را بر اساس آن تنظیم میکند. این سیستم دادههای تلهمتری را از سیستمهای ذخیرهسازی شرکتکننده جمعآوری میکند، Data را جمعآوری و تجزیه و تحلیل میکند و سپس از آنچه یاد میگیرد برای نگهداری و بهینهسازی آن سیستمها استفاده میکند. هنگامی که راهحلهای ذخیرهسازی هوشمند بهطور مؤثر پیادهسازی شوند، میتوانند قابلیت اطمینان، امنیت، استفاده از منابع و عملکرد برنامهها را افزایش دهند.
یک سیستم ذخیره سازی هوشمند متکی به یک موتور تجزیه و تحلیل پیچیده است که از فناوریهای هوش مصنوعی مانند یادگیری ماشینی و یادگیری عمیق، همراه با سایر فناوری های پیشرفته، از جمله پیش بینی و تجزیه و تحلیل این پیش بینیها استفاده میکند. موتور ذخیرهسازی الگوها و ناهنجاریها را در دادهها به منظور پیشبینی مشکلات، پیشبینی روندها، شناسایی مشکلات عملکرد و رسیدگی به سایر مسائل احتمالی شناسایی میکند. در همان زمان، موتور به طور مداوم از داده های جمع آوری شده یاد میگیرد، که منجر به پیش بینیهای دقیقتر و متعاقبا سیستمهای ذخیره سازی کارآمدتر میشوند.
یک راهحل ذخیرهسازی هوشمند میتواند بهطور خودکار نتایج را پیشبینی کند و از بروز مشکلات جلوگیری کند، در حالی که اقداماتی را برای بهینهسازی عملکرد حجم کاری انجام میدهد و اطمینان میدهد که دادهها امن و مطابقت دارند. این راه حل ممکن است به شما در مورد مسائل مربوط به حریم خصوصی هشدار دهد، تهدیدات امنیتی را برطرف کند، به برنامه ریزی ظرفیت کمک کند، هنگامی که فضای ذخیره سازی کم است به شما اطلاع دهد، منابع را به بارهای کاری مجازی شده اختصاص دهد، یا عملیات های مختلفی را انجام دهد.
فروشندگان به روش های مختلف هوشمندی را در راه حل های ذخیره سازی خود وارد می کنند. به عنوان مثال، شرکت Hewlett-Packard (HPE) اطلاعات ذخیره سازی را از طریق سرویس InfoSight خود فراهم می کند، که داده های تله متری را در هر ثانیه از میلیون ها حسگر روی سیستم های پیاده سازی شده در سراسر جهان جمع آوری می کند. InfoSight به طور مداوم داده ها را تجزیه و تحلیل می کند و سپس نتایج آن تجزیه و تحلیل را برای سیستم های مشتری به کار می برد.
Dell EMC با تعبیه یک موتور یادگیری ماشین به طور مستقیم در راه حل های ذخیره سازی، رویکرد متفاوتی را اتخاذ می کند و این امکان را برای هر سیستمی فراهم می کند که به طور مستقل و بدون تکیه بر ورودی های خارجی مداوم، تصمیمات سریع بگیرد. موتور داده های جمع آوری شده از اجزای محلی را با استفاده از یک مدل یادگیری تقویت شده برای رسیدگی سریع به مسائل تخصیص تجزیه و تحلیل می کند.
با این حال، از مزایای دسترسی فوری به تجزیه و تحلیل فعلی در برابر یک مجموعه داده جهانی برخوردار نیست. با این اوصاف، مشتریان ذخیرهسازی Dell میتوانند از سرویس CloudIQ فروشنده نیز استفاده کنند، که نظارت، تجزیه و تحلیل و اطلاعات کافی را برای دستگاههای ذخیرهسازی Dell فراهم میکند. مزیت رویکرد Dell زمان پاسخگویی سریعتر است زیرا منتظر ورودی یک سرویس خارجی نیست.ر
ذخیره سازی محاسباتی (Computational Storage)
در معماری محاسباتی ذخیرهسازی سنتی، دادهها بین دستگاه ذخیرهسازی و حافظه رایانه حرکت میکنند، جایی که میتوان آنها را در پاسخ به درخواستهای برنامه پردازش کرد. تحت عملیات عادی، دادهها آزادانه بین این دو حرکت میکنند و با مشکلات تاخیر و تنگناهای کمی مواجه میشوند. با این حال، workload های مدرن مانند هوش مصنوعی یا تجزیه و تحلیل دادههای بزرگ میتوانند با مشکلات عملکردی مواجه شوند، زیرا درگاههای ورودی/خروجی که بین استوریج و مموری قرار میگیرند، پهنای باند محدودی دارند و نمی توانند تقاضا را برآورده کنند، در نتیجه bottleneck هایی ایجاد میشود که زمان پاسخ را کاهش میدهد.
برای رسیدگی به این مشکل، چندین تامین کننده اکنون راه حل های ذخیره سازی محاسباتی را ارائه میدهند که حداقل بخشی از پردازش را به خود پلتفرم ذخیره سازی منتقل میکند، رویکردی که گاهی اوقات به عنوان پردازش آنی (in-situ) از آن یاد می شود. ذخیره سازی محاسباتی منابع ذخیره سازی و محاسباتی را در لایه ذخیره سازی به هم نزدیک میکند، جایی که داده ها میتوانند از طرف سرور پیش پردازش شوند. این نه تنها مسیر دسترسی به دادهها را کوتاه میکند و جریان ترافیک و تاخیرهای ناشی از آن را کاهش میدهد، بلکه اجزای محاسباتی میتوانند از قابلیتهای پردازش موازی ذاتی یک راهحل ذخیرهسازی نیز بهره ببرند که منجر به عملکرد سریعتر میشود.
ذخیره سازی محاسباتی میتواند به طور بالقوه برای هر برنامه حساس به تاخیر که مقادیر زیادی داده را پردازش می کند، مفید باشد. همچنین ممکن است به نفع محاسبات edge و سناریوهای اینترنت اشیا (IoT) باشد، جایی که منابع محاسباتی اغلب از نظر اندازه محدود هستند. به عنوان مثال، شما ممکن است یک مجموعه داده عظیم را در محل جمع آوری کنید و سپس فقط نتایج جمع آوری شده را برای پردازش اضافی به حافظه سرور ارسال کنید. به این ترتیب، مقدار دادههایی را که باید از پورتهای ورودی/خروجی عبور کنند، کاهش میدهید، در حالی که تأثیر آن بر منابع محاسباتی را به حداقل میرساند که به نوبه خود آنها را برای workloadهای دیگر آزاد میکند.
اگرچه چندین تامین کننده اکنون سیستمهای ذخیره سازی محاسباتی را ارائه میدهند، این صنعت هنوز بسیار جوان است. به دلیل تفاوت در پیاده سازی، مواجه شدن با مسائل یکپارچه سازی غیر معمول نیست. خوشبختانه، انجمن صنعت شبکه ذخیره سازی (SNIA) روندی را برای تعریف استانداردهای interface، تهیه، مدیریت و ایمن سازی دستگاههای ذخیره سازی محاسباتی آغاز کرده است.
حافظه کلاس ذخیره سازی – Memory Class Storage
صورت قطعی برق حفظ کند). SCM همچنین هزینه بایت کمتری نسبت به DRAM دارد، در حالی که عملکرد قابل توجهی در مقایسه با NAND دارد و حتی ممکن است استقامت بیشتری نسبت به NAND نشان دهد.
مانند ذخیره سازی محاسباتی، SCM هنوز یک فناوری جوان است، اما برای پیشبرد آن تلاشهای زیادی در جریان است و اینتل در خط مقدم قرار دارد. احتمالا SCM را خواهیم دید که به عنوان حافظه پایدار، PMEM یا P-MEM نیز شناخته میشود. برخی منابع بسته به نحوه اجرای فناوری، بین SCM و حافظه پایدار تمایز قائل می شوند، اما چنین ناسازگاریهایی در صنعت نوپایی مانند SCM رایج است و بدون شک این صنعت در نهایت بر روی یک نام گذاری مشترک به توافق خواهد رسید.
بحثهای پیرامون SCM اغلب حول ایده یک لایه جدید در سلسله مراتب حافظه/ذخیرهسازی، با ماژولهای SCM که بین DRAM و NAND flash قرار دارند، متمرکز میشوند. مانند DRAM، دستگاه SCM قابلیا آدرس دهی بایت را دارا است و میتواند مستقیما به فضای حافظه سرور متصل شود و روشی موثر برای پشتیبانی از برنامههای حساس به تاخیر که به حافظه بیشتری نسبت به DRAM میتواند عملا ارائه کند، نشان میدهد.
SCM با پر کردن شکاف بین حافظه سنتی و ذخیرهسازی، دسترسی برنامهها به مجموعه دادههای بزرگ را از طریق فضای حافظه سیستم امکانپذیر میسازد که در نتیجه عملیات read/write بسیار سریعتر میشود. در عین حال، یک دستگاه SCM میتواند از دسترسی در سطح بلوک مانند NAND flash پشتیبانی کند و تطبیق پذیری بیشتری نسبت به DRAM یا NAND ارائه دهد.
در ابتدا، بیشتر تمرکز روی فناوری SCM بر روی دستگاههایی بود که میتوان از آنها به عنوان حافظه پنهان یا جایگزین SSD استفاده کرد. اینتل با خط SSD های Optane DC خود که بسیار شبیه به SSD های NAND flash کار میکنند، در این تلاش پیشتاز شد.
اخیرا، اینتل ماژولهای حافظه پایدار Optane DC خود را معرفی کرده است. اینها مستقیما به اسلاتهای استاندارد حافظه داخلی دوگانه (DIMM) متصل میشوند. یک ماژول Optane میتواند تا 512 گیگابایت داده را ذخیره کند، که بسیار بیشتر از DRAM امروزی است، اگرچه چنین ظرفیتهایی ممکن است در آینده نزدیک برای DRAM رایج تر شوند. به این ترتیب، ماژول میتواند به عنوان یک لایه ذخیره سازی بین DRAM و فلش NAND عمل کند و ما را به هدف اصلی SCM نزدیکتر کند.
همچنین می توان از SCM به جای DRAM استفاده کرد. اگرچه ماژولهای SCM کندتر هستند، اما توانایی آنها در ماندگاری دادهها، آنها را بهعنوان دستگاههای قابل بوت مناسب میسازد. به عنوان مثال، ممکن است از SCM برای سرور تولیدی استفاده کنید که باید پس از راه اندازی مجدد برنامه ریزی شده یا برنامه ریزی نشده، در سریع ترین زمان ممکن راه اندازی و اجرا شود.
حافظه پایدار Optane DC مبتنی بر فناوری 3D XPoint است که نشان دهنده تلاش مشترک اینتل و فناوری Micron است. Micron اخیرا اولین محصول خود را بر اساس XPoint سه بعدی، X100 SSD منتشر کرده است که همان مسیر اینتل را با اولین معرفی یک SSD دنبال می کند. با این حال، 3D XPoint تنها تلاش در حال انجام SCM در حال انجام نیست. سایر فروشندگان بر روی راه حلهای خود بر اساس فناوریهایی مانند RAM مغناطیسی (MRAM) و رم نانولوله (NRAM) کار میکنند.
حرکت به سوی آینده
البته البته که این فناوریها بسیار گستردهتر و پیچیدهتر از چیزی است که من بتوانم در یک مقاله پوشش دهم، و همچنین بسیاری از فناوریهای نوظهور دیگر، مانند ذخیرهسازی 5 بعدی، که از فناوری لیزر فوق سریع برای جاسازی دادهها استفاده میکند، وجود دارد.
ذخیره سازی 5 بعدی این پتانسیل را دارد که تا 360 ترابایت داده را بر روی یک دیسک سیلیسی 12 سانتی متری ذخیره کند و این داده ها برای بیش از 13 میلیارد سال زنده می مانند. در واقع، دیسکی حاوی کل سری بنیاد اسحاق آسیموف در حال حاضر به دور خورشید ما میچرخد، که در تسلا رودستر قرمز گیلاسی ایلان ماسک و روی موشک فالکون هوی اسپیس ایکس که در فوریه 2018 پرتاب شد، قرار گرفته است.
مانند دیسک سیلیسی در حال گردش، فناوریهای ذخیرهسازی در حال بهبود دائمی هستند و آینده ذخیرهسازی نامشخص و در عین حال هیجانانگیز است. آنچه مسلم است این است که حجم دادهها همچنان افزایش مییابد، دادهها به طور فزایندهای متنوع و توزیع میشوند، و حجم کاری که با آن دادهها مدیریت میکند پیچیدهتر و فشردهتر میشود و تقاضاهای بیشتری را برای ذخیرهسازی بیش از همیشه ایجاد میکند.
فنآوریهای ذخیرهسازی آینده باید هم حجم و هم پیچیدگی دادهها را تطبیق دهند و در عین حال از برنامههایی پشتیبانی کنند که هر روز پیچیدهتر و قویتر میشوند. فناوریها همچنین باید تضمین کنند که دادهها در برابر حملات سایبری که پیچیدهتر و قویتر میشوند، ایمن و محافظت میشوند. راهحلهای ذخیرهسازی مدرنی که اکنون در حال ظهور هستند، مسیری را به سوی آن آینده روشن میکنند، اما برای رسیدگی به چالشهای بیشماری که در برابر ما قرار دارند، کافی نیستند و نسل جدیدی از فناوریهای نوآورانه را پیشروی میکنند.