2019-01-10

Fail-over and fail-back


تجاوز الفشل fail-over
تجاوز الفشل هو وضع للتشغيل الاحتياطي يتم فيه تشغيل وظائف النظام الأساسية (مثل المعالج أو الخادم أو الشبكة أو قاعدة البيانات ، على سبيل المثال) بواسطة نظام ثانوي أخر، وذلك عندما يصبح النظام الأساسي غير متاح نتيجة للفشل فى أداء مهامه أو أن النظام الأساسي غير متاح نتيجة لتوقفه لإجراء عمليات صيانة أو ما شابه ذلك.
تستخدم أنظمة تجاوز الفشل في جعل الأنظمة أكثر اعتمادية وتحملاً للخطأ fault-tolerant، وعادة ما يكون نظام تجاوز الفشل جزأ لا يتجزأ من أنظمة المهام الحرجة التي يجب أن تكون متاحة للعمل باستمرار.


يعتمد نظام تجاوز الفشل على توزيع المهام تلقائياً إلى نظام احتياطي بحيث تكون خطوات سير العمل طبيعاً قدر الإمكان بالنسبة للمستخدم النهائي. يمكن تطبيق نظام تجاوز الفشل على أي جانب من جوانب النظام: فبالنسبة لأجهزة الكمبيوتر الشخصى، قد يكون تجاوز الفشل هو عبارة عن آلية لحماية ضد معالج فاشل. بينما داخل الشبكة يمكن تطبيق نظام تجاوز الفشل على أياً من مكونات الشبكة، مثل الكابلات، أو وسائط التخزين أو الخوادم.

في العادة يتم تخزين البيانات فى الخوادم، في مثل هذه البيئة يكون فشل الخادم فى أداء وظيفته (أو حتى فى حالة عمل صيانة للخادم) يجعل الوصول إلى البيانات مستحيلاً لعدد كبير من المستخدمين حتى يتم إعادة الخادم إلى العمل مرة أخرى. وكحل لهذه المشكلة يمكن إستخدام وسائط التخزين الشبكية storage area network ، التى تجعل الوصول إلى البيانات المخزنة على الشبكة ممكن بين أي جهاز وبين أنظمة تخزين البيانات.

بشكل عام ، تستخدم وسائط التخزين الشبكية storage area network العديد من المسارات بين الخادم والنظام. فى حالة فشل اياً من هذه المسارات يتم استخدام مسارات بديلة لضمان استمرار الخدمة والوصول إلى البيانات. يتم استخدام مسارات متعددة للبيانات، للمساعدة في التأكد من أن الاتصال لا يزال قابلاً للتطبيق وحتى في حالة فشل مسار واحد (أو أكثر).

القدرة على تجاوز الفشل التلقائي يعني أنه يمكن الحفاظ على الوظائف العادية على الرغم من الانقطاعات المحتومة الناجمة عن مشاكل في المعدات.

العودة بعد الفشل fail-back
العودة بعد الفشل، هو عملية استعادة الخدمة إلى الجهاز أو النظام الأساسي بعد أن كان قد تم نقلها إلى جهاز أو نظام ثانوي أثناء عملية تجاوز الفشل.

أثناء تجاوز الفشل على مستوى الموقع ، يتم نقل كافة العمليات التى تتم على النظام من الموقع الأساسي إلى موقع مؤقت للتعافي من الكوارث disaster recovery - DR. يتم تعقب أي تغييرات على البيانات بحيث يمكن استعادة الموقع الأصلي عن طريق نسخ البيانات بين بداية ونهاية الحدث DR. أثناء عملية العودة من الفشل الفعلية ، تتم إعادة مزامنة البيانات قبل استعادة العمليات إلى الموقع الأصلي.



المصدر:
https://whatis.techtarget.com/definition/failback



ليست هناك تعليقات:

إرسال تعليق