5 علامات تحذير من فشل المعدات الحرجة

مؤلف: Judy Howell
تاريخ الخلق: 25 تموز 2021
تاريخ التحديث: 23 يونيو 2024
Anonim
Marvel’s Guardians of the Galaxy - All Collectible Locations Guide
فيديو: Marvel’s Guardians of the Galaxy - All Collectible Locations Guide

المحتوى


يبعد:

تخفيض فترة التوقف من خلال التخطيط المسبق الدقيق قد يعني الفرق بين نمو الأعمال والانخفاض. هذا حيث الوقت المتوسط ​​بين الفشل يأتي في.

لا تقلل من شأن عدد الشركات الحالية التي تعتمد على الأنظمة الحيوية كل يوم. هذا هو السبب في أن المنطق الوحيد الذي يجعل المؤسسة قادرة على قياس خطر تعطل المعدات. مع عدم وجود ضمانات بموعد تعطل قطعة من المعدات ، يجب أن يكون هناك على الأقل تقدير دقيق لمتى لم يعد بالإمكان الاعتماد عليها.

قد لا يبدو أن إحدى المعدات غير المرئية خلاف ذلك أمر حاسم بالنسبة لشركة ما ، ولكن عندما تفشل مروحة تبريد واحدة ، وتتسبب في تخلي مولد عن الشبح ، ويسبب عشرات أو حتى مئات الآلاف من المستخدمين مشاكل مكلفة لفترة طويلة ، يمكنك لاحظ أن قدرتك على تقدير مكونات البنية الأساسية الخاصة بك قد تفشل - ومتى - لها أهمية قصوى. وهذا هو الوقت الذي يأتي فيه متوسط ​​الوقت بين الإخفاقات (MTBF) ، وهي الطريقة التي يعتمد عليها متخصصو تكنولوجيا المعلومات لتقديمها بدقة التقديرات حول متى ستفشل المعدات الهامة. هنا نلقي نظرة على ما يقتل أخيرًا بعض الأنواع الشائعة من المعدات الحيوية ، وكيف يمكن أن تساعد MTBF في إنقاذ اليوم.


ما هو MTBF؟

يتم تعيين رقم طراز فريد لكل قطعة من معدات تكنولوجيا المعلومات المصنعة. يتم تزويد العملاء الذين يلعبون دوراً ما في البنية التحتية الحيوية للعملاء بتقدير MTBF. تتم العمليات الحسابية المعقدة للعمل على MTBF للحصول على قطعة من المعدات أثناء مرحلة الاختبار المطولة في بحث وتطوير المنتجات وهي خاصة نسبيًا بطراز معين.

إذا كنت تبحث عن MTBF لقطعة معينة من المعدات ، فستجدها في ورقة المواصفات التفصيلية التي توفرها الشركة المصنعة. يمكنك أيضا الاتصال بالشركة المصنعة مباشرة.

التوجيه

يشتمل جهاز التوجيه على مستوى المؤسسات على العديد من الأجزاء وبعضها متحرك وآخر ثابت. تحتوي وحدات إمداد الطاقة (PSU) ومراوح التبريد على أجزاء متحركة ، وعناصرها التي تميل إلى أن تكون نقاط فشل ، خاصة إذا لم تكن الوحدة موجودة داخل مركز بيانات خالٍ من الغبار نسبيًا. لحسن الحظ ، مع بعض مدخلات المسؤول معظم أجهزة التوجيه سوف يقدم تقريرا إلى سيسلوغ مرفق ، بحيث يمكن وضع علامة أي مكونات الفاشلة.

مفاتيح

على نفس المنوال ، فإن المستوى التالي داخل شبكة المؤسسة هو جهاز التبديل. على الرغم من أن المحولات في فئة المؤسسات تميل أيضًا إلى الاعتماد على المراوح ، إلا أن عددها أقل عادةً من تلك الموجودة في هيكل جهاز التوجيه. إذا كانت آليات تدوير المعجبين سليمة ، فإن المحول المعيب عادةً ما يسيء التصرف على مستوى البرنامج ، إما عن طريق تعطيل منفذ التبديل بشكل غير متوقع أو ، بشكل أكثر شيوعًا ، عرض سلوك غير عادي مثل إسقاط الحزم أو التسبب في مستويات متفاوتة من تعطيل حركة المرور أو تغيير غير صحيح الإعدادات المعرفة من قبل المستخدم دون أن يطلب منك ذلك.


تعلن شركة Cisco العملاقة عن الشبكات أن أحد أجهزة التوجيه لديها يبلغ MTBF 188،574 ساعة لطراز Cisco Catalyst 3750G-24TS. إذا قمنا بتقسيم ذلك على 8،765.81277 (عدد الساعات في السنة) ثم نرى أن هذا النموذج لديه تقدير MTBF حوالي 21.5 سنة. هذا الرقم من بعض الطمأنينة عندما تفكر في أن هذا الجهاز يحتاج إلى أداء جيد 24/7 دون خطأ ، على الرغم من أنه بطبيعة الحال في الواقع مجرد مؤشر على موثوقيتها. على الرغم من ذلك ، فإنه يمنح المستخدمين تخمينًا مستنيرًا بشأن المدة التي يتوقع أن تستمر بها هذه المعدات.

قوة مرنة

يمكن أن توفر مصادر الطاقة غير المنقطعة (UPS) التي يتم توصيلها بعدد كبير من البطاريات طاقة احتياطية داخل المؤسسة خلال فترة زمنية قصيرة قبل أن تتدفق المولدات أثناء انقطاع التيار الكهربائي. يمكن أن تحدث أخطاء معينة في البرامج داخل UPS ، كما هو الحال مع أي قطعة من المعدات ، ولكن بشكل عام ، فإن البطاريات التي تستمد منها الطاقة عادة ما تسبب القلق الأكبر. إذا كانت بطارية UPS متكررة التشغيل وإعادة الشحن ، فسوف تقل قدرتها بسرعة أكبر وسيختصر وقت التشغيل بشكل كبير. ليس من المستغرب أن تفشل بطاريات UPS تمامًا. يمكن لشركة UPS الإبلاغ عن أجهزة المودم والشبكات عندما تتطور الأعطال ، ولكن في أكثر الأحيان ، ستنشئ UPS أقدم إنذارات مسموعة عند نشوء مشكلة في البداية.

No Bugs، No Stress - دليلك خطوة بخطوة لإنشاء برامج لتغيير الحياة دون تدمير حياتك

لا يمكنك تحسين مهارات البرمجة لديك عندما لا يهتم أحد بجودة البرنامج.

التخزين المحمي

أصبحت الأقراص الصلبة التي نستخدمها اليوم والاعتماد عليها بدرجة عالية أكثر موثوقية خلال العقد الماضي أو نحو ذلك. ومع ذلك ، فهي بعيدة عن أن تكون معصومة ، وبناءً على الدراسة التي قد تصدقها ، يبدو أنها تعمل بشكل صحيح لفترة أطول اعتمادًا على عدد من العوامل. (يمكن العثور على جزء كبير من الرأي حول هذا الأمر هنا في The Remarketer.) إذا تم تمكين إعداد التقارير المفصلة وكان محرك الأقراص يوفر ملاحظات حول الأخطاء ، فإن القطاعات الفاشلة وفشل القراءة / الكتابة هي مفتاح اكتشاف موقع قرص داخل صفيف تخزين هو الفشل. هناك مشكلة أخرى شائعة داخل الخوادم التي تستخدم عدة أقراص متصلة بوحدة تحكم RAID وهي أن وحدة التحكم نفسها ستفشل. لسوء الحظ ، تتوقف الأقراص الثابتة في بعض الأحيان عن العمل دون أي تحذير على الإطلاق ، وهي مشكلة يصعب الوقاية منها بشكل موثوق.

الخوادم

بصرف النظر عن محركات الأقراص المدمجة في الخوادم والأجزاء المتحركة ، مثل مراوح التبريد المذكورة أعلاه ووحدات PSU ، يمكن أن تنشأ أيضًا عدد من المشكلات داخل مكونات أجهزة الخوادم. يعد إعداد التقارير على مستوى البرنامج (والذي يشير عادةً إلى BIOS أو تشخيصات مكونات الأجهزة الأخرى ذات المستوى المنخفض) مفتاحًا لاكتشافه عندما تفشل الأشياء أو ، والأهم من ذلك ، تظهر علامات الفشل. إحدى المشكلات التي قد لا تكون واضحة على الفور هي تلك التي تؤثر على اللوحات الأم. من المنطقي تمامًا ألا تكره الآلات الكثير من الحرارة. ولكن حتى اليوم ، إذا تعرضت لوحة الدوائر الحديثة لخسارة حرارة سريعة - أو انتقلت من التشغيل الشديد إلى أن تصبح باردة فجأة - فقد تظهر تشققات ، مما يتسبب في فشل اللوحة بشكل كارثي. إنها مشكلة يجب مراعاتها ، خاصة إذا كنت تقوم بنقل المعدات بين المباني داخل إطار صيانة لا يرحم.

MTBF: يمكن أن تفشل للغاية

مفيدة كتنبؤات MTBF ، من المهم حساب مستويات المخاطر المقبولة باستخدام أي معدات يجب أن تعتمد عليها الشركة. لسوء الحظ ، حتى مع كل التطمينات الإحصائية المقدمة من قبل الشركات المصنعة ، فإن الطريقة الملموسة الوحيدة لضمان توفر المعدات التي تدير أنظمة مهمة هي مضاعفة ذلك لتمكين تجاوز فشل المهلة.

تتكون كل قطعة من الأجهزة الفردية المستخدمة في المؤسسة من العديد من المكونات المختلفة ، لذلك فإن MTBF الحقيقي بعيد عن الحساب البسيط. من الواضح أنه من الأهمية بمكان ألا ترتكز على مستقبل الأعمال وفقًا لقياسات الاحتمالية هذه ، ولكن بدلاً من ذلك تستخدمها كمعيار لاتخاذ قرارات مستنيرة فيما يتعلق بإجراءات استمرارية العمل واستعادة القدرة على العمل بعد الكوارث. بعد كل شيء ، قد يعني تقليل وقت التوقف عن العمل من خلال التخطيط المسبق الدقيق الفرق بين فشل الأعمال التجارية والنجاح.