هندسة موثوقية المواقع (SRE)
اجعل الموثوقية نتيجة قابلة للقياس ومُهندَسة بدلًا من إطفاء حرائق دائم.

نظرة عامة
تطبّق هندسة موثوقية المواقع هندسة البرمجيات على العمليات لجعل الخدمات موثوقة وقابلة للتوسع وفعالة. نعرّف أهداف مستوى الخدمة وميزانيات الأخطاء التي تضع رقمًا للموثوقية المقبولة، ثم نستخدمها للموازنة بين طرح الميزات والاستقرار. نؤتمت الأعمال المتكررة، ونحسّن الاستجابة للحوادث، ونقلل من حالات الفشل المتكررة التي توقظ الفرق في الثالثة فجرًا.
المنهجية والمعايير
ممارسات Google SRE بما في ذلك SLOs وSLIs وميزانيات الأخطاء وتقليل الأعمال المتكررة، والتحليلات اللاحقة بلا لوم، وممارسات إدارة الحوادث المتوافقة مع NIST SP 800-61 للحوادث ذات الصلة بالأمن.
ما الذي يتضمّنه
ما الذي تحصل عليه
الأسئلة الشائعة
هدف مستوى الخدمة هو غاية للموثوقية، مثل نجاح 99.9 بالمئة من الطلبات. الفجوة بين تلك الغاية و100 بالمئة هي ميزانية أخطائك. عندما تكون الميزانية سليمة يمكنك الطرح بشكل أسرع، وعندما تُستنفد تركز على الاستقرار. يحوّل ذلك الموثوقية إلى قرار مشترك ومدفوع بالبيانات.
يتداخلان لكنهما يختلفان في التركيز. DevOps ثقافة واسعة للتسليم السريع والموثوق. أما SRE فهو تنفيذ محدد ومقاد بالهندسة للموثوقية باستخدام SLOs وميزانيات الأخطاء وتقليل الأعمال المتكررة. تشغّل العديد من المؤسسات ممارسات SRE ضمن نهج DevOps أوسع.