سحابة ضخمة تسبب الانقطاع الناجم عن منطقة US-EAST-1 الرئيسية لشركة Amazon Web Services، ومركزها بالقرب من مبنى الكابيتول الأمريكي في شمال فيرجينيا، في اضطرابات واسعة النطاق لمواقع الويب والمنصات في جميع أنحاء العالم صباح يوم الاثنين. عانت منصة التجارة الإلكترونية الرئيسية في أمازون وغيرها من الممتلكات، بما في ذلك أجراس الباب Ring ومساعد Alexa الذكي، من الانقطاعات والانقطاعات طوال الصباح، كما حدث مع منصة اتصالات Meta التابعة لشركة Meta، وChatGPT من OpenAI، ومنصة الدفع Venmo من PayPal، وخدمات الويب المتعددة من Epic Games، والعديد من المواقع الحكومية البريطانية، وغيرها الكثير.
نشأ الانقطاع عن واجهات برمجة تطبيقات قاعدة بيانات “DynamoDB” الخاصة بأمازون في US-EAST-1، وقالت AWS في تحديثات الحالة أن المشكلة كانت تتعلق على وجه التحديد بمشكلات حل DNS. “نظام اسم المجال” هو خدمة إنترنت أساسية تعمل بشكل أساسي كبحث تلقائي في دليل الهاتف لترجمة عناوين URL على الويب مثل “www.wired.com” إلى عناوين IP للخادم الرقمي حتى تعرض متصفحات الويب للمستخدمين المحتوى الصحيح. تحدث مشكلات “حل” DNS عندما لا تقوم خوادم DNS بتوصيل هذه النقاط بدقة، وللحفاظ على تشبيه دليل الهاتف، فإنها توفر أرقامًا خاطئة لاسم معين، أو العكس.
وكتبت AWS في تحديثات الحالة يوم الاثنين: “استنادًا إلى تحقيقنا، يبدو أن المشكلة مرتبطة بحل DNS لنقطة نهاية DynamoDB API في US-EAST-1”. بعد فترة وجيزة أضافت الشركة: “إذا كنت لا تزال تواجه مشكلة في حل نقاط نهاية خدمة DynamoDB في US-EAST-1، فنوصي بمسح ذاكرة التخزين المؤقت لنظام أسماء النطاقات لديك.”
لم يستجب المتحدث باسم AWS على الفور عندما سئل عن تفاصيل حول طبيعة الفشل. يمكن أن تكون مشكلات تحليل DNS ضارة — تُعرف باسم اختطاف DNS — ولكن لا يوجد ما يشير إلى أن انقطاعات AWS يوم الاثنين كانت شائنة.
يقول دافي أوتينهايمر، مدير العمليات الأمنية والامتثال منذ فترة طويلة ونائب الرئيس في شركة Inrupt للبنية التحتية للبيانات: “عندما لم يتمكن النظام من تحديد الخادم الذي سيتم الاتصال به بشكل صحيح، أدت حالات الفشل المتتالية إلى تعطيل الخدمات عبر الإنترنت”. “يعد انقطاع خدمة AWS اليوم مشكلة توفر كلاسيكية، ونحن بحاجة إلى البدء في رؤيتها على أنها فشل في تكامل البيانات.”
بدأت المشاكل حوالي الساعة 3 صباحًا بالتوقيت الشرقي. بحلول الساعة 5:22 صباحًا بالتوقيت الشرقي، كانت AWS قد طبقت “عمليات التخفيف الأولية” التي بدأت تدخل حيز التنفيذ. في الساعة 6:35 صباحًا بالتوقيت الشرقي، قالت أمازون إنها عالجت المشكلات الفنية الأساسية بشكل كامل ولكن “بعض الخدمات سيكون لديها تراكم للعمل، الأمر الذي قد يستغرق وقتًا إضافيًا للمعالجة الكاملة”.