إذا واجهتك في الساعات القليلة الماضية صفحات فارغة، أو أخطاء 500، أو مواقع ويب لا يتم تحميلهاليس العيب في هاتفك أو جهاز التوجيه أو مزود خدمة الإنترنت. ما فشل مرة أخرى هو أحد المكونات الرئيسية للبنية التحتية للإنترنت: تعرضت Cloudflare لانقطاع عالمي آخر مما أدى إلى حرمان نصف سكان العالم من الوصول إلى العديد من الخدمات.
يحدث هذا الحادث بعد أسابيع فقط من انقطاع التيار الكهربائي الهائل مرة أخرى يرتبط هذا أيضًا بشركة Cloudflare، التي أثارت مخاوف جدية بشأن موثوقية كبار مزودي خدمات السحابة وشبكات توصيل المحتوى. مرة أخرى، توقف جزء كبير من الحياة الرقمية في إسبانيا وأوروبا لفترة طويلة، مما جعل المستخدمين عاجزين عن التدخل.
ماذا حدث مع الانقطاع الأخير لـ Cloudflare؟
حول ال 9:45-10:00 صباحًا (بتوقيت شبه الجزيرة الإسبانية)بدأ آلاف المستخدمين بالإبلاغ عن فشل تحميل العديد من مواقع الويب المألوفة أو ظهور أخطاء "خطأ الخادم الداخلي 500" والصفحات الفارغة تمامًا. منصات مراقبة مثل Downdetector لقد بدأوا في الامتلاء بالتنبيهات، إلى درجة أن موقع Downdetector نفسه... كما واجهت مشاكل في الوصول في بعض الأحيان.
في صفحة الحالة الرسمية للشركة، أقرت Cloudflare بذلك كنت أقوم بالتحقيق في الأخطاء الموجودة في لوحة المعلومات وواجهات برمجة التطبيقات ذات الصلةوأوضحت الشركة أن الطلبات المقدمة لهذه الخدمات قد تفشل أو تعرض أخطاء، وهو ما أدى عمليًا إلى آلاف المواقع التي لم تستجب أو التي تم تحميلها جزئيًا فقط.
في نفس الوقت تقريبًا، كانت الشركة قد حددت موعدًا الصيانة في العديد من مراكز البياناتبما في ذلك تلك الموجودة في شيكاغو (ORD) وديترويت (DTW) وبوغوتا. على الرغم من أنه لم يكن واضحًا في البداية ما إذا كانت هناك علاقة مباشرة، إلا أن Cloudflare أكدت لاحقًا أنه بالإضافة إلى لوحة التحكم، تأثرت خدمات مثل Cloudflare Workers، والتي تنفذ التعليمات البرمجية مباشرة على شبكتك وهي ضرورية لجميع أنواع العمليات الديناميكية على مواقع الويب الحديثة.
يوضح هذا الخطأ في Workers السبب في العديد من الصفحات سيتم تحميل الصفحة الرئيسية، ولكن الوظائف المهمة مثل عربات التسوق، وتسجيل الدخول، والنماذج ستعيد أخطاء.بالنسبة للمستخدم، فقد شعر وكأن الإنترنت قد انقطع دون سبب واضح، على الرغم من أن الاتصال المنزلي كان يعمل بشكل طبيعي.
ووفقا للتقارير، بدأت المشاكل الأولى قبل الساعة العاشرة بقليلبحلول الساعة 10:12 صباحًا، كانت الشركة قد أبلغت بالفعل عن وجود تم تنفيذ الحل وراقبتُ النتائج. في إسبانيا، بدأت العديد من المواقع الإلكترونية بالعودة إلى وضعها الطبيعي طوال الصباح، بينما كانت عملية الاستعادة في دول أخرى أكثر تقطعًا.
ما هو Cloudflare بالضبط ولماذا يمكنه "إغلاق" نصف الإنترنت؟

لفهم سبب وقوع حادث في هذه الشركة لإخراج نصف الإنترنت من اللعبةمن الجدير بالذكر ما هي Cloudflare وما هو دورها. إنها ليست مجرد خدمة استضافة ويب بسيطة، بل هي شبكة توصيل المحتوى (CDN) ومزود خدمة الأمان والتي تقع بين خوادم الشركة والمستخدمين النهائيين.
في الممارسة العملية، يعمل Cloudflare مثل طريق سريع ضخم ودرع في الوقت نفسه، يُخزّن نُسخًا من مواقع الويب على خوادم موزعة حول العالم، مما يُحسّن سرعة تحميل الصفحات ويُمكّنها من التعامل مع ارتفاعات حركة المرور دون تعطل. من جهة أخرى، يعمل كبوابة، فيُرشّح هجمات حجب الخدمة الموزعة (DDoS)، وحركة المرور الضارة، والروبوتات، ويحمي الشهادات، ويعمل كجدار حماية للتطبيقات، ويُدير جزءًا من عملية التوجيه.
هذا النموذج له نتيجة واضحة واحدة: مركزية كمية كبيرة من حركة المرورعندما يعمل كل شيء على ما يرام، يسمح ذلك لمواقع الويب بجميع أحجامها بالعمل بسرعة وأمان. ولكن عندما تواجه Cloudflare انقطاعًا، يكون الأمر كما لو تم قطع الطريق السريع الرئيسي الذي يربط المستخدمين بآلاف الخدمات: لا تزال المواقع موجودة على خوادمها الأصلية، لكن الطريق للوصول إليها محظور.
لذلك، في مواجهة هذا الانخفاض، رأى العديد من المستخدمين أن كانت شبكة WiFi الخاصة بهم تعمل؛ وكان بإمكانهم فتح مواقع ويب أخرى لا تعتمد على Cloudflare.لكنهم لم يتمكنوا من الوصول إلى منصات معينة، أو تسجيل الدخول، أو إتمام عمليات الشراء. نجحت جميع محاولاتهم، مثل إعادة تشغيل جهاز التوجيه، أو تفعيل وضع الطيران، أو حتى إعادة ضبط إعدادات الشبكة على أجهزتهم المحمولة. لقد كان عديم الفائدة تمامالأن المشكلة كانت خارج أجهزتهم.
الوضع يذكرنا بما حدث بالفعل نوفمبر 18عندما تعرضت خدمات شائعة مثل Cloudflare لحادث آخر X (Twitter سابقًا)، ChatGPT، Canva أو Ikeaفي تلك المناسبة، انتهت الشركة إلى توضيح أن تغييرًا في أذونات قاعدة البيانات الداخلية تسبب في قيام نظام إدارة الروبوت الخاص بها بإنشاء آلاف الأسطر الإضافية في ملف بالغ الأهمية، حتى لقد تضاعف حجم الملف وتجاوز الحد الذي يستطيع البرنامج التعامل معه.مما أدى إلى الانهيار.
الخدمات المتأثرة: من البنوك الإسبانية إلى ألعاب الفيديو ومنصات الذكاء الاصطناعي
قائمة الخدمات المتأثرة بهذا الانقطاع الجديد طويلة، وفي كثير من الحالات، مألوف جدًا للمستخدمين الإسبان والأوروبيينوفي المجالات المهنية والاجتماعية، تم الإبلاغ عن مشاكل في لينكد إنالتي فشلت في بعض الأحيان في التحميل، أو عرضت صفحات فارغة، أو منعت تسجيل الدخول، وفي العمل التعاوني وأدوات التصميم مثل Canvaوالتي كانت غير متاحة بشكل مباشر للكثيرين.
وفي مجال الترفيه الرقمي تأثروا ألعاب الفيديو عبر الإنترنت ومنصات الترفيه كما Fortnite، Valorant، League of Legends أو متجر Epic Gamesأبلغ المستخدمون عن عدم قدرتهم على الوصول إلى المباريات أو تحديث اللعبة أو حتى تشغيل التطبيقات. كما ظهرت مشاكل في خدمات مثل Crunchyroll ومنصات المحتوى الأخرى.
وتعرضت التجارة الإلكترونية في إسبانيا ودول أوروبية أخرى لضربة قوية. المتاجر عبر الإنترنت ذات حركة المرور العالية مثل MediaMarkt، وPCComponentes، وDecathlon، أو Vinted واجهت هذه الشركات أعطالًا، بدءًا من الصفحات الرئيسية التي لم تتمكن من التحميل، وصولًا إلى عربات التسوق التي ظهرت فيها أخطاء. بالنسبة للعديد من هذه الشركات، كانت بضع دقائق من التوقف كافية. ويؤدي هذا إلى خسارة المبيعات وسيل من الشكاوى. في الشبكات الاجتماعية.
كان القطاع المالي من أكثر المجالات حساسية. ووفقًا للتقارير التي جمعتها منصات الرصد، بنوك مثل CaixaBank و Bankinter لقد عانوا من فشل في الوصول إلى مواقعهم الإلكترونية وخدماتهم الرقمية، مما أدى إلى لقد أدى ذلك إلى منع تنفيذ العمليات العادية لفترة من الوقت.ورغم أن المشاكل كانت مؤقتة في معظم الحالات، فإن مجرد عدم القدرة على الوصول إلى البنك عبر الإنترنت يولد شعوراً كبيراً بعدم الأمان بين العملاء.
ال أدوات الذكاء الاصطناعي وكانوا أيضًا من بين الأكثر تضررًا. مستخدمو ChatGPT، كلود، الحيرة أو الجوزاء أبلغوا عن انقطاعات، أو بطء شديد في الاستجابة، أو انعدام تام في الوصول إلى المنصات. وطوال معظم فترة الحادث، أصبحت الذكاء الاصطناعي الأكثر شعبية عاجزة عن الكلام حرفيًا. بالنسبة للعديد من المستخدمين، وخاصة في أوروبا ودول أخرى حيث تركز Cloudflare بعضًا من حركة المرور.
التأثير في إسبانيا وأوروبا: ما تم ملاحظته من هنا
ومن وجهة نظر المستخدمين الأوروبيين، كان يُنظر إلى الانخفاض على أنه انقطاع جديد للإنترنت في الصباحبينما تزامن الحادث على الساحل الشرقي للولايات المتحدة مع ساعات الصباح الباكر، فقد وقع في إسبانيا صباح يوم الجمعة العامل، وهو الوقت الذي تكون فيه العديد من الشركات في مرحلة التشغيل الكامل.
في بلدنا، تتراكم الشكاوى على وسائل التواصل الاجتماعي عندما تصبح المواقع الإلكترونية الشائعة مثل Decathlon، MediaMarkt، Vinted أو منصات التعليم عبر الإنترنت المختلفة توقفوا عن الاستجابة. تفاقم هذا الوضع بسبب انقطاع الخدمة في البنوك وخدمات مكالمات الفيديو مثل زوموقد أدى هذا إلى تعقيد اليوم أكثر بالنسبة لأولئك الذين يعتمدون على هذه الأدوات في العمل.
بالإضافة إلى ذلك، تستخدم العديد من وسائل الإعلام الإسبانية Cloudflare لتسريع وحماية مواقعها الإلكترونية. لقد تعرضوا للسقوط المتقطعوكانت بعض بوابات الأخبار بطيئة في التحميل، أو تظهر أخطاء، أو تعرض محتوى غير كامل، مما يعوق الوصول إلى المعلومات على وجه التحديد عندما كان هناك اهتمام أكبر بمعرفة ما يحدث.
ومن المثير للاهتمام أنه في حين أن معظم دول الاتحاد الأوروبي لاحظت الحادث بوضوح، أشارت بيانات حالة Cloudflare الخاصة إلى أن خدماتها لا تزال "عاملة" في بعض البلدانيتم تفسير هذا التناقض الواضح من خلال حقيقة أن جميع المناطق والطرق والخدمات لم تتأثر بالتساوي: كانت هناك مناطق ذات خدمة مستقرة وأخرى حيث فشلت منتجات معينة (مثل العمال أو أجزاء من واجهة برمجة التطبيقات) بشكل متكرر.
كما تم الإبلاغ عن مشاكل كبيرة في أجزاء أخرى من العالم، مع تقارير من الهند أو تركيا أو البرازيل أو البرتغال أو فيتنامحيث رأى المستخدمون كيف تعمل التطبيقات مثل ChatGPT أو Zoom أو مواقع الويب المرجعية المختلفة أصبحت غير قابلة للوصول أو تعمل بشكل متقطع.
ماذا قالت Cloudflare عن أصل المشكلة؟
كما هو الحال غالبًا في مثل هذه الحوادث، كانت الاتصالات الأولية لشركة Cloudflare موجزة للغاية.واعترفت الشركة فقط بأنها كانت تحقق في مشكلات تتعلق بلوحة المعلومات وواجهات برمجة التطبيقات، بالإضافة إلى عدد كبير من الصفحات الفارغة عند استخدام وظائف معينة ذات صلة. عمال KV، نظام تخزين القيمة الرئيسية على الشبكة.
مع حلول الصباح، تقدم ممثلون فنيون من الشركة، بمن فيهم مديرها التقني، لتوضيح عدة نقاط. وكانت إحدى الرسائل الأكثر تكرارًا هي: لم يكن هجوما خارجيابل هي مشكلة داخلية تتعلق بـ إلغاء تنشيط بعض السجلات لمعالجة ثغرة أمنية حديثة في React. كان من شأن هذا التعديل أن يُسبب عواقب غير مقصودة على توافر جزء من الشبكة.
وفي الاتصالات اللاحقة، أوضحت Cloudflare أنها تم تنفيذ الحل وإعادة توجيه حركة المرور من مراكز البيانات التي تخضع للصيانة، والتي يمكن أن تترجم إلى زيادة مؤقتة في زمن الوصول لبعض المستخدمين. بالتوازي مع ذلك، بدأت أعمال صيانة جديدة في مواقع أخرى، مثل مركز البيانات في بوغوتا، لضمان استقرار الوضع بشكل كامل.
على أية حال، وبعيدًا عن هذه التفاصيل الفنية، لم يتم تقديم التفاصيل الشاملة بعد فيما يتعلق بالسبب الجذري للعطل، وهو أمرٌ عادةً ما تُؤجِّله الشركة لمنشورات لاحقة على مدونتها التقنية. يُسهم هذا النقص في المعلومات الفورية في خلق حالة من عدم اليقين بين الشركات التي تعتمد بشكل كبير على خدماتها، خاصةً عندما تتكرر الحوادث في فترة قصيرة من الزمن.
لقد أيقظت السقوطات المتكررة الاهتمام ببيئة الأعمال والتكنولوجياينطبق هذا بشكل خاص على المؤسسات التي تعتمد بشكل كبير على المنصات التي تستضيفها أو تؤمّنها Cloudflare. فالعديد منها يُدقّق بالفعل في خططه الطارئة ومستوى اعتماده على مزوّد خدمة أساسي واحد.
"ديجا فو" بعد أسابيع من فشل السحابة
انخفاض اليوم يضيف إلى سلسلة الحوادث الأخيرة في مقدمي الخدمات السحابية الرئيسيينقبل المشاكل المتكررة التي واجهتها Cloudflare، كان هناك بالفعل انقطاع كبير في الخدمات. AWS (خدمات ويب أمازون)الذي أدى في إسبانيا إلى القضاء على أنظمة الدفع مثل Bizum وغيرها من المنصات متدفق مثل Netflix أو Spotify وحتى الأجهزة المتصلة مثل مكبرات الصوت الذكية أو أسرة الأتمتة المنزلية.
وبعد بضعة أسابيع، Azure، سحابة مايكروسوفتكما شهدت انقطاعات أثرت على مختلف خدمات الأعمال والتطبيقات الإلكترونية. وفي هذا السياق، تعرّض العديد من مزودي شبكات توصيل المحتوى (CDN)، مثل Cloudflare نفسها أو Fastly قبل سنوات، لانقطاعاتٍ كان لها تداعيات إعلامية واقتصادية كبيرة.
ما تشترك فيه كل هذه الحالات هو أن تتركز معظم حركة المرور العالمية في عدد قليل من الشركات العملاقةوكما أوضح أكثر من خبير في هذا القطاع، لم يعد الأمر يتعلق بالاعتماد "العالي"، بل يتعلق بـ الاعتماد الكليحتى الشركات التي تمتلك مراكز بيانات خاصة بها تعتمد على هؤلاء المزودين لتوسيع نطاقها وحماية نفسها وتقديم المحتوى لملايين المستخدمين مع الضمانات.
المشكلة هي أنه عندما يتعثر أحد هؤلاء العمالقة، فهو يجلب معه مئات أو آلاف الخدمات الصغيرة والمتوسطة الحجم تعتمد على بنيتها التحتية. ما قد يكون عائقًا لشركة متعددة الجنسيات كبيرة، قد يكون ذا أهمية لشركة تجارة إلكترونية، أو وسيلة إعلامية، أو بنك إقليمي. صباح كامل من العمليات المحظورة.
تدرك الشركات المتضررة نفسها أنه يكاد يكون من المستحيل تكرار مستويات السعة والتكرار لدى هؤلاء المزودين بمفردها. "الحد" الحقيقي، كما يقول المتخصصون غالبًا بسخرية، إنها بطاقة الائتمان الخاصة بالعميللأن منذ ذلك الحين أصبح كل شيء يتم نقله إلى السحابة.
هشاشة البنية التحتية شديدة التركيز
لقد أشعلت الأحداث الأخيرة جدلاً متجدداً: إلى أي مدى يعتبر صحياً أن الجزء الأكبر من الإنترنت يقع في أيدي عدد قليل من الشركات؟من البنوك والمتاجر إلى الشبكات الاجتماعية ومنصات التعليم والخدمات العامة أو أنظمة النقل، فإنها تعتمد بالفعل بشكل مباشر أو غير مباشر على السحابة وشبكات توزيع المحتوى الكبيرة.
عندما يتعرض أحد هذه الروابط الحرجة للفشل، تأثير الدومينو الأمر فوري: أنظمة نقاط البيع تتعطل في المتاجر، والعمليات الإلكترونية تتعطل، وبعض خدمات الرعاية الصحية تتباطأ، وأدوات العمل التعاوني تتوقف عن العمل، وهكذا. بين عشية وضحاها، تزعزعت فكرة أن "الإنترنت متاح دائمًا".
ويشير خبراء البنية التحتية والأمن السيبراني إلى أنه على الرغم من وجود آليات التكرار وخطط الطوارئ، لا يوجد نظام معصوم من الخطأتحتوي منصات مثل Cloudflare على العديد من مراكز البيانات الموزعة والأنظمة الآلية التي تعمل على تحويل حركة المرور عندما يحدث خطأ ما، ولكن عندما تؤثر المشكلة على المكونات الأساسية، حتى أن التكرار ليس كافيا.
علاوة على ذلك، في هذا النوع من الحوادث، العامل البشري لا يزال حاضرا بقوةعلى الرغم من أنه ليس دائمًا خطأ بشريًا مباشرًا، فإن العديد من حالات الفشل تنشأ من تغييرات التكوين أو التحديثات أو التعديلات التي، جنبًا إلى جنب مع الأنظمة المعقدة للغاية، تسبب تفاعلات متسلسلة يصعب التنبؤ بها.
إن حالات مثل انقطاع خدمة Meta في عام 2021، عندما تسبب خطأ في التكوين في انقطاع خدمة Facebook وWhatsApp وInstagram لساعات، أو حادثة Fastly التي أدت إلى إغلاق مواقع الويب الشهيرة مثل Amazon وTwitch وReddit، هي تذكير بأن نقطة ضعف واحدة تكفي لإثارة مشكلة عالمية.
كيف تواجه مثل هذا التعطل من هاتفك المحمول والكمبيوتر؟
بالنسبة للمستخدم العادي، كل هذا يترجم إلى شيء بسيط للغاية: فجأة لا يعمل أي شيء تقريبًايظل الهاتف قيد التشغيل، واتصال Wi-Fi أو البيانات نشطًا، لكن بعض التطبيقات تتجمد، أو تعرض أخطاء 500، أو تتعطل على شاشة التحميل. في كثير من الأحيان، يكون الإغراء هو البدء... إعادة تشغيل الأجهزة، أو مسح ذاكرة التخزين المؤقت، أو تغيير كلمات المرور، بينما في الواقع لا يوجد أي معنى لكل هذا.
في موقف مثل الذي واجهته مع Cloudflare، أصبح الهاتف الذكي بمثابة ثقالة ورق فاخرة بالنسبة لكل ما يعتمد على السحابة: أدوات الذكاء الاصطناعي، وتطبيقات الخدمات المصرفية، ومنصات التسوق، وشبكات التواصل الاجتماعي، والألعاب عبر الإنترنت، وإدارة المشاريع، والمرافق الرقمية… كل شيء معلق حتى يستعيد المزود الوضع الطبيعي.
ويؤكد الخبراء مراراً وتكراراً أنه عندما يحدث سقوط من هذا النوع، لا يوجد مجال حقيقي للمناورة من جانب المستخدملن يؤدي إلغاء تثبيت التطبيقات أو تسجيل الدخول المتكرر أو تعديل الإعدادات إلى تسريع استرداد الخدمة، وفي بعض الأحيان قد يؤدي ذلك فقط إلى إضافة المزيد من الإحباط أو قد يتسبب في حدوث مشكلات إضافية.
التوصية الأكثر منطقية في هذه الحالات عادة ما تكون انتظر بهدوء حتى يتم حل المشكلةالتحقق من صفحات الحالة الرسمية لمقدمي الخدمة من وقت لآخر (عند توفرها) أو التواصل من المنصات المتأثرة نفسها. إذا استمر الانقطاع، فقد يكون الوقت مناسبًا لـ ارفع نظرك عن الشاشة واقضِ بعض الوقت في ممارسة الأنشطة غير المتصلة بالإنترنت.
في حادث اليوم، الخبر السار هو أن Cloudflare تمكنت من استعادة معظم الخدمات في أقل من ساعةومع ذلك، استمر بعض المستخدمين في ملاحظة سلوكيات غريبة وأخطاء متبقية على مواقع ويب معينة لفترة أطول حتى استقرت الشبكة بشكل كامل.
ما حدث مع انقطاع خدمة Cloudflare الجديد هذا يظهر مرة أخرى أن إلى أي مدى تعتمد حياتنا اليومية على البنية التحتية غير المرئية إذا أُديرت من قِبل عدد قليل من الجهات العالمية، فإن تغييرًا في الإعدادات، أو مشكلة صيانة مؤسفة، أو عطلًا في جزء مُحدد من الشبكة، يكفي لحرمان ملايين الأشخاص من الوصول إلى أدوات أساسية مثل الخدمات المصرفية عبر الإنترنت، والتسوق الرقمي، واجتماعات العمل، ومنصات الترفيه. وما دامت هذه الأنظمة تُركز جزءًا كبيرًا من حركة المرور العالمية، فإن حوادث مثل حادث اليوم ستظل تُذكرنا بأن الإنترنت، مهما بدت قوته، لديه أكثر من نقطة ضعف.

