Το Cloudflare δημοσίευσε μια ολοκληρωμένη αναφορά που περιγράφει λεπτομερώς τα αίτια μιας μεγάλης αποτυχίας δικτύου που διέκοψε την παγκόσμια κυκλοφορία στο διαδίκτυο για αρκετές ώρες, επηρεάζοντας εκατομμύρια χρήστες και διάφορες υπηρεσίες.
Η διακοπή, η οποία ξεκίνησε στις 11:20 UTC, προήλθε από ένα εσωτερικό σφάλμα διαμόρφωσης και όχι από οποιαδήποτε απειλή στον κυβερνοχώρο, υπογραμμίζοντας τα τρωτά σημεία ακόμη και στις πιο ισχυρές υποδομές cloud.
Αυτό το περιστατικό απηχεί πρόσφατες διακοπές σε ανταγωνιστές όπως το Microsoft Azure και το Amazon Web Services, προκαλώντας ανησυχίες σχετικά με την ευθραυστότητα της παγκόσμιας ψηφιακής εξάρτησης.
Τα προβλήματα του Cloudflare προέκυψαν από μια τακτική ενημέρωση των δικαιωμάτων στο σύμπλεγμα βάσεων δεδομένων ClickHouse, με σκοπό την ενίσχυση της ασφάλειας για τα κατανεμημένα ερωτήματα.
Στις 11:05 UTC, η αλλαγή έκανε τα υποκείμενα μεταδεδομένα πίνακα στη βάση δεδομένων ‘r0’ ορατά στους χρήστες, αλλά ένα ερώτημα διαχείρισης ρομπότ απέτυχε να το εξηγήσει, αντλώντας διπλότυπα δεδομένα στηλών και διόγκωσε ένα αρχείο κρίσιμης δυνατότητας για να διπλασιάσει το αναμενόμενο μέγεθός του.
Αυτό το αρχείο, που ανανεωνόταν κάθε πέντε λεπτά για την καταπολέμηση των εξελισσόμενων απειλών bot μέσω μηχανικής εκμάθησης, ξεπέρασε το σκληρό κωδικοποιημένο όριο των 200 χαρακτηριστικών του λογισμικού, προκαλώντας πανικό στο βασικό σύστημα διακομιστή μεσολάβησης γνωστό ως FL.
Αρχικά θεωρήθηκε λάθος για μια μαζική επίθεση DDoS που συμπίπτει με το χρόνο διακοπής λειτουργίας της εξωτερικής σελίδας κατάστασης του Cloudflare, οι κυμαινόμενες αποτυχίες μπέρδεψαν τους ερευνητές καθώς τα καλά και τα κακά αρχεία εναλλάσσονταν κατά τη σταδιακή κυκλοφορία του συμπλέγματος.
Η λειτουργική μονάδα διαχείρισης ρομπότ, απαραίτητη για τη βαθμολόγηση της αυτοματοποιημένης κίνησης, σταμάτησε την επεξεργασία αιτημάτων, διαδοχικά σφάλματα μέσω του δικτύου. Στον νεότερο διακομιστή μεσολάβησης FL2, αυτό προκάλεσε εντελώς σφάλματα HTTP 5xx. Οι παλαιότερες εκδόσεις FL έθεσαν τις προεπιλεγμένες βαθμολογίες bot στο μηδέν, αποκλείοντας ενδεχομένως τη νόμιμη επισκεψιμότητα για πελάτες που χρησιμοποιούν κανόνες αποκλεισμού bot.
Το μπλακ άουτ έπληξε σκληρά τις βασικές υπηρεσίες, παρέχοντας σελίδες σφαλμάτων στους χρήστες που έχουν πρόσβαση σε ιστότοπους που προστατεύονται από το Cloudflare και αυξάνει τον λανθάνοντα χρόνο λόγω εντοπισμού σφαλμάτων που απαιτούν μεγάλους πόρους.
Η περιστροφική πύλη CAPTCHA απέτυχε εντελώς, μπλοκάρει τις συνδέσεις. Το Workers KV είδε αυξημένα σφάλματα, που ακρωτηριάζουν έμμεσα την πρόσβαση στον πίνακα εργαλείων και τον έλεγχο ταυτότητας μέσω της πρόσβασης Cloudflare.
Η Ασφάλεια email έχασε προσωρινά τον εντοπισμό ανεπιθύμητων μηνυμάτων, αν και δεν παραβιάστηκαν σημαντικά δεδομένα πελατών και οι ενημερώσεις διαμόρφωσης καθυστέρησαν. Μέχρι τις 17:06 UTC, η πλήρης ανάκτηση επιτεύχθηκε μετά τη διακοπή της διάδοσης κακών αρχείων, την επαναφορά σε μια γνωστή-καλή έκδοση και την επανεκκίνηση των διακομιστών μεσολάβησης.
Ο Διευθύνων Σύμβουλος της Cloudflare, Μάθιου Πρινς, εξέφρασε ειλικρινή συγγνώμη, περιγράφοντας το περιστατικό ως «βαθιά οδυνηρό» και απαράδεκτο για έναν μεγάλο πάροχο υπηρεσιών Διαδικτύου. Η εταιρεία αναγνωρισθείς Πρόκειται για τη χειρότερη βασική διακοπή κυκλοφορίας από το 2019.
Μαζική Διακοπή Cloud Giants
Αυτό το περιστατικό υπογραμμίζει μια ανησυχητική τάση αστοχιών που σχετίζονται με ζητήματα διαμόρφωσης μεταξύ μεγάλων παρόχων cloud.
Λίγες εβδομάδες πριν, στις 29 Οκτωβρίου 2025, το Azure υπέστη παγκόσμια διακοπή λόγω αλλαγής σφαλμάτων ενοικιαστών στο Front Door CDN του, διαταράσσοντας το Microsoft 365, το Teams και το Xbox για ώρες και επηρεάζοντας αεροπορικές εταιρείες όπως η Αλάσκα.
Ομοίως, το AWS υπέστη 15ωρη διακοπή ρεύματος στις 20 Οκτωβρίου στην περιοχή US-East-1, όπου τα ζητήματα DNS στο DynamoDB κυματίστηκαν σε EC2, S3 και υπηρεσίες όπως το Snapchat και το Roblox.
Ένα μικρότερο πρόβλημα ηλεκτρονικού εμπορίου AWS έπληξε το Amazon.com στις 5 Νοεμβρίου, καθυστερώντας τα ταμεία εν μέσω προετοιμασίας για τις διακοπές. Οι ειδικοί προειδοποιούν ότι αυτά τα περιστατικά υπογραμμίζουν την υπερβολική εξάρτηση από κεντρικούς παρόχους, όπου μεμονωμένα λάθη μπορούν να «σπάσουν το διαδίκτυο» επανειλημμένα το 2025.
Για να αποτρέψει μελλοντικά περιστατικά, το Cloudflare ενισχύει τις διαδικασίες απορρόφησης αρχείων για να προστατεύεται από εσφαλμένες εισόδους. Εφαρμόζουν επίσης γενικούς διακόπτες kill, μειώνοντας την υπερφόρτωση των αναφορών σφαλμάτων και εξετάζουν τις λειτουργίες αποτυχίας διακομιστή μεσολάβησης.
Αν και η διακοπή δεν προκλήθηκε από κακόβουλη πρόθεση, χρησιμεύει ως σαφής υπενθύμιση ότι καθώς τα οικοσυστήματα του νέφους επεκτείνονται, η σημασία της λειτουργικής ακρίβειας αυξάνεται επίσης.




