Την Τρίτη, το Cloudflare γνώρισε τη χειρότερη διακοπή λειτουργίας των τελευταίων 6 ετών, εμποδίζοντας την πρόσβαση σε πολλούς ιστότοπους και διαδικτυακές πλατφόρμες για σχεδόν 6 ώρες, αφού μια αλλαγή στα στοιχεία ελέγχου πρόσβασης στη βάση δεδομένων προκάλεσε μια διαδοχική αποτυχία σε όλο το Παγκόσμιο Δίκτυο.
Το Παγκόσμιο Δίκτυο της εταιρείας είναι μια κατανεμημένη υποδομή διακομιστών και κέντρων δεδομένων σε περισσότερες από 120 χώρες, παρέχοντας υπηρεσίες παράδοσης περιεχομένου, ασφάλειας και βελτιστοποίησης απόδοσης και συνδέοντας το Cloudflare σε περισσότερα από 13.000 δίκτυα, συμπεριλαμβανομένων κάθε μεγάλου ISP, παρόχου cloud και επιχείρησης παγκοσμίως.
Ο Μάθιου Πρινς, Διευθύνων Σύμβουλος της εταιρείας, δήλωσε σε μια νεκροψία που δημοσιεύτηκε μετά τον μετριασμό της διακοπής ότι οι διακοπές της υπηρεσίας δεν προκλήθηκαν από κυβερνοεπίθεση.
“Το ζήτημα δεν προκλήθηκε, άμεσα ή έμμεσα, από επίθεση στον κυβερνοχώρο ή κακόβουλη δραστηριότητα οποιουδήποτε είδους. Αντίθετα, προκλήθηκε από μια αλλαγή σε ένα από τα δικαιώματα των συστημάτων βάσης δεδομένων μας, η οποία έκανε τη βάση δεδομένων να εξάγει πολλαπλές καταχωρήσεις σε ένα “αρχείο λειτουργιών” που χρησιμοποιείται από το σύστημα διαχείρισης ρομπότ.” είπε ο Prince.
Η διακοπή ξεκίνησε στις 11:28 UTC όταν μια τακτική ενημέρωση αδειών βάσης δεδομένων έκανε το σύστημα διαχείρισης ρομπότ του Cloudflare να δημιουργήσει ένα μεγάλου μεγέθους αρχείο διαμόρφωσης που περιέχει διπλότυπες εγγραφές. Το αρχείο, το οποίο ξεπέρασε τα ενσωματωμένα όρια μεγέθους, προκάλεσε τη διακοπή λειτουργίας του λογισμικού κατά τη δρομολόγηση της κυκλοφορίας στο δίκτυο του Cloudflare.
Αυτό το ερώτημα της βάσης δεδομένων επέστρεψε διπλότυπα μεταδεδομένα στηλών μετά από αλλαγές δικαιωμάτων, διπλασιάζοντας το αρχείο χαρακτηριστικών από περίπου 60 δυνατότητες σε περισσότερες από 200, υπερβαίνοντας το όριο των 200 δυνατοτήτων με σκληρό κώδικα που έχει σχεδιαστεί για να αποτρέπει την απεριόριστη κατανάλωση μνήμης.

Κάθε πέντε λεπτά, ένα ερώτημα δημιουργούσε είτε σωστά είτε ελαττωματικά αρχεία διαμόρφωσης, ανάλογα με το ποιοι κόμβοι συμπλέγματος είχαν ενημερωθεί, προκαλώντας διακυμάνσεις του δικτύου μεταξύ κατάστασης λειτουργίας και κατάστασης αποτυχίας.
Επιπλέον, όταν το αρχείο μεγάλου μεγέθους διαδόθηκε σε μηχανήματα δικτύου, ο κώδικας Rust της μονάδας διαχείρισης ρομπότ προκάλεσε πανικό στο σύστημα και σφάλματα 5xx, καταρρέοντας το βασικό σύστημα διακομιστή μεσολάβησης που χειρίζεται την επεξεργασία της κυκλοφορίας.
Η βασική κυκλοφορία επέστρεψε στο κανονικό έως τις 14:30 UTC αφού οι μηχανικοί του Cloudflare εντόπισαν τη βασική αιτία και αντικατέστησαν το προβληματικό αρχείο με μια παλαιότερη έκδοση. Όλα τα συστήματα ήταν πλήρως λειτουργικά στις 17:06 UTC. Η διακοπή επηρέασε το βασικό CDN και τις υπηρεσίες ασφαλείας του Cloudflare, το Turnstile, το Workers KV, την πρόσβαση στον πίνακα εργαλείων, την ασφάλεια email και τον έλεγχο ταυτότητας πρόσβασης.
“Λυπούμαστε για τον αντίκτυπο στους πελάτες μας και στο Διαδίκτυο γενικότερα. Δεδομένης της σημασίας του Cloudflare στο οικοσύστημα του Διαδικτύου, οποιαδήποτε διακοπή λειτουργίας οποιουδήποτε από τα συστήματά μας είναι απαράδεκτη”, πρόσθεσε ο Prince.
“Σήμερα ήταν η χειρότερη διακοπή λειτουργίας του Cloudflare από το 2019. Είχαμε διακοπές που έκαναν τον πίνακα ελέγχου μας μη διαθέσιμο. Κάποιες που είχαν ως αποτέλεσμα να μην είναι διαθέσιμες νεότερες λειτουργίες για κάποιο χρονικό διάστημα. Όμως τα τελευταία 6+ χρόνια δεν είχαμε άλλη διακοπή που να είχε ως αποτέλεσμα να σταματήσει η ροή της κύριας κυκλοφορίας μέσω του δικτύου μας.”
Το Cloudflare μετριάστηκε άλλη μια τεράστια διακοπή λειτουργίας τον Ιούνιο, η οποία προκάλεσε προβλήματα συνδεσιμότητας του Zero Trust WARP και αποτυχίες ελέγχου ταυτότητας της Access σε πολλές περιοχές, ενώ επηρέασε επίσης την υποδομή του Google Cloud.
Τον Οκτώβριο, η Amazon αντιμετώπισε επίσης μια διακοπή λειτουργίας που προκλήθηκε από μια σημαντική αποτυχία DNS που διέκοψε τη συνδεσιμότητα σε εκατομμύρια ιστότοπους που χρησιμοποιούν την πλατφόρμα υπολογιστών cloud της Amazon Web Services (AWS).
Είναι περίοδος προϋπολογισμού! Πάνω από 300 CISO και ηγέτες ασφάλειας έχουν μοιραστεί πώς σχεδιάζουν, ξοδεύουν και δίνουν προτεραιότητες για το επόμενο έτος. Αυτή η έκθεση συγκεντρώνει τις γνώσεις τους, επιτρέποντας στους αναγνώστες να αξιολογούν στρατηγικές, να προσδιορίζουν τις αναδυόμενες τάσεις και να συγκρίνουν τις προτεραιότητές τους καθώς πλησιάζουν το 2026.
Μάθετε πώς οι κορυφαίοι ηγέτες μετατρέπουν τις επενδύσεις σε μετρήσιμο αντίκτυπο.
VIA: bleepingcomputer.com












