Ein wochenlanger Netzwerkausfall treibt die Cloud-Migration am Amherst College voran
Nicht nur Unternehmensnetzwerke spüren die Auswirkungen der digitalen Transformation. Von Regierungsbehörden bis hin zu Hochschulen, Cloud-Migration und SaaS-Einführung verändern die Vernetzung von oben nach unten und belastet die IT-Abteilungen dadurch beispiellos.
Ein aktueller Vorfall am Amherst College in Massachusetts veranschaulichte perfekt, was passieren kann, wenn die IT unter einer Lawine von Netzwerkproblemen begraben wird, da Hochschulen im ganzen Land zunehmend von vernetzten Technologien abhängig werden. Am 11. Februar kam es auf dem Campus zu einer einwöchigen Reihe von Netzwerkausfällen, die sich auf alles, vom campusweiten WLAN bis zum E-Mail-Zugang, auswirkten und die Schule wochenlang in Unordnung brachten.
Während das College eine Woche später immer noch diagnostizierte, was genau passierte, wurde ein Großteil der Probleme auf Gerätefehler zurückgeführt, darunter Verkabelungsprobleme und MAC-Flap-Vorfälle, die das Netzwerk mit ungemessenen Wellen von Messaging-Datenverkehr überfluteten, was zu einer Reihe von Abstürzen führte. Neben einem Konfigurationsproblem auf einem der zentralen Server der Schule gab es laut der Schulzeitung The Amherst Student ein drittes, noch nicht identifiziertes Problem, an dessen Aufdeckung die IT arbeitete
Kurz gesagt, nach fast einer Woche fast vollständigen Konnektivitätsausfalls hatte die Campus-IT immer noch Schwierigkeiten, herauszufinden, was ihr Netzwerk belastet, obwohl es den Anschein hat, dass das Amherst College den Großteil seiner Netzwerkarchitektur besitzt und kontrolliert. Im Gegensatz zu Netzwerken, die zumindest teilweise in die Cloud verlagert wurden, kontrollierte die IT des Amherst College den Großteil ihrer Netzwerkhardware, im Gegensatz zu Organisationen, die direkten Internetzugang (DIA) oder SD-WAN nutzen (was zugegebenermaßen in Unternehmensumgebungen häufiger vorkommt als in Bildungseinrichtungen). Netzwerke, zumindest vorerst).
David Hamilton, Chief Information Officer des Amherst College, sagte der Schülerzeitung, dass er in seinen 12 Jahren an der Schule noch nie von ähnlichen Vorfällen erfahren habe und dass dies „ein Zusammenfluss von Unfällen ist, die dazu geführt haben“.
Hier gibt es ein paar erste Erkenntnisse.
Erstens waren die Auswirkungen des Down-Netzwerks im Verlauf der Woche weitreichend; nicht nur E-Mail und WLAN waren ausgefallen, sondern auch Kartenscansysteme, die die Schlafsäle und Hallen auf dem gesamten Campus sicher halten, wurden im Wesentlichen „entsperrt“. Studenten waren gezwungen, ihre eigenen Mobilfunkdaten zu verwenden, um auf Online-Materialien für den Unterricht zuzugreifen, Gehaltsabrechnungssysteme wurden unzugänglich und sogar Campus-Wäschereikarten wurden außer Betrieb gesetzt. Die Campus-Administratoren waren nicht nur nicht in der Lage, bis zum Ende der Woche eine klare Antwort auf die Ursache des Ausfalls zu geben, sondern wie sie Studenten und Fakultät für die Unannehmlichkeiten entschädigen würden, war laut The Amherst Student . ein weiterer Faktor, den sie noch berücksichtigen mussten .
Eine Warnung vom 15. Februar an Studenten auf dem gesamten Campus lautete:
„Die IT arbeitet daran, Dienste wiederherzustellen, indem sie sie in die Cloud verlagert. Dies dauert aufgrund der Instabilität des bestehenden Netzwerks länger als erwartet.“
Was hätte die Campus-IT also tun können, um dies zu verhindern? Für den Anfang:Wenn die Campus-IT wirklich erwartet hätte, dass sich die Bedingungen im gesamten Netzwerk im Laufe des letzten Jahrzehnts nicht wesentlich ändern würden - und mehr, wie ihre Aussagen zeigten, dann war ein größerer Ausfall wie dieser unvermeidlich.
Eine Frage, die mir sofort in den Sinn kommt, ist, ob der Campus im Vorfeld des Vorfalls überhaupt eine Netzwerküberwachung durchgeführt hatte.
Damit „ein Zusammenfluss von Unfällen“ auf einmal so stattfinden kann, wären im Vorfeld des Vorfalls einige große blinde Flecken im Netzwerk auf Seiten der IT erforderlich. Selbst für Netzwerke, die nicht auf signifikante Cloud-Architekturen angewiesen sind, sollten Sie Netzwerkleistungsüberwachungs- und Diagnosetools verwenden, um sie aktiv auf potenzielle Fallstricke aufmerksam zu machen, und sich nicht nur auf die Netzwerkhardware verlassen, um aufgrund einer guten Erfolgsbilanz leistungsfähig zu bleiben.
Dieselben Überwachungslösungen hätten während des Ausfalls bereitgestellt werden sollen, um bei der Identifizierung des Problems zu helfen. Der Ansatz, Netzwerkserver herunterzufahren und Hardwaretests durchzuführen, war letztendlich für Studenten und Mitarbeiter kostspielig, lieferte jedoch keine klaren Antworten. Wäre das Team bei der Überwachung der Netzwerkleistung im Vorfeld aktiv gewesen, hätte die IT sehr wahrscheinlich ihre Mean-Time-to-Resolution (MTTR) beschleunigen können, wenn sie nicht schneller an der Wurzel des Problems vorgegangen wäre.
Laut Hamiltons Reaktion auf den Netzwerkausfall wird Amherst seine hardwareorientierte Netzwerkinfrastruktur stilllegen und seine zentralen Geschäftssysteme in die Cloud migrieren, in der Hoffnung, Mitarbeitern und Studenten eine sicherere und zuverlässigere Konnektivität zu bieten.
Während sich die Dinge beruhigen, war dies am Ende des Tages ein sehr langwieriger Vorfall, der wahrscheinlich mit modernerer Netzwerktechnologie und zuverlässiger Überwachung der Netzwerkleistung hätte vermieden – wenn nicht sogar schneller gebessert – werden können.
Cloud Computing
- SaaS, IaaS oder PaaS:Welche Cloud-Migrationsoption ist die richtige für Sie?
- Lassen Sie sich nicht vom Licht der Cloud-Migration blenden
- Go Cloud oder Go Home
- 5 Netzwerkmetriken für eine Cloud-Welt
- Vorteile und Strategien der Cloud-Migration für Unternehmen im Jahr 2020
- Warum in die Cloud wechseln? 10 Vorteile von Cloud Computing
- Einführung in die Netzwerkarchitektur in der AWS Cloud
- So planen Sie eine erfolgreiche Cloud-Migration
- Ein Leitfaden für eine erfolgreiche Cloud-Migration
- Die Monetarisierung von Mobilfunkdaten steigert die Effizienz