Energieunternehmen, Flugverkehr, Spitäler, Notrufnummer, Kontinente betroffen 19.07.2024, 11:24 Uhr

Kaputte Software legt weltweit Computersysteme lahm

Alarmstufe Rot: Ein fehlerhaftes Update des Internet-Sicherheitsanbieters Crowdstrike schaltet betroffene PCs und Server offline und befördert diese in eine Bootschleife. Die gesamte Welt ist davon betroffen.
Die Internet-Sicherheitsfirma Crowdstrike ist wohl für den weltweiten Computer-Crash verantwortlich
(Quelle: Crowdstrike)
Die Folge des Super-GAUs: Rechner starten nicht mehr auf. Das Brisante: Crowdstrike wird von sehr, sehr vielen weltweit agierenden Unternehmen benutzt, um die Windows-PCs respektive -Server steuern, verwalten und abzusichern.
Die Auswirkungen des fehlerhaften Updates sind verheerend: In den USA ist der Notruf «911» nicht mehr erreichbar. In einer weiteren Bestandsaufnahme sind auch wichtige Server und Software-Applikationen der Cloud-Services-365-Sparte von Microsoft betroffen, was wiederum bei einer Vielzahl von Unternehmen zu schwerwiegenden Ausfällen führt. Ein klassischer Teufelskreis.
Die Horror-Liste ist dementsprechend riesig: Betroffen sind Rechner und Computersysteme von Fluggesellschaften wie Ryanair sowie Unispitäler bei unseren Nachbarn in Deutschland (z.B. Schleswig-Holstein). Auch Banken und Tankstellen respektive Zahlungsabwicklungen sollen teilweise nicht mehr durchführbar sein. Beim Zürcher Flughafen Zürich sollen sogar Landungen nicht mehr möglich sein, Boardings werden manuell mit einer Liste durchgeführt. In Australien und Neuseeland sind weite Teile des Landes von massiven Störungen und Ausfällen betroffen.

Händischer Crowdstrike-Workaround

Für eine Fehlerbehebung hat Crowdstrike einen Workaround veröffentlicht, den IT-Abteilungen händisch (!) ausführen sollen:
Mit diesen Code sollen die Probleme behoben werden
Quelle: Crowdstrike
PCtipp meint: Übel, wie verzahnt die Welt mittlerweile ist, und alles von allem auf irgendeine Weise elementar abhängig ist. Technik bestimmt mittlerweile in hohem Masse, ob wir einen «gesunden» Tag erleben – oder eben nicht. Und auch die Folgen von Kosteneinsparungen durch Automatisierungen trägt wohl ihren Anteil dazu bei. All das Sparen und die damit einhergehende Optimierung der Systeme mag zwar auf dem Blatt Papier funktionieren. Das schwächste Glied in dieser Kette, das unter diesen Anforderungen aber eben auch zu 100 Prozent funktionieren muss, ist und bleibt der Mensch. In dem Fall hat wohl einfach das missglückte Einspielen eines falschen Codes genügt, um für weltweite Totalausfälle zu sorgen. Das ist traurig und sollte den IT-Verantwortlichen durchaus zu denken geben – gerade für die Zukunft. Oder andersherum gesagt: Es braucht Sicherheitsbarrieren, die vor dem Drücken auf das berühmte «Live-Schalt-Knöpfchen» durchaus auch mal das Ganze hinterfragen, falls im Fall der Fälle etwas schiefgeht. Das hätte vielleicht vieles erspart.



Kommentare
Avatar
cooltiger
19.07.2024
Es gibt jede Menge Firmenadministratoren die auf eine Cloud für Ihre Daten und Anwendungen schwören. Dies sei viel sicherer. Das heisst: Hat das Internet eine Störung, kann niemand mehr arbeiten. Die wichtigsten Daten und Anwendungen sollten meiner Meinung nach in einem internen Netz, das selbstverständlich vernünftig abgesichert ist zur Verfügung stehen. Diesmal ist es "nur" ein Fehler beim Aufspielen eines Updates. Was ist, wenn Hacker einen solchen Fall provozieren? In der heutigen Welt (mit staatlich unterstützten Hackern) wohl leider jderzeit denkbar.

Avatar
11291PCtipp
20.07.2024
Die IT Administration darf Software Updates nie auf "allen" Systemen gleichzeitig anwenden, immer erst im Test Labor testen. Wenn das die Software nicht erlaubt, ist sie für professionellen Betrieb untauglich.

Avatar
gucky62
20.07.2024
Die IT Administration darf Software Updates nie auf "allen" Systemen gleichzeitig anwenden, immer erst im Test Labor testen. Wenn das die Software nicht erlaubt, ist sie für professionellen Betrieb untauglich. Im Grundsatz für grössereUmgebungen, wie Office usw. ja. Aber bei verschiedenen Einzelsystemen mit spezifischer Bunsiness und Instrumenten Software faktisch unmöglich. Man kann nur beginnen mit unkritischen Systemen und wenn es dort klappt kann es weiter gehen. Fallback ist dabei zwingend. Und durch die hohe Updatefrequenz wird es immer schwieriger. Neben der enormen zunehmenden Komplexität. Ob die Applikationssoftware dies erlaubt ist nicht wirklich bei Instrumenten Massgebend. Den man hat nicht mal so Test-Instrumente für Test /Dev Systeme. Ist etwas komplexer. Und gerade bei AV Lösungen kaum machbar. Egal welche Umgebung. Da ist die Updatefrequenz viel zu hoch. Die Frage die man sich stellen muss, ist wie brauchbar das QMS des AV Software-Herstellers ist. Gruss Daniel

Avatar
gucky62
20.07.2024
Nach und nach kommen Details in die Medien. So wie es aussieht war es keine "Software" sondern eher ein Signature-Update, welches aber den Kernel-Teil der AV Software abgeschossen hat. Genauso tödlich. Deswegen die recht einfach Behebung in dem man das Sig-File löscht. Da solche Update innert Stundfrist hereinkommen udn dies auch müssen, ist mit Testen beim Kunden mal gar nichts zu machen. Man kann höchstens eine Verteil-Kaskade definieren, so das zuerst mal eher unwichtigere, aber laufend genutzte Systeme das Sig-Update zuerst erhalten. So simpel ist es nicht. Gruss Daniel