Das Internet ist kaputt
In unserer heutigen schnelllebigen Welt nehmen wir vieles als selbstverständlich hin. Wie immer wird uns erst bewusst, wie wichtig etwas ist, wenn es nicht mehr da ist
Ein großer Ausfall der Amazon Web Services (AWS) in der Region US-EAST-1 zeigt, wie abhängig wir nach wie vor von bestimmten Service Provider respektive Dienstleistern sind und macht deutlich, dass wir noch stärker auf Dezentralisierung setzen müssen.
Der Morgen des 20. Oktober verlief hier in Europa in Bezug auf die Zuverlässigkeit der Dienste recht ungewöhnlich: Zunächst traten bei verschiedenen Apple-Diensten Probleme auf und kurz darauf bemerkte ich, dass die LEDs an meinen HPE Instant On-Access-Points orange blinkten. Während das WLAN an sich und die Verbindungen weiterhin funktionierten, war kein Zugriff auf das Verwaltungsportal möglich – das letzte Mal war dies während eines AWS-Ausfalls vor einigen Jahren der Fall.
Während die Reddit-Community schon bereits und sehr aktiv über diese Störung diskutierte, verstärkten weitere Ausfälle, darunter auch bei Prime Video, Perplexity, Amazon selbst, Hulu, Snapchat und sogar Signal (das ebenfalls auf AWS-Dienste setzt), den Eindruck, dass es hier möglicherweise einen erneuten Ausfall in der AWS-Region US-EAST-1 gab. Mit der genaueren Einordnung des Problems verbreiteten sich auch die Nachrichten über die Auswirkungen sowie weitere Informationen auf der offiziellen Statusseite bei Amazon.
Zusammenfassend wurde der Welt dann mitgeteilt, dass ein relativ einfacher DNS-Fehler diese Ausfälle von einem Drittel bis zur Hälfte des weltweiten Internets verursacht hat (it’s always DNS or BGP!). Dies verdeutlicht einmal wieder ganz deutlich unsere vollständige Abhängigkeit von nicht nur in den USA ansässigen Diensten – was an sich schon ein Problem darstellt – sondern auch von zentralisierten Diensten oder fehlender Redundanz an sich.
Ich persönlich bin ein großer Fan von Self-Hosting und meine authentik-Instanz für Single Sign-On sowie meine zu Hause gehosteten Instanzen von Mastodon, Vernissage oder auch diesem Blog liefen dank einer redundanten Internetverbindung und der Unabhängigkeit von den AWS-Nameservern weiterhin ohne Probleme. Auch mein Reverse Proxy und meine Matrix-ESS-Kubernetes-Umgebung, die bei einem deutschen Provider gehostet werden, funktionierten selbst dann weiterhin einwandfrei, als es dann am Ende auch Signal erwischte - kein Wunder, baut doch auch dieser Service auf AWS auf!
Ohne selbstgefällig klingen zu wollen, wurde mir mal wieder klar, dass es durchaus die richtige Entscheidung war, spezielle Dienste weg von den „Big Tech“-Unternehmen zu verlagern (egal wie unbequem und schwierig das auch anfangs sein mag) – sei es durch Self-Hosting oder einfach dadurch, dass man eben nicht alle Services über einen einzelnen Anbieter laufen lässt. Mit großer Macht geht bekanntlich große Verantwortung einher, daher muss ich mich in meinem Fall natürlich selbst um die funktionierende Infrastruktur kümmern – aber das gilt nur für meine persönlichen Dienste und wenn diese ausfallen, sind die Folgen überschaubar: Hier besteht keine Gefahr für Leib und Leben, wenn ich offline bin - dann funktionieren meine selbstgehosteten Services für den Moment eben nicht - eine klassische Bewertung von Kritikalität.
Aber wie sieht es im Unternehmensbereich aus? Wenn man ein Unternehmen führt und auf Dienste angewiesen ist, um einen Geschäftsbetrieb aufrechtzuerhalten, muss man entweder für Georedundanz sorgen (was hier auch geholfen hätte, aber durchaus immer ein Kostenthema ist) oder die Dienste in einer Multi-Cloud-Umgebung bereitstellen, nur um sicherzustellen, dass ein Teil davon ausfallen kann, ohne direkt handlungsunfähig zu sein. Am Ende sollte man aber nicht vergessen, dass all dies aufgrund eines DNS-Problems in einer einzelnen Geo-Region des weltweit größten Hyperscalers geschah und die meisten Auswirkungen ein Beweis für ein Systemversagen waren, das bereits in der Konzeption lag: Auch hier hätte eine Georedundanz oder nur ein einzelnes Failover gereicht, um zumindest mit einem blauen Auge davonzukommen.
Das Internet, wie wir es mal kannten, ist schlichtweg kaputt und auch die Idee, die es seinerzeit entstehen liess, ist mittlerweile in Vergessenheit geraten. Noch haben wir aber meiner Meinung nach immer noch die Chance, das Ganze irgendwie wieder in Ordnung zu bringen. Nutzt die Tools, die euch die Anbieter zur Verfügung stellen, und setzt Dienste ein, die an mehr als einem Standort betrieben werden können. Zieht in Erwägung, Dienste dezentral zu betreiben oder Softwarekomponenten zu verwenden, die unabhängig von dem Anbieter sind, der gerade in diesem Moment zusammenbricht.
Natürlich müssen wir zwischen persönlichen, privaten und geschäftlichen Bedürfnissen unterscheiden, aber die Abhängigkeit ist da, und es war mehr als aufschlussreich wie auch unangenehm zu sehen, auf welchen Plattformen wir die betroffene Infrastruktur aufgebaut hatten und wie groß die Auswirkungen waren, als diese ausfiel. Heute waren es nur ein Online-Streaming-Dienst und die lustige Plattform, die es ermöglicht, Bilder und Videos zu versenden, die scheinbar nach dem Ansehen wieder verschwinden – vielleicht sind es morgen die Systeme, die sich um unser Banking kümmern oder uns wie auch unsere kritische Infrastruktur einfach am Leben erhalten?
Lasst uns daraus lernen und unsere Schlüsse aus dieser digitalen Abhängigkeit ziehen!
Dieser Artikel erschien ursprünglich auf einem meiner Vorgängerblogs am 20. Oktober 2025.