Choć może nie widać tego na pierwszy rzut oka, coraz więcej usług z których korzystamy jest oparte na rozwiązaniach chmurowych. Przy trzech największych firmach na rynku oferujących swoje produkty cloudowe (Microsoft i ich Azure, Amazon z AWS, oraz Google Cloud Platform) wiele pozornie niepowiązanych stron czy aplikacji działa na jednej z tych usług.
Rodzi to pytanie – jak radzić sobie w sytuacji, gdy dojdzie do awarii? Z tym problemem zmierzyć musieli się deweloperzy AWS pod koniec lutego. Wszystko wynikło z ludzkiej pomyłki – jeden z pracowników teamu S3 (Amazon Simple Storage Service) popełnił błąd i zamiast usunąć niewielką ilość serwerów dla jednego z regionów, usunięto ich o wiele więcej. Ofiarą pomyłki stały się takie strony i aplikacje jak Slack, Grammarly, Splitwise, chmura Adobe i wiele wiele innych.
O ile problem został rozwiązany relatywnie szybko, to sam incydent wzbudził pewne poruszenie w świecie IT. Firmy sprzedające usługi chmurowe reklamują ich bezpieczeństwo i wysokie SLA. O ile faktycznie, jest to zgodne z prawdą, to błędów uniknąć się nie da, o czym przekonali się użytkownicy AWS. Dla biznesu IT kilka godzin bądź cały dzień może przynieść ogromne straty. Jak więc przygotować się na takie sytuacje?
Najlepszym rozwiązaniem dla takich problemów jest założenie drugiej chmury, z back-upem. W przypadku największych dostawców, szansa na black-out w dwóch chmurach jednocześnie jest praktycznie zerowy. Warto zatem skorzystać z dodatkowej usługi innej firmy, na wypadek sytuacji takiej jak awaria AWS.
Godnym uwagi jest zwrócenie uwagi na rozwiązania Google, który w przeciwieństwie do Azure i Amazon AWS korzysta z własnej, globalnej infrastruktury sieciowej, co czyni go mniej podatnym na zewnętrzne problemy. Rozwiązanie to też oferuje szybkie połączenie, bez opóźnień. Google dodatkowo oferuje usługę Virtual Network, która pozwala klientom na stworzenie własnej sieci na bazie infrastruktury Google.