* Piorun ubił chmurę Amazonu

20:17
3/7/2012

* Piorun ubił chmurę Amazonu

Autor: Piotr Konieczny | Tagi: Amazon, awarie, AWS, fail, piorun

Wyładowanie elektryczne spowodowało przestój chmury Amazonu (AWS) — ale nie tylko piorun miał wpływ na downtime. Awarię przedłużyły dodatkowe błędy, które niespodziewanie ujawniły się.

Ten wpis pochodzi z naszego linkbloga *ptr, dlatego nie widać go na głównej.
*ptr możesz czytać przez RSS albo przez sidebar po prawej stronie serwisu.

Dowiedz się, jak zabezpieczyć swoje dane i pieniądze przed cyberprzestępcami. Wpadnij na nasz kultowy ~3 godzinny wykład pt. "Jak nie dać się zhackować?" i poznaj kilkadziesiąt praktycznych i przede wszystkim prostych do zastosowania porad, które skutecznie podniosą Twoje bezpieczeństwo i pomogą ochronić przed atakami Twoich najbliższych. Uczestnicy tego wykładu oceniają go na: 9,34/10!

Na ten wykład powinien przyjść każdy, kto korzysta z internetu na smartfonie lub komputerze, prywatnie albo służbowo. Wykład prowadzimy prostym językiem, wiec zrozumie go każdy, także osoby spoza branży IT. Dlatego na wykład możesz spokojnie przyjść ze swoimi rodzicami lub mniej technicznymih znajomych. W najbliższych tygodniach będziemy w poniższych miastach:

Zobacz pełen opis wykładu klikając tutaj lub kup bilet na wykład klikając tu.

Niebezpiecznik

14 komentarzy

Dodaj komentarz

afe 2012.07.03 20:28 | # | Reply

co za cyrk, nie stać ich na generatory?
u mnie na zakładzie mamy UPSy i generator gotowy 24/7 bo byłaby katastrofa jakby wyłączyły się sterowniki PLC a oni nie potrafią upilnować serwerów
- krogon 2012.07.03 21:31 | # |
  
  Widać że nie przeczytałeś analizy poawaryjnej. Generatory uruchomiły się, ale nie podawały potrafiły utrzymać od razu stabilnego napięcia. Wtedy przełączyło się na UPSy, które się wyczerpały. Generator uruchomiono do końca manualnie i przełączono na niego obciążenie. Gdy wróciło zasilanie i stanowiło główne źródło zasilania wszystko się powtórzyło.
  
  Analiza podaje również, że 12 maja tego roku przeprowadzono testowe przełączenie całego obciążenia serwerowni na generatory – bezproblemowo. Sprzęt ma być wymieniony przez producenta.
  
  PS. Ciekawsza kwestia to bottleneck jaki wywołały paniczne próby uruchamiania nowych instancji.
- afe 2012.07.04 10:29 | # |
  
  to tym bardziej fail jeśli najpierw uruchamiają generator a potem przechodzą na UPS
  u nas najpierw włącza się UPSa a jak zaskoczy generator to zakład idzie na generatorze
Marqin 2012.07.03 20:43 | # | Reply

Gorzej, ubił też centrale Pogotowia Ratunkowego we Wrocławiu(999 nie działa)…
- krogon 2012.07.03 21:32 | # |
  
  Awaria była w sobotę.
ogor 2012.07.03 21:15 | # | Reply

W artykule uwalone są linki więc wstawiam bezpośredni link do “analizy”: http://aws.amazon.com/message/67457/
PS. downtime usług amazona w praktyce: http://img534.imageshack.us/img534/237/defaultja.png
krogon 2012.07.03 21:20 | # | Reply

Awarii nie uległa cała chmura, a jedna “Zona” w jednej lokalizacji US East-1.
Oskar 2012.07.03 22:09 | # | Reply

[suchar]
chmury nie lubią konkurencji. he he he
[/suchar]
Daggerka 2012.07.03 22:38 | # | Reply

Bo prawdziwą chmurą to można co najwyżej botnet nazwać… Wiele, niezależnych maszyn robiących to samo. Awaria jednej, dziesięciu czy setek nie psuje systemu. A tutaj co mamy? Wciąż kilka niezależnych od siebie DataCentar w których można kupić “takie lepsze VPSy”.
Grzechooo 2012.07.04 12:28 | # | Reply

Brakuje mi tu info o bugu związanym z sekundą przestępną, bo to też mogło się nałożyć.
- Robert 2012.07.04 17:51 | # |
  
  Od zeszłego weekendu nazywa się ją sekundą przestępczą…
rjfpibm 2012.07.05 17:03 | # | Reply

kolejność powinna być taka:
po zaniku zasilania pracuje nadal UPS (online) i w tym czasie zaczyna startować generator, który gdy wystartuje zasila UPS’a
niewierzcieelektrykom 2012.07.06 11:13 | # | Reply

to ja może was pogodzę… UPSy wcalnie nie muszą być on-line, chociaż faktycznie można tak zrobić i o ile jedt to rozwiązanie pewniejesze, to jednocześnie droższe. Cięcie kosztów powoduje powstawanie naprawdę różnych konfiguracji.
Generalanie takie generator nie powinien odrazu być załączany na pełne obciążenie, tylko najpierw ma zasilić odbiory wrażliwe. Dodatkowo taka farma generuje dużą moc bierną pojemnościową, jeżeli nie jest ona prawidłowo kompensowana, to zwyczajnie generator wypadał z synchronizmu…
nie wspominając już o tym że jak ktoś inwestuje w takie poważne serwerownie, to nie powinien opierać się tylko na ups/ups+gen ale już mieć pociągniętę linie z 2 róznych GPZ.
Michał 2012.07.08 15:23 | # | Reply

zwykły prosty balance loading powinien przekazać ruch z tego datacenter na drugi… przynajmniej jeśli chodzi o usługi wrażliwe. Po jaką cholere stawiają redundantne rozwiązania jeśli to wszystko wychodzi n fail

Odpowiadasz na komentarz Marqin

Kliknij tu, aby anulować

Niebezpiecznik