カスケード故障

GoogleGmailのトラブルはカスケード故障(まあ,今回の発端は故障でなくアップグレードのための停止だが)だったらしい.
Google,「Gmail」の障害はルーターの処理容量オーバーが原因IT pro
この種の障害の解析は非常に難しいのだが,今後どのように解決されるのか非常に興味深い.ところで,午前中のmixiのダウンの原因は何だったのだろう?
ちなみに,TwitterのデータセンターはNTTアメリカが運用しているらしい.
NTTアメリカ、Twitter向けに新しいデータセンターを建設―ついにクジラは消え去るのか?(TechCrunch)
ただ,以下を見ると,相当高いスペック・高価格のデータセンターを建設しようとしているらしいが,それよりもGoogleのようにさまざまなコスト低減処置を施したデータセンターを世界中に多く分散させた方がよい気がするが,どうなのだろうか?

NTTアメリカによると、新しいデータセンターは連邦建築基準によるもっとも厳しい分類、第4種危険地域(Zone 4)に適合するという。NTTではまたこのデータセンターは、「通信キャリヤ級の無停電電源および非常用発電装置を備えており、完全に多重化された水冷・空調設備、常時作動しているモニタシステムによってあらゆる事態を通じて最適なパフォーマンスを継続できる」としている。

やはり,今一番面白い研究対象はデータセンターなのかもしれない.