從谷歌大面積癱瘓事件看存儲運維三大重要趨勢
2020-12-23 16:04
大數(shù)據(jù)在線袁紹龍
關注
近日,谷歌又出現(xiàn)大面積癱瘓事件,導致全球范圍內多款Google服務崩潰,這已經(jīng)是谷歌近半年第三次出現(xiàn)大規(guī)模宕機事件,堪稱上演宕機“帽子戲法”。
回顧此次宕機事件,谷歌在出現(xiàn)宕機之后的反應倒是挺快。根據(jù)谷歌云官方推特表述,經(jīng)過谷歌運維工程師近50分鐘的緊急處理,相關服務在當?shù)貢r間凌晨4點32分恢復正常,真是“同是天涯運維人,凌晨加班曾相識”。
再來看看此次宕機事件的“元兇”--“internal storage quota issue”,谷歌后續(xù)的一份初步調查報告中稱:此次宕機的原因是“我們的自動配額管理系統(tǒng)出現(xiàn)了問題,降低了谷歌中央身份管理系統(tǒng)的容量,導致其在全球范圍內返回錯誤。因此,我們無法驗證用戶請求是否經(jīng)過認證,并向用戶提供錯誤!
何謂“自動配額管理”問題?難道之前大部分媒體報道的“磁盤寫滿”宕機原因都是錯的?亦或是“磁盤寫滿”是表象,“自動配額管理”才是誘因?帶著好奇心,大數(shù)據(jù)在線小編找到了資深存儲專家李工,請他詳細分析了此次谷歌宕機事件背后的大瓜。

聲明:
本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權或其他問題,請聯(lián)系舉報。
請輸入評論內容...
請輸入評論/評論長度6~500個字