日前,行業(yè)專家闡述了由美國獨立研究機構波萊蒙研究所調查研究所量化的數(shù)據(jù)中心停機成本最新數(shù)據(jù)。
時間就是金錢。而波萊蒙研究所在其最新版本的數(shù)據(jù)中心停機費用最新的調查結果表明,數(shù)據(jù)中心停機時間則會耗費更多的資金。
根據(jù)報告,2016年數(shù)據(jù)中心每次電力中斷的平均成本為740357美元,同比增長38%,而在其2010年對此調查的第一次報告中,數(shù)據(jù)中心電力中斷的每分種平均成本為8851美元。
數(shù)據(jù)中心停機時間是一個有用的指標
那么波耐蒙研究所如何獲得數(shù)據(jù)中心意外停機的平均成本為740357美元的數(shù)據(jù)的呢?為了得到這個數(shù)字,波耐蒙研究所審計的在美國北部63個數(shù)據(jù)中心停電,利用作業(yè)成本模型,他們捕捉到的信息直接和間接成本,包括:
?關鍵任務數(shù)據(jù)損壞
?停機時間對企業(yè)生產效率的影響
?設備及其他資產的損壞
?檢測和修復系統(tǒng)和核心業(yè)務過程的成本
?法律和法規(guī)的影響,包括訴訟辯護費用
?關鍵利益相關者之間失去的信心和信任
?市場的品牌和聲譽的損失
回溯到2010年,數(shù)據(jù)中心每次業(yè)務中斷的平均成本為505502美元。那么如何解釋這些日益增長的平均成本?讓我們回想一下2010年我們使用的網絡技術。在2010年,全球5億人有Facebook公司的賬戶為,而現(xiàn)在Facebook公司有15億個配置文件。2010年,第一代iPad問世。當時,網絡商業(yè)銷售一周的銷售額不到十億美元。如今,網絡銷售一天就超過20億美元。光纖傳輸?shù)乃俣纫舱诓粩嘣鲩L,流媒體正在迅速成為全球各地用戶的主流。
數(shù)據(jù)中心電力中斷的平均成本增長示意圖
每天在網絡上運營著越來越多的商業(yè)和通信業(yè)務,網絡和數(shù)據(jù)中心的重要性比以往任何時候都要高。那么人們可以做什么來確保數(shù)據(jù)中心所有者和運營商不再損失費用(更重要的是讓客戶滿意)?讓我們來看看造成數(shù)據(jù)中心設施電力或業(yè)務中斷的根本原因:
數(shù)據(jù)中心設施電力或業(yè)務中斷的根本原因
(1)UPS系統(tǒng)故障(包括蓄電池)
網絡攻擊和可怕的“人為錯誤”占電力中斷事件的70%。在許多情況下,大多數(shù)這些中斷是完全可以預防的,相對于中斷的直接和間接成本的費用,對此采取防護和預防措施的成本是微不足道的。
(2)監(jiān)控UPS電池
一般來說,這里有一些最基本的技巧,可以減少停機時間:監(jiān)控UPS電池,而蓄電池組是UPS系統(tǒng)中的薄弱環(huán)節(jié)。使用遠程電池監(jiān)測技術,以確定電池的問題,以免影響操作。
(3)使用智能熱控制用冷卻單元
這些控制提高保護通過監(jiān)控組件的數(shù)據(jù)點,匹配氣流和房間的負荷能力,具備自動化修復程序,提供更快的重新啟動,并且防止在低負荷的情況下的熱/冷空氣混合。
(4)執(zhí)行預防性維護
年平均維護次數(shù)的增加與UPS的平均無故障時間(MTBF)的提高直接相關。一年的預防性維護次數(shù)從0到1,平均無故障時間與無維護相比可以得到10倍的提高;一年從0到2次平均無故障時間與無維護相比可以得到23倍的提高。
(5)加強政策和培訓
確保EPO按鈕被清楚的標記,防止意外關閉。加強文檔和溝通,并進行定期培訓。
(6)標準化和自動化安全管理
使用控制臺服務器加強安全,采用遠程訪問服務器簡化補丁管理,并提供早期檢測攻擊。
停機時間的成本是一個有用的指標,可以確保企業(yè)的數(shù)據(jù)中心設施始終資源充足(人力和設備)的情況下,但它不是IT和數(shù)據(jù)中心設施專業(yè)人士應該思考的唯一的指標。
在接下來的幾個月里,波萊蒙研究所將發(fā)布四個報告,其內容包括數(shù)據(jù)中心的性能基準系列,其中的問題涵蓋安全、生產力、部署速度,以及支持成本的計算能力。
編譯:apple.lei

