首頁天天新聞綜合排行產品排行榜中榜調查問卷趣味測試地方頻道加盟商機天天圖片排行社區(qū)天天搜索
天天新聞綜合排行企業(yè)人物事件社會經濟軍事科教人文自然旅游文娛生活特產奢侈黑榜導購質量評論
  當前位置:  首頁 > 天天新聞 > 正文
支付寶經歷備災系統大考驗
http://www.serverj.cn   2015-05-28   財新網

  5月27日下午,支付寶全國范圍癱瘓達2.5小時,這件事引發(fā)了人們對相關備災系統的大討論。業(yè)內人士普遍認為,系統故障對數據機構而言實屬正常,但這次支付寶故障時間偏長,一定程度反映出第三方支付機構在備災工作的不善。


支付寶

  支付寶是全球最大的第三方支付機構,2013年實名用戶即超過3億人。阿里巴巴招股書透露,2014財年(截至3月31日),支付寶的總支付金額達到38720億元,日均支付量已超過百億,占到中國的第三方支付市場份額70%以上。

  癱瘓2.5小時

  從5月27日下午5點左右,支付寶出現全國范圍的系統癱瘓。淘寶購物、第三方網站付款、支付寶錢包各項功能全部無法使用。用戶還紛紛表示客服電話打不通。記者在北京打開支付寶錢包app,彈出提示“網絡繁忙,請稍后再試”。

  支付寶錢包官微下午6點表示,“由于杭州市蕭山區(qū)某地光纖被挖斷,造成目前少部分用戶無法使用支付寶,運營商蜀黍正在搶修,支付寶攻城獅正在緊急將用戶請求引流至其他機房,受影響的用戶正在逐步恢復!

  記者詢問了廣東、西安、上海、四川等全國多地的多名支付寶用戶,全部表示無法使用。從記者掌握的情況而言,支付寶故障比其官方描述的“少部分用戶無法使用”更嚴重。

  晚上7:30,支付寶錢包再次發(fā)布官微表示,之前由于杭州蕭山某地光纖被挖斷導致部分支付寶用戶無法正常使用,目前已經恢復正常服務,歡迎繼續(xù)使用,如果出現交易信息不同步的情況,會逐步恢復。

  從5點到7:30,整個癱瘓過程長達2.5小時,所幸用戶資金全都安全。事后有業(yè)內人士表示,這種技術障礙是不會危及用戶資金安全的,相當于大樓突然斷水斷電,不等于水電被挪用、消失了。

  接近監(jiān)管部門的有關人士表示,國家有關部門對商業(yè)銀行規(guī)定:中斷服務時間超過30分鐘,必須報告。中斷時間不超過120分鐘,為一般安全事件。中斷時間不超過240分鐘,為重大安全事件。中斷時間超過240分鐘,為特大安全事件。“以上規(guī)定不論原因,支付寶今天中斷超過120分鐘,為重大安全事件!庇嘘P人士表示,雖然未明確第三方支付機構的相關規(guī)定,但對大型支付機構,如支付寶、財富通和銀聯商務,應視同商業(yè)銀行管理。

  據財新記者了解,在支付寶癱瘓期間,監(jiān)管機構也相當緊張,密切關注事項發(fā)展。

  敲響備災警鐘

  事發(fā)之后,業(yè)內人士也有表示理解的。有觀點認為,美聯儲支付系統、股票交易所交易系統、國有商業(yè)銀行的支付系統也都曾有宕機現象。只要數據不亂、盡快恢復,應沒大問題。

  國際支付機構人士表示,只要是大型數據機構,或多或少都中過招、宕過機。支付寶的科技系統是很先進的,不能因為這件事就說支付寶系統不穩(wěn)定。

  但業(yè)內人士也表示,這件事對整個行業(yè)而言,是備災工作的警鐘!斑\營維護無小事!币患疑虡I(yè)銀行銀行網絡銀行部門人士向財新記者表示,“支付寶這次糗了”。

  接近監(jiān)管機關的人士表示,電纜屬于物理基礎,即使是阿里云也要靠物理基礎,基礎出故障,只能說對安全重視程度不夠。安全管理的應有之義就是應急處置,各機構應深知安全生產事件(包括自然災害、“別人”挖斷光纖等不外部因素)的突發(fā)性、嚴重性,在提及技術體系的先進性時應小心謹慎,謹防出現黑天鵝事件。這次支付寶電纜事故后引流時間這么長,說明安全管理值得加倍重視。

  那么,支付機構的備災系統通常有哪些?國際支付機構人士表示主要有三個方式,即異地容災、活備份、多運營商網絡通道。

  其中,“異地容災”是指服務器集群分散放置在多個中心機房、多個城市、甚至多個大洲。

  “活備份”也稱“熱備份”,就是實時備份、實時切換啟用備份的服務器集群。熱備份主要是相對于溫備份和冷備份,溫備份通常不是實時切換至備份服務器。冷備份通常需要人工干預。備份可用于多個不同的層面,從底層的運營商網絡通信、安全防護、數據中心內部的網絡通信、安全防護、服務器集群、存儲到應用層等等各個方面均會有不同程度的備份。

  “備份越分布式、越充分、越實時則容災能力越強,但其采購及運營管理成本也是以數量級上升的。不容易,同業(yè)估計都真心不會看笑話、說風涼話。”國際支付機構人士表示。

  “多運營商網絡通道”是指通過多家運營商數據網絡連接。某大行電子銀行部人士對財新記者表示,數據傳輸通常分為兩塊,一塊是機房連接到公用網絡再連接到客戶的,一塊是內部通訊的。目前外界無法判斷支付寶的電纜斷掉是哪一段。通常而言,這兩種數據傳輸都有線路備份,即通過多家數據運營商連接,無論其中一段中斷,可以立刻切換到其他運營商的線路上,所以通常不會因為一條線路斷掉而影響對外服務。

  除此以外,銀行為防止系統癱瘓,還會采取“多數據中心”的備災模式。以工行為例,工行有兩處數據中心,上海是主中心,北京是備份中心,一兩分鐘就可以從上海切換到北京,所以不會長時間對外暫停服務;中國銀聯在京滬兩地有三個數據中心,隨時自動切換。銀聯對切換速度要求是2分鐘;國際卡組織Visa在全球有四個數據中心,切換速度可以快達零秒。

  事故原因疑云

  盡管對系統故障表示理解,但業(yè)內人士普遍認為2.5小時的故障“不應該這么久”。

  按照支付寶5月27日傍晚發(fā)布的解釋,5月27日傍晚因市政施工導致杭州市某地光纜被挖斷,導致了支付寶一個主要機房被影響,隨后全國部分用戶無法使用支付寶。事情發(fā)生后第一時間,支付寶工程師緊急將用戶請求切換至國內其他機房。但按照常理,一個機房故障,應當立即切到其他機房。原本應當是瞬間完成的工作,卻花費2.5小時,這讓業(yè)內紛紛揣測:支付寶究竟有沒有多機房備份?如果有,為什么切換花費這么久?支付寶此次故障是否另有原因?

  在此之前,支付寶一直得益于自己的“異地多活”系統。所謂“異地多活”,是指在不同的地方設置多個數據中心,活備份數據。“異地多活,實際可行性沒那么強。涉及到數據存儲,基本上出了這種事情沒人敢切到異地,因為擔心異地數據不一致,只有等網絡恢復!睒I(yè)內人士分析道。

  “以支付寶的能力,不應該線路中斷影響這么久。從目前了解到的信息猜測,支付寶容災備份方案肯定未做到最充分,但網絡通信側運營商肯定也難辭其咎。經此一役,估計支付寶會進一步加強異地容災及多運營商網絡通道備份!绷硪晃粯I(yè)內人士表示。

  關于這次事故的原因,有商業(yè)銀行專業(yè)人士認為電纜挖斷是假,機房故障是真!5年前,支付寶就實現了同城但機房故障不影響業(yè)務,所以這次光纖故障可能只是借口,運營網絡背了黑鍋!币灿袠I(yè)內人士認為,因為支付寶會有不同運營商隨時切換,不可能挖斷一條電纜就系統癱瘓。很有可能是因為系統被攻擊或宕機。“歸根結底是支付寶過于自信,沒有建立快速恢復的應急處置機制,應該采取技術人員現場排查、現場研究、現場決策的方式!

  5月27日晚23點,支付寶對切換速度緩慢給出了官方解釋。支付寶表示,“我們作為一個金融系統,對切換中數據與資金安全性的要求極高,因此切換速度上沒有做到更快。后面我們會不斷提升切換速度。但是,這并不代表我們對這次恢復時間是滿意的!闭雇磥,支付寶表示,光纜被挖斷可能并不能完全杜絕,但對于支付寶而言,會繼續(xù)推進技術的升級改造,繼續(xù)完善異地多活的系統架構!拔磥,即使再次出現光纜被挖斷等意外情況,我們進行異地切換時,也盡量做到讓用戶最小感知甚至無感知!敝Ц秾毐硎尽!

聲明:本網登載此文出于傳遞更多信息之目的。如需轉載,請注明文章來源,并署作者名字。
  我要評論 文明上網,理性發(fā)言!嚴禁對個人、實體、民族、國家等謾罵、誣蔑、誹謗!
 
用戶名   匿名發(fā)出 
  相關新聞  
  ·網友曬網購賬單1年花941萬引圍觀 被指網上購房  ·“乞討排行榜”考驗城市管理雅量
  ·央行將推“超級網銀”支付寶或被禁接入網銀系統  ·2009年考研十大熱門專業(yè)
關于我們聯系我們服務條款法律聲明廣告服務站點導航友情連接意見反饋
Copyright 2009-2010, LUCKCOM Co.,All rights reserved