百度:如何優化多數據中心的帶寬成本?
互聯網企業的外網需要向運營商支付高額的費用。并且隨著云服務的蓬勃發展,Internet用戶數量和流量的急劇增加,網絡容量也從數年前的10G快速增長到1T,10T甚至更大。由于峰...
作者介紹
熊亞軍,目前在百度負責 IT (網絡、服務器)設備監控平臺研發。
主題簡介
本文將主要從以下幾個部分同大家探討:
1.多數據中心的特點及計費模式
2.數據中心的外網流量特點
3.外網流量優化的困難和挑戰
4.如何更充分利用付費帶寬
5.未來展望思考
一、多數據中心的特點及計費模式
背景:隨著互聯網業務的快速發展,大型互聯網公司數據中心的數量和網絡復雜程度也在急速上升。
多數據中心的網絡
和Google 的網絡類似,大型互聯網企業的網絡一般可以分為:
◆數據中心內部網絡(Data Center Networks)
◆WAN網(即Wide Area Networks)
其中, 按照流量的方向,可將WAN網分為兩張骨干網:
◆內網:數據中心之間互聯的網絡(Inter-DC WAN,類似Google B4),用來連接互聯網企業在地理上分布的多個數據中心。
◆外網:面向Internet用戶訪問的網絡(Internet-Facing WAN),用來提供面向用戶的云服務,如搜索、視頻、下載。
帶寬的計費模式
互聯網企業的外網(Internet-Facing WAN)需要向運營商支付高額的費用。
并且,隨著云服務的蓬勃發展,Internet用戶數量和流量的急劇增加,網絡容量也從數年前的10G快速增長到1T,10T甚至更大。
在數據中心的成本中,外網的帶寬費用越來越引起關注。其中,常見的外網計費模式有以下幾個:
1.峰值計費:對數據中心出口的帶寬周期(如5分鐘)采樣,按照一個月的最大帶寬采樣值進行計費。大多數數據中心都采用峰值計費的收費模式。
2.95計費:同樣進行周期采樣,去掉最大5%的采樣點,按照剩下的最大帶寬采樣值進行計費。
3.日均峰值計費:同樣進行周期采樣,每天有一個帶寬峰值,按照一個月內每天的帶寬峰值的均值進行計費。
二、數據中心的外網流量特點
一個簡單的峰值計費例子
峰值計費模式下,根據數據中心一個月的出口帶寬峰值進行收費。
如下圖所示,為某互聯網公司數據中心的流量圖,這個數據中心在第一天的夜里22點到達峰值,依據該點的帶寬峰值進行計費。
很顯然,在非峰值時刻,該數據中心可以(免費的)使用更多流量。
如下圖的綠色部分,我們將數據中心能免費使用的流量稱為該數據中心的空閑帶寬。
在峰值計費的收費模式下,每個數據中心都有可觀的空閑帶寬,而這些帶寬并沒有被充分的利用起來。
特別的,某些特殊的日子會導致非常高的流量峰值,如京東618、雙十一或某部熱門劇集發布。
數據中心在這個月其它時間的帶寬值都遠遠小于流量峰值,存在大量空閑帶寬。
一個日均峰值計費例子
有些數據中心采用日均峰值計費的模式。
和峰值計費類似,日均峰值的數據中心也有大量空閑帶寬沒有被充分利用起來。
如下某互聯網公司數據中心的流量圖中,非當日峰值的時刻,這個數據中心的流量遠小于當日的峰值,也存在非??捎^的空閑帶寬。
-
無相關信息