在陽泉,探密百度AI“心臟”
二 心臟到底有多強?
走進百度陽泉云計算中心的機房之內(nèi),就會發(fā)現(xiàn)一排排機柜統(tǒng)一排列,機柜上的服務(wù)器的風扇聲嗡嗡作響。機房的溫度明顯比室外高了一截。
這是百度“心臟”的聲音與溫度。百度的“心臟”到底有多強,我們可以從這幾個維度來進行解析。
1、性能和效率
“心臟”想要跳的快,一方面需要“心臟”本身有力度,另外一方面則是需要血管供血足。對AI的“心臟”來說則是兩個點,一是算力強,另一方面也要數(shù)據(jù)傳輸快。
百度陽泉云計算中心目前已上線服務(wù)器超過15萬臺。包括了天蝎整機柜服務(wù)器、“冰山”冷存儲服務(wù)器、X-MAN超級AI計算平臺等多種百度自研計算系統(tǒng)。像去年年底百度最新發(fā)布AI計算平臺X-MAN3.0每秒可完成2000萬億次深度神經(jīng)網(wǎng)絡(luò)計算。這種強大的計算能力都是為了適應(yīng)AI時代的運算要求。
為這種強大算力“供血”的“血管”則是百度自主研發(fā)高性能交換機。提供超大規(guī)模的網(wǎng)絡(luò)吞吐,支持10G、25G的通用計算網(wǎng)絡(luò)接入和100G的AI高速無損網(wǎng)絡(luò)互聯(lián)技術(shù)。百度通過大帶寬、低時延、無損網(wǎng)絡(luò),讓數(shù)據(jù)中心數(shù)十萬臺服務(wù)器連接成了一個超級計算機。
2、容災(zāi)和備災(zāi)
“心臟”作為人最重要的器官當然一刻都不能停止,數(shù)據(jù)中心作為心臟當然也不能停。云計算中心里設(shè)備價格昂貴,一旦發(fā)生不可預知的災(zāi)難,對企業(yè)將造成嚴重損失。設(shè)備損壞等有形的損失可以彌補,而寶貴的數(shù)據(jù)丟失造成的損失則是無法計算的。
在移動互聯(lián)網(wǎng)時代,一個數(shù)據(jù)中心的服務(wù)器一旦出現(xiàn)短時間抖動,就會導致刷不了淘寶、付不了支付寶,在全網(wǎng)產(chǎn)生討論。
AI時代服務(wù)器出問題,可能會導致自動駕駛車輛失控,鋼鐵能源工業(yè)客戶面臨數(shù)以億計的經(jīng)濟損失。
因此,數(shù)據(jù)中心的容災(zāi)備災(zāi)顯得及其重要。而百度陽泉云計算中心通過AI控制,數(shù)據(jù)中心的運維從人工走向智能,可以實現(xiàn)大數(shù)據(jù)分析和診斷,迅速縮短故障維修時間。過去30分鐘的網(wǎng)絡(luò)故障排查直接縮減到了5分鐘。
當問到一旦出現(xiàn)自然災(zāi)害、意外火災(zāi)等極端意外情況下百度陽泉云計算中心要如何應(yīng)對時,百度系統(tǒng)部總監(jiān)張炳華提到:
從業(yè)務(wù)部署角度,百度數(shù)據(jù)中心計算資源采用了N+1的冗余設(shè)計,用戶的流量有多個入口,可以繞道其他數(shù)據(jù)中心。在入口層面也有一套智能調(diào)度的系統(tǒng)。
百度內(nèi)部甚至做過這樣一個極端測試——關(guān)掉任何一個數(shù)據(jù)中心,用戶端也不會有任何感知,服務(wù)也不會受到任何影響。
我簡單翻譯一下這段話。大概相當于百度有好幾顆“心臟”,即使是一顆“心臟“出現(xiàn)故障,其他心臟也可以在故障的那一瞬間隨時頂上。
事實上,截止4月8日,百度陽泉云計算中心已安全運行1744天。目前也還尚未遇到這些極端意外情況。
3、能耗和環(huán)保
某種意義上說,科技企業(yè)也是高能耗企業(yè)。因為龐大的服務(wù)器群組每天處理各種數(shù)據(jù),產(chǎn)生了龐大的能源消耗。
國家層面在今年9月發(fā)布了《關(guān)于加強綠色云計算中心建設(shè)的指導意見》,提出到2022年全國新建大型、超大型云計算中心PUE(云計算中心總設(shè)備能耗/IT設(shè)備能耗,越接近1表明能效越高,是云計算中心領(lǐng)域衡量能源效率的權(quán)威指標)需達到1.4以下。
這個指導意見的目的在于逼迫科技企業(yè)提高自身技術(shù),做到節(jié)能環(huán)保。
2018年8月,Uptime Institute發(fā)布的《2018數(shù)據(jù)中心調(diào)查報告》顯示2018年全球數(shù)據(jù)中心PUE為1.58。
阿里所有自研云計算中心平均PUE已經(jīng)低于1.3,即使是谷歌業(yè)務(wù)關(guān)鍵應(yīng)用和廣告系統(tǒng)也都運行在PUE 1.2的云計算中心上。
令人意外的是,百度陽泉云計算中心的PUE突破了1.10,達到1.09,能源效率國內(nèi)第一,每年可節(jié)電量可達2.5億度,相當于13萬戶居民一年的用電量。
三 為AI+5G+IoT未雨綢繆
百度陽泉云計算中心可以說是目前國內(nèi)云計算中心的頂級水準,而且和百度目前的AI戰(zhàn)略以及面向未來的業(yè)務(wù)布局高度匹配。
我曾在《春晚紅包宕機史,也是半部中國互聯(lián)網(wǎng)技術(shù)進步史》中提到:
春晚的流量規(guī)模,未來可能正是5G和IoT時代的“常規(guī)需求”。提前排兵布陣,百利無一害。
2017年,微軟CEO納德拉在曾經(jīng)提到過一個信息,在1992年互聯(lián)網(wǎng)每天流量總量是100G。今天一個手機就能存下所有的數(shù)據(jù)。
服務(wù)器和計算中心的算力、存儲進化史,其實也是世界互聯(lián)網(wǎng)的技術(shù)進步史;ヂ(lián)網(wǎng)的發(fā)展,伴隨著IT算力、存儲能力的指數(shù)級提升。
2018年全球有70億臺IoT 設(shè)備,有機構(gòu)預測到2020年全球?qū)⒂?00億臺設(shè)備同時連接網(wǎng)絡(luò),2023年則是有790億設(shè)備連接到物聯(lián)網(wǎng)。5G時代流量每小時所產(chǎn)生的數(shù)據(jù)高達數(shù)百GB,預計將處理比4G多1000倍的數(shù)據(jù)。
當代哲學家西閃在《國家的計算》中對計算有過這樣一個論述:
在現(xiàn)實世界的“賭局”中,帕斯卡的上帝已經(jīng)隱退,取而代之的,是作為信仰的“未來”。它像一個永恒的獎杯,在時間的盡頭閃閃發(fā)光。而計算則取代了程式化的行為訓練,演變成為一種新的思維習慣。
百度作為一家面向AI的企業(yè),它的業(yè)務(wù)同樣無處不體現(xiàn)著計算的魅力——信息流、智能云、無人車……所有數(shù)據(jù)都要經(jīng)過服務(wù)器存儲、計算、傳輸,最終實現(xiàn)業(yè)務(wù)落地。
百度陽泉云計算中心恰恰是在為AI+5G+IoT時代做準備。
請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
-
即日-10.29立即報名>> 2024德州儀器嵌入式技術(shù)創(chuàng)新發(fā)展研討會
-
10月31日立即下載>> 【限時免費下載】TE暖通空調(diào)系統(tǒng)高效可靠的組件解決方案
-
即日-11.13立即報名>>> 【在線會議】多物理場仿真助跑新能源汽車
-
11月14日立即報名>> 2024工程師系列—工業(yè)電子技術(shù)在線會議
-
12月19日立即報名>> 【線下會議】OFweek 2024(第九屆)物聯(lián)網(wǎng)產(chǎn)業(yè)大會
-
即日-12.26火熱報名中>> OFweek2024中國智造CIO在線峰會
推薦專題
- 1 Intel宣布40年來最重大轉(zhuǎn)型:年底前裁員15000人、拋掉2/3房產(chǎn)
- 2 因美封殺TikTok,字節(jié)股價骨折!估值僅Meta1/5
- 3 宏山激光重磅發(fā)布行業(yè)解決方案,助力智能制造產(chǎn)業(yè)新飛躍
- 4 國產(chǎn)AI芯片公司破產(chǎn)!白菜價拍賣
- 5 具身智能火了,但規(guī)模落地還需時間
- 6 三次錯失風口!OpenAI前員工殺回AI編程賽道,老東家捧金相助
- 7 國產(chǎn)英偉達們,抓緊沖刺A股
- 8 英偉達的麻煩在后頭?
- 9 將“網(wǎng)紅”變成“商品”,AI“爆改”實力拉滿
- 10 智慧貨架管理引領(lǐng)零售新風尚
- 高級軟件工程師 廣東省/深圳市
- 自動化高級工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級銷售經(jīng)理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術(shù)專家 廣東省/江門市
- 封裝工程師 北京市/海淀區(qū)
- 結(jié)構(gòu)工程師 廣東省/深圳市