![]()
新智元報(bào)道
編輯:定慧
【新智元導(dǎo)讀】地球現(xiàn)在連顯卡都供不起了,微軟的GPU插不進(jìn)機(jī)房。英偉達(dá)的H100直接飛向太空。
英偉達(dá)的GPU,地球真的已經(jīng)「供不起了」!
今天看到兩個(gè)新聞,一個(gè)是微軟手里囤了無數(shù)的GPU,但是「插不進(jìn)去」。
![]()
另一個(gè)是英偉達(dá)H100 GPU被發(fā)射到太空組建數(shù)據(jù)中心。
![]()
這兩個(gè)事情其實(shí)背后都隱藏著一個(gè)深刻問題:
GPU是造出來了,但是配套服務(wù)于GPU,給GPU供電,給GPU散熱的基礎(chǔ)設(shè)施并沒有跟上!
先說微軟的GPU放在庫房里吃灰這件事。
微軟CEO納德拉在與OpenAI奧特曼的訪談中爆出驚人事實(shí)——微軟手中囤積著大量GPU。
卻「沒有足夠電力」讓它們運(yùn)轉(zhuǎn)。
另一個(gè)原因則更為現(xiàn)實(shí),缺少可以立馬「插入GPU」的數(shù)據(jù)中心。
納德拉坦言:我現(xiàn)在的問題不是芯片不夠,而是沒有能插進(jìn)去的「溫暖機(jī)殼」(Warm Shell)。
所謂「Warm Shell」指的是具備供電與冷卻條件的數(shù)據(jù)中心外殼。
用一個(gè)對(duì)比就能快速理解這個(gè)概念,建筑學(xué)上,相對(duì)Warm Shell則是Cold Shell。
Cold shell指的是建筑結(jié)構(gòu)/外殼基本具備,但室內(nèi)幾乎沒有或只有極少的系統(tǒng)安裝。
![]()
Warm Shell則是更準(zhǔn)備好了的狀態(tài),安裝并可以使用基本的建筑系統(tǒng),比如散熱系統(tǒng)、暖通空調(diào)(HVAC)、照明、基本電/水/消防系統(tǒng)等。
![]()
AI熱潮引發(fā)的芯片競(jìng)賽,如今正受制于最傳統(tǒng)的瓶頸——電力。
美國(guó)電網(wǎng)面臨前所未有的壓力,而科技巨頭則競(jìng)相布局小型核反應(yīng)堆以自救。
與此同時(shí),奧特曼還提到未來可能出現(xiàn)「能在本地運(yùn)行GPT-5或GPT-6」的低功耗消費(fèi)設(shè)備,這或?qū)氐最嵏铂F(xiàn)有數(shù)據(jù)中心商業(yè)模式。
地球養(yǎng)不起,「發(fā)配」到太空
相比奧特曼提出的低功耗設(shè)備,另一個(gè)新聞則提供了新的思路。
英偉達(dá)借助Starcloud的Starcloud-1的衛(wèi)星,將H100送到太空!
11月2日,星期日,英偉達(dá)首次將H100 GPU送入太空,以測(cè)試數(shù)據(jù)中心在軌道上的運(yùn)行方式。
![]()
這款配備80GB內(nèi)存的GPU,比以往任何在太空中飛行的計(jì)算機(jī)都強(qiáng)大一百倍。
支持者認(rèn)為這一想法很合理:
在遠(yuǎn)離地球的太空空曠處,數(shù)據(jù)中心不會(huì)占用寶貴土地,也不需要那么多能源和水來冷卻,也不會(huì)向大氣中排放加劇變暖的溫室氣體。
這次為期三年的任務(wù)將搭乘SpaceX的Bandwagon 4獵鷹9號(hào)(Falcon 9)發(fā)射。
重量為60公斤的Starcloud-1衛(wèi)星將在約350公里高度的非常低軌道繞地飛行。
在那里,它將接收由美國(guó)公司Capella運(yùn)營(yíng)的一隊(duì)合成孔徑雷達(dá)(SAR)地球觀測(cè)衛(wèi)星傳來的數(shù)據(jù),對(duì)其進(jìn)行實(shí)時(shí)處理,并向地面?zhèn)魉拖ⅰ?/p>
GPU上天的好處
而在太空設(shè)立數(shù)據(jù)中心另一大優(yōu)勢(shì)就是,只需回傳很小部分的數(shù)據(jù)。
下行傳輸合成孔徑雷達(dá)(SAR)數(shù)據(jù)歷來是個(gè)大問題,因?yàn)閿?shù)據(jù)量極其龐大。
但能夠在軌處理就意味著我們只需下行傳輸「洞見」。
![]()
什么是洞見?
所謂洞見可能是某艘船在某個(gè)位置以某個(gè)速度朝某個(gè)方向航行。
那只是一小包約1千字節(jié)的數(shù)據(jù),而不是需要下傳的數(shù)百吉字節(jié)原始數(shù)據(jù)。
簡(jiǎn)單來說,就是讓算法貼近數(shù)據(jù)源頭,在本地完成篩選、融合與推理,僅把高價(jià)值的「信息摘要」回傳。
再簡(jiǎn)單點(diǎn)(但不一定精確),就是數(shù)據(jù)都在外太空處理好,只傳送回來結(jié)論。
![]()
這種方式能更好地實(shí)現(xiàn)低時(shí)延響應(yīng)、顯著節(jié)省帶寬與能耗、提升韌性(斷聯(lián)/災(zāi)害場(chǎng)景可持續(xù)運(yùn)行),并降低敏感數(shù)據(jù)外泄風(fēng)險(xiǎn)。
為什么要把GPU送到太空?
和微軟CEO納德拉的煩惱不一樣,Starcloud是主動(dòng)探索這種數(shù)據(jù)中心模式。
就像他們的公司名字一樣,Stra Cloud,太空的數(shù)據(jù)中心。
![]()
當(dāng)然這么做的主要驅(qū)動(dòng)力不是為了GPU降溫。
而是地球能源與資源的瓶頸:
地球數(shù)據(jù)中心太耗能了!
到2030年,全球數(shù)據(jù)中心的耗電量預(yù)計(jì)將等于整個(gè)日本的用電量。
同時(shí),它們每天要消耗海量冷卻用水(1 MW 級(jí)中心≈1000人日用水量)。
相比下來,太空則是有天然優(yōu)勢(shì)。
無限太陽能:軌道上 24 小時(shí)都有陽光,無需電池儲(chǔ)能。
零土地占用:不需要地面建設(shè),不破壞生態(tài)。
無溫室氣體排放:不依賴化石能源。
歸根到底,還是現(xiàn)在AI的算力需求爆炸。
AI模型越做越大(如GPT、Claude、Gemini等),能源和冷卻成本飛漲,企業(yè)急需新解法。
因此,太空數(shù)據(jù)中心被視為長(zhǎng)期可擴(kuò)展的解決方案。
通過利用低成本、持續(xù)不斷的太陽能,并避免占用土地和使用化石燃料,Starcloud的技術(shù)使數(shù)據(jù)中心能夠快速且可持續(xù)地?cái)U(kuò)展,隨著數(shù)字基礎(chǔ)設(shè)施的發(fā)展,這有助于在保護(hù)地球氣候和關(guān)鍵自然資源的同時(shí)實(shí)現(xiàn)增長(zhǎng)。
那太空能「散熱」嗎?
另一個(gè)值得一提的就是,很多人覺得GPU上天,是因?yàn)榈厍蛱珶幔蘸蒙帷?/p>
其實(shí)不是的。
太空能散熱,但很困難。
太空幾乎沒有空氣,所以不能用風(fēng)扇或液體循環(huán)帶走熱量(這叫對(duì)流散熱)。
對(duì)流散熱指的是「熱的流體(液體或氣體)移動(dòng),把熱量從一個(gè)地方帶到另一個(gè)地方」的過程。
只剩下輻射散熱這一種方式:
輻射散熱是「物體通過電磁波/紅外波,把熱量以波的形式發(fā)射出去」的過程。
設(shè)備通過紅外輻射向外太空釋放熱量。
散熱效率取決于輻射面積、材料發(fā)射率和溫度。
因此衛(wèi)星或太空GPU需要大面積的散熱板(radiators),設(shè)計(jì)極其關(guān)鍵。
![]()
在Starcloud的項(xiàng)目中,這部分被特別強(qiáng)化:
他們?yōu)镠100設(shè)計(jì)了專用熱輻射系統(tǒng),利用真空中的高溫差和導(dǎo)熱材料實(shí)現(xiàn)散熱。
為了給地球省電、省地、省水,去太空建數(shù)據(jù)中心靠譜嗎?
Starcloud的首席執(zhí)行官兼聯(lián)合創(chuàng)始人約翰斯頓說:
我的預(yù)期是,在十年內(nèi),幾乎所有新建的數(shù)據(jù)中心都會(huì)建在太空。
原因純粹是我們?cè)陉懙厣厦媾R的能量限制。
約翰斯頓說在太空中唯一的額外成本就是發(fā)射費(fèi)。
發(fā)射成本在每公斤約(美)500 美元時(shí)能夠達(dá)到收支平衡。按每千克計(jì)算,SpaceX的星艦在完全投入運(yùn)營(yíng)后,發(fā)射價(jià)格估計(jì)在150美元到僅10美元不等。
隨著星艦的投入使用,我們預(yù)計(jì)發(fā)射成本會(huì)更低。
Starcloud已經(jīng)在規(guī)劃其下一次任務(wù),計(jì)劃明年將一個(gè)計(jì)算能力比Starcloud-1強(qiáng)十倍的數(shù)據(jù)中心送入太空。
![]()
Starcloud-2任務(wù)將配備英偉達(dá)的Blackwell GPU和若干H100。
約翰斯頓表示,該任務(wù)將提供7千瓦的計(jì)算能力,預(yù)計(jì)為包括地球觀測(cè)衛(wèi)星運(yùn)營(yíng)商客戶提供商業(yè)服務(wù)。
微軟的「沒有溫暖機(jī)殼」,和Starcloud把H100送上天,本質(zhì)上是同一道題。
AI再厲害,算力需求再大,也不能突破物理定律。
參考資料:
https://www.starcloud.com/starcloud-2
https://spectrum.ieee.org/nvidia-h100-space
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.