Inside the Data Centers That Train A.I. and Drain the Electrical Grid
一個數據中心的耗電量堪比費城,它如今是美國的新型工廠,既創造著未來,也支撐著經濟。這樣的局面能持續多久?
本文即將刊登于2025 年 11 月 3 日《紐約客》雜志,印刷版標題為:“Information Overload.”作者:Stephen Witt著有“The Thinking Machine”一書 。
![]()
“我確實認為,世界上的很多地方終會布滿數據中心,”OpenAI首席執行官山姆·奧特曼曾這樣表示。插圖繪制:Jun Cen
從美國幾乎任何一座城市出發,往幾乎任何方向行駛,不久后你都會看到一座數據中心——它像一個巨大的白色盒子,從平整過的土地上拔地而起,兩側是發電機,周圍圍著柵欄,活像個監獄大院。用于人工智能的數據中心是美國的新型工廠。這類中心里塞滿了計算設備,接收信息并輸出人工智能成果。自2022年ChatGPT推出以來,它們的數量開始以驚人的速度激增。“我確實認為,隨著時間推移,世界上的很多地方都會布滿數據中心,”OpenAI首席執行官山姆·奧特曼最近說道。
美國領先的人工智能數據中心獨立運營商是CoreWeave,該公司成立于8年前,最初只是一次隨意的嘗試。2017年,紐約一家中等規模對沖基金的交易員決定開始挖掘加密貨幣,并用這些貨幣作為他們夢幻足球聯盟的入場費。為了挖掘加密貨幣,他們購買了一塊圖形處理器(GPU),這是英偉達公司生產的一款高性能微芯片。這款GPU原本是面向視頻游戲玩家銷售的,但英偉達提供的一款軟件能將其變成一臺低成本超級計算機。“從資本回報率的角度來看,這個嘗試非常成功,所以我們開始擴大規模,”CoreWeave的聯合創始人之一布萊恩·文圖羅告訴我,“要是能在五天左右收回成本,誰都會想多做幾次這樣的生意。”
不到一年時間,這些交易員便辭去了對沖基金的工作,購買了數千塊GPU,放在新澤西州文圖羅祖父的車庫里運行。2018年加密貨幣市場崩盤后,CoreWeave從破產的礦工那里收購了更多微芯片。不久之后,該公司打造了一個平臺,讓外部客戶能夠使用這些GPU。隨后在2022年,文圖羅偶然發現了Stable Diffusion——一款生成圖像的人工智能工具。他向這款人工智能輸入不同場景的描述,它便生成了精準且精美的插圖。“這東西一定會讓全世界為之著迷,”文圖羅回憶起當時的想法時說道。
Stable Diffusion的訓練是在與CoreWeave設備類似的英偉達設備上完成的。文圖羅和他的聯合創始人嗅到了一生中難得的商業機遇。CoreWeave籌集了1億美元,幾乎全部用來購買英偉達的硬件。不久后,英偉達首席執行官黃仁勛安排了與他們的會面。“他花了大約十分鐘調侃我是新澤西來的,”文圖羅說。但最終,英偉達收購了該公司的一部分股份。到2022年年中,CoreWeave開啟了一項全新的業務:為人工智能開發者和滿是英偉達設備的倉庫牽線搭橋。
現代數據中心的建設始于20世紀90年代,當時商業互聯網剛剛興起。數據中心承載著網站運營、電子郵件協調、支付處理以及視頻和音樂流媒體傳輸等功能。亞馬遜在建設數據中心方面格外積極——弗吉尼亞州勞登縣修建了大量數據中心,該地區也因此被稱為“數據中心走廊”。甚至在人工智能熱潮興起之前,數據中心就已經有利可圖;在某些年份,亞馬遜網絡服務部門的利潤超過了公司的零售業務,而其銷售額卻遠低于零售業務。
但隨著英偉達GPU的問世以及大規模人工智能訓練的開展,數據中心行業發生了翻天覆地的變化。2022年11月,ChatGPT推出后迅速走紅。“整個世界都為之瘋狂,”文圖羅說。微軟與OpenAI合作,為ChatGPT的運行提供所需的數據中心算力支持。當微軟無法滿足需求時,便轉而尋求CoreWeave的幫助。
使用英偉達硬件如今成了一種身份象征——標志著使用者在人工智能領域是認真的。與工程師們談論這些設備時,我不禁想起有一次看到一群年輕人冒著嚴寒排起長隊,只為購買街頭潮牌Supreme的運動鞋。
今年早些時候,CoreWeave上市了。文圖羅和他的聯合創始人如今都成了億萬富翁。該公司擁有數十萬塊GPU,其平臺除了為OpenAI提供服務外,還為Meta(元宇宙)和其他主要實驗室的模型提供訓練支持。
今年夏天,我參觀了CoreWeave位于拉斯維加斯郊區的一處設施。這是一棟大型倉庫式建筑,周圍圍著厚厚的柵欄,每隔一段距離就裝有監控攝像頭。我穿過旋轉門,一名穿著防彈背心、腰間別著泰瑟槍的保安上前接待了我。交出手機后,我從自動分發器里拿了兩副酸橙綠顏色的耳塞,然后進入了設施內部。
陪同我的有三位CoreWeave的工程師,這些技術達人適應超大規模資本主義的方式,就像達爾文筆下的雀類適應加拉帕戈斯群島一樣。來自公司總部的雅各布·云特身材瘦削、能言善辯,頭發梳得一絲不茍。克里斯托弗·康利戴著墨鏡、留著胡子,熱情地為我講解設備相關知識,他主要負責硬件方面的工作。肖恩·安德森曾是大學籃球中鋒,身高七英尺(約2.13米),穿著一件印有“更多節點”(MOAR NODES)字樣的T恤。
他們所說的“節點”,是一個個淺淺的計算設備托盤,每個托盤重約70磅(約31.75千克),裝有4塊水冷GPU以及一系列其他設備。將18個這樣的托盤堆疊起來,再用電纜連接到一個控制單元,就組成了英偉達GB300計算機架。這種機架比冰箱略高一些,成本高達數百萬美元。在業務繁忙的年份,一個普通機架的耗電量會超過100戶家庭的總耗電量。數十個這樣的機架一直延伸到視野盡頭。
CoreWeave將這些機架放在白色的金屬機柜里,這樣既有助于散熱,也能減弱噪音。康利打開一個機柜的門,讓我查看運行中的機架,一股氣流撲面而來。噪音大得驚人,仿佛我打開了一個掃帚間,卻發現里面有一臺正在運轉的噴氣式發動機。我看著閃爍的指示燈和旋轉的風扇。“耳鳴是這里的職業風險,”康利對著我大喊。
我環顧四周,設施內有數百個一模一樣的機柜。我們上方是一條金屬走道,走道兩側排列著為計算設備供電的配電裝置。我不禁聯想到修道院中的修士、兵營里的士兵、牢房中的囚犯。我好奇,什么樣的人會自愿在這樣的地方工作?“人力資源部門告訴我,我不能再問這類問題了,但我喜歡招聘那些能承受很多痛苦的人,”云特后來說道,“比如耐力運動員這類人。”
CoreWeave沒有告訴我那天是哪家客戶在使用他們的技術,但云特暗示,我們所看到的這場模型訓練規模并不大。他開始詳細介紹機架的配置。我根本聽不清他在說什么,只能像在夜總會聊天那樣,故作睿智地點著頭。即便塞了耳塞,我的耳朵還是開始嗡嗡作響,頭也漸漸疼了起來。云特轉向我。“有時候,某個客戶會一次性占用整個場地好幾周,”他大喊道,頭發在風扇排出的氣流中飄動,“我們把這種情況稱為‘英雄級運行’(hero runs)。”
CoreWeave的硬件可以從頭開始完整地訓練出一個人工智能模型。軟件開發人員通常在硅谷的工作站上,將一個名為“權重”(weights)的數字文件以及海量訓練數據上傳到數據中心。這些訓練數據可以是文本、圖像、醫療記錄,實際上幾乎可以是任何內容。在初始設置中,“權重”是隨機的,此時的人工智能不具備任何能力。
之后,會讓人工智能接觸一部分訓練數據,并要求它對接下來可能出現的內容做出預測——比如一個句子中接下來的幾個字母。未經訓練的人工智能做出的預測肯定是錯誤的,但至少它能從中學會不該怎么做。“權重”必須經過調整,才能吸收這一新信息。背后的運算過程十分復雜,尤其依賴一種名為“矩陣乘法”的運算。
1940年,數學家G·H·哈代寫道:“美感是第一道考驗:丑陋的數學在世界上不會有長久的立足之地。”然而,我們的文明如今正將大量富余資源投入其中的矩陣乘法,卻毫無美感可言,就像一個人用錘子往木板上釘釘子一樣。它既不優美,也不對稱:事實上,在矩陣乘法中,a乘以b并不等于b乘以a。隨著矩陣規模不斷擴大,完成這些算術運算需要強大的計算能力。最新的大型語言模型可能包含約一萬億個獨立“權重”。要完成這類模型的“英雄級運行”,可能需要持續數周時間,動用數萬個GPU,進行10的24次方次運算——這個數量比宇宙中可觀測到的恒星數量還要多。
數據中心必須與當地電力公司合作,才能應對這些訓練任務。在CoreWeave的數據中心,流經微芯片的水進入時是室溫,流出時卻比熱水澡的水溫還要高。這些水會先在儲水箱中冷卻,然后再循環回系統中。機房內空氣的溫度、濕度和顆粒含量也都受到嚴密監控。“冷凝水是我們的大敵,”康利嚴肅地說。
所有這些微芯片、電力、風扇、資金、數據、水冷泵和電纜——這一切的存在,都是為了調整“權重”這個小小的數字文件。這個文件小到可以存放在一個外置硬盤里,但其重要性卻不言而喻。開發這個“權重”文件以及類似文件所投入的資金,是人類歷史上規模最大的資本投入之一。
當訓練完成后,“權重”文件的副本會分發到全國各地的數據中心,用戶可以通過互聯網訪問這些副本,這個過程被稱為“推理”(inference)。用戶提出問題,促使人工智能生成一個個名為“令牌”(tokens)的智能單元。一個“令牌”可能是一小塊像素,也可能是一個單詞的片段。人工智能要寫出一篇大學學期論文,大約需要生成5000個“令牌”,所消耗的電力相當于一臺微波爐以最大功率運行約3分鐘。隨著人工智能要處理的請求越來越復雜——無論是生成視頻、音頻,還是提供心理咨詢——對計算能力的需求將會成倍增長。
再乘以每周使用ChatGPT的8億多人,數據中心數量激增的現象就不難理解了。如今,ChatGPT的受歡迎程度已經超過維基百科;年輕人把它簡稱為“Chat”,就像“Google”(谷歌)代表互聯網搜索一樣,“Chat”成了人工智能的代名詞。我曾與微軟的一位數據中心高管交談,他認為未來我們對人工智能的需求會像現在對互聯網或電力的需求一樣,變得不可或缺,而目前的數據中心建設規模可能還不夠。“我更擔心的是我們建得太少,而不是太多,”這位高管說。
微軟是數據中心領域的主要運營商之一,這項業務已成為推動美國經濟增長的主要動力。盡管微軟仍在開發操作系統和辦公軟件,但正是投資者對數據中心的看好,推動其市值達到約4萬億美元,成為全球市值第二高的公司。為微軟提供微芯片的英偉達公司,則位居全球市值榜首。
要進入微軟的數據中心并非易事,難度堪比進入諾克斯堡(美國聯邦黃金儲備庫)。這些設施中正在開發的人工智能價值連城。“以往,要是想偷價值連城的東西,人們會想‘開卡車來運’,”CoreWeave的首席技術官彼得·薩蘭基告訴我,“但在這里,有人只要帶個U盤進去,就能把OpenAI的全部知識產權都拷貝走。”
不過今年秋天,在打了仿佛有200通電話之后,我終于受邀參觀了微軟一處正在建設的大型數據中心園區。我承諾不拍照、將手機留在外面、不詳細描述內部細節,也不透露該設施在美國的具體位置。9月,我驅車長途跋涉,來到了一個偏僻之地。這個數據中心周圍是農田,該地區至少還有其他三家公司正在建設數據中心。田野里縱橫交錯地布滿了高壓電塔的電線,到處都在冒出一個個丑陋的大型盒子。
該園區的外部沒有任何微軟的標識——甚至連一個標牌都沒有。柵欄后面,經過好幾個車輛檢查站,園區內一片空曠,只有一個角落排列著一排編了號的棚屋。這些棚屋是白色的,窄而高,長度相當于好幾個足球場;它們讓我想起了小時候在明尼蘇達州博覽會上看到的牲畜棚。每個棚屋的兩側都排列著柴油發電機和工業空調。
我參觀時,那里已有5個棚屋,規劃中大約會建10個。到處都是工程車輛:高空作業車、推土機、裝載著電纜卷的卡車。有人在我要參觀的那間棚屋前做了些綠化,幾株小植物在樹蔭下生長著。
在棚屋內部,我見到了朱迪·普里斯特和史蒂夫·所羅門,兩人都是微軟高管,他們的職業生涯一直在管理倉庫大小的計算機系統。普里斯特是一名電氣工程師,畢業于麻省理工學院,眉毛修剪得很精致,一頭金色卷發十分惹眼。所羅門是機械工程師,回答我的問題時總是滔滔不絕地講技術細節。兩人似乎都對能參與這場新的工業革命感到興奮不已。普里斯特興奮地講述了她最近一次就醫的經歷:看完病后,她收到了一份由人工智能輔助生成的、記錄她與醫生對話的摘要。所羅門的立體聲音響出了點問題,他拍了一張音響背面接口的照片,上傳到了Chat(ChatGPT)。他告訴我,人工智能回復了7種可能的故障排除方案。說到這里,他的語氣略微有了些變化,在我看來,這表明他在表達某種情緒。“第三種方案管用了,”他說。
穿上鋼頭靴,看完一場PowerPoint演示后,我通過了一個安檢口,進入了核心區域。這個設施比CoreWeave的數據中心更安靜、更整潔,空間也更寬敞。數百組一模一樣、閃爍著指示燈的服務器和計算設備連接在冷卻站旁,嗡嗡作響地運行著,占據了大部分地面空間。用扎帶捆扎好的線纜束沿著天花板延伸:有電線、數據線,還有水管和氣管。這些線纜連接到更大的線纜束,進而與其他棚屋相連,使所有棚屋的設備能協同工作,形成一臺一體化的巨型計算機。僅這5個棚屋,用于計算的區域總面積就相當于20個足球場。
普里斯特解釋說,一次高級別的模型訓練可能會占用整個系統長達一個月的時間。我和一名技術人員站在控制中心,監控著電力消耗情況。我們看著功率數值不斷飆升——這表明計算機正在處理訓練數據;隨后功率又降了下來——此時計算機正在將結果寫入文件。隨著人工智能從一個檢查點進入下一個檢查點,這種功率的起伏不斷重復。在這棟建筑的某個地方,模型正在不斷優化;在這棟建筑的某個地方,計算機正在學習如何“思考”。
離開數據中心后,我迫切地想與人交流。沿著公路開了半英里(約0.8千米),我看到一個谷倉的頂部從一處正在建設的數據中心后面露了出來。我駕車穿過一片滿是灰色建筑、灌溉渠、電線和翠綠田野的區域,最終抵達了一個塵土飛揚的院子,院子里停滿了拖拉機和皮卡車。在那里,我見到了一位第四代苜蓿種植戶,他穿著藍色牛仔褲、格子襯衫,戴著一頂繡有油罐車圖案的棒球帽。
這位農民指了指橫穿他田地的電線,這些電線是當地電力公司在20世紀40年代鋪設的。“我們一直覺得這些東西是個累贅,”他說,“我們認為它們會降低土地價值。”但如今,他表示,能接入變電站成了一件極其劃算的事——他的一個鄰居稱,自己把一塊農田賣給了一家數據中心開發商,每英畝(約0.4公頃)的價格超過100萬美元,這比農場一輩子能產出的價值還要高。這位農民說,他家也在一點點地出售土地。
農場北邊有一座新建的數據中心,東邊還有一座正在建設。微軟那片廣闊的設施占據了整片視野,它就建在他家自1979年起就一直在耕種的一塊土地上。他告訴我,自己打算很快搬走——周圍的環境已經不適合耕種,甚至不適合人類居住了。
我問這位農民,住在數據中心旁邊,有沒有注意到對環境產生的影響。他說,對供水的影響不大。“說實話,我們用的水可能比他們還多,”他說。(訓練一個最先進的人工智能模型所需的水量,比一平方英里(約2.59平方千米)農田一年的用水量還要少。)但電力情況就不一樣了:這位農民表示,當地電力公司計劃三年內第三次提高電價,最近一次提議的漲幅達到了兩位數。最讓他痛心的是那些富含養分的表層土壤——他家通過精心的作物輪作,一直養護著這些土壤。“微軟調來一臺挖掘機,一天之內就把所有土壤都挖走了!”他說,語氣像是在談論一件遺失的傳家寶,“足足有6到10英尺(約1.8到3米)厚,全沒了。”
我們看著一只黃色的狗站起身,繞著小圈子走了走,然后又回到樹蔭下睡著了。樹的后面,有一座巨大的長方形倉庫,把樹都比得矮小了。我問這位農民是否用過人工智能。“我用Claude,”他說,“谷歌現在不行了。”
數據中心正開始給美國電網帶來巨大壓力。1999年,星座能源公司收購了三哩島核電站唯一一座仍在運行的反應堆,并在之后20年里一直運營該反應堆。2019年,該公司關閉了這座反應堆,認為它在經濟上已無利可圖。負責管理星座能源公司核電機組的高管布萊恩·漢森為員工舉辦了一場告別派對。“派對上有食物,但沒人想吃,”他說,“氣氛就像在參加葬禮。”
或許不久后,三哩島將再次響起歡慶的派對聲。星座能源公司宣布,將于2027年重新啟用該設施,并將其更名為克蘭清潔能源中心。與微軟簽訂的一份大額合同是促成這一決定的關鍵因素。“要是八年前有人告訴我,我們會重新啟用這座核電站,我絕對不會相信,”漢森說。(該核電站的第二座反應堆曾在1979年發生放射性氣體泄漏事故,此次仍將保持關閉狀態。)
像漢森這樣的能源行業高管,每天都會收到大量要求增加供電的請求。他表示,數據中心“所需的電力規模,可能比我們以往接入電網的任何用戶都要大一個數量級。你可以想象一下,費城這座城市的電力負荷約為10億瓦。現在,想象一下要在電網上增加多個10億瓦規模的數據中心,而且不止一個,而是好多個。”
當一座數據中心投入運營時,零售用電客戶通常也要分擔電費成本:2025年上半年,美國各電力公司申請的零售電價漲幅總額接近300億美元。今年春季,電力公司申請的電價漲幅幾乎是去年同期的兩倍。彭博社的一項分析估計,在數據中心周邊地區,過去五年內批發電價上漲了200%以上。而且電價很可能會繼續上漲——發電廠的發電量遠遠無法滿足需求。谷歌前首席執行官埃里克·施密特表示,美國需要為全國電網新增920億瓦的電力供應,才能滿足數據中心的需求,這相當于再增加92個費城的電力消耗量。如果電力供應不足,美國的人工智能開發者可能會被中東和中國的同行超越,這些地區目前已在推進大型數據中心項目。
數據中心要想實現經濟可行性,必須24小時不間斷運行。(我參觀的那座微軟數據中心,每年允許的非計劃停機時間僅為5分15秒。)風能、太陽能等依賴天氣條件的可再生能源,目前只能滿足這類需求的一小部分。核能也無法拯救我們,至少短期內不行;漢森表示,要在美國新建任何大型核反應堆,都需要數年時間。他語氣中帶著羨慕地告訴我:“中國正在建設26座核反應堆。”
短期內,新建數據中心的電力供應將主要依賴化石燃料。開發商們紛紛在馬塞勒斯頁巖(阿巴拉契亞地區一個巨大的地下天然氣儲層)等天然氣儲量豐富的地區購置土地。今年4月,總部位于賓夕法尼亞州的荷馬城重建公司宣布,計劃將匹茲堡郊外一座已閑置的燃煤電廠改造為美國最大的天然氣發電廠,該電廠幾乎將專門為數據中心供電,發電量可達約45億瓦。據一家環保非營利組織稱,荷馬城發電廠每小時可能向大氣中排放多達400萬磅(約181.44萬千克)二氧化碳,相當于400萬輛汽車怠速時的排放量。
據估計,目前地球正以每十年0.3攝氏度的速度變暖,這一速度大約是冰河時代末期的10倍。上一個冰河時代結束后,海平面上升了400英尺(約121.92米)。像荷馬城這樣的發電廠以及全球范圍內更多類似設施的建成,將加速這一災難性進程。而特朗普政府對此的回應是,限制在政府官方溝通中使用“氣候變化”一詞。
數據中心還會造成局部污染。埃隆·馬斯克旗下的xAI公司在孟菲斯的博克斯敦(一個以非洲裔美國人為主的社區)附近建造了一座以天然氣為動力的數據中心。該地區本就是田納西州哮喘急診就診率最高的地方,自從這座發電廠建成后,會加重哮喘病情的二氧化氮濃度又飆升了9%。富裕地區則試圖阻止數據中心的建設。2024年11月,在弗吉尼亞州沃倫頓(華盛頓特區的一個富裕郊區),選民們罷免了支持新建亞馬遜數據中心的市議會成員,選舉出了反對開發的新一屆議會成員。(弗吉尼亞州鄰近縣的民主黨人安·惠勒因支持數據中心建設而失去了職位,她抱怨稱,活動人士持有一種“香蕉心態”(BANANA),即“任何地方都絕對不能新建任何設施”(Build Absolutely Nothing Anywhere Near Anyone)。)
未來幾年,數據中心建設預計將占美國國內生產總值的2%到3%。19世紀,鐵路建設對美國國內生產總值的貢獻估計為6%。鐵路改變了美國,創造了巨大的財富(盡管分配不均),但當時的鐵路建設熱潮也催生了歷史上規模最大的投機泡沫之一。隨后便爆發了1893年的經濟大恐慌:失業率飆升,數百家銀行倒閉,民粹主義情緒高漲,動搖了美國的政治格局。
投資公司黑石集團總裁、另類資產管理負責人喬恩·格雷,提到了羅恩·切爾諾所著的約翰·D·洛克菲勒傳記。“很多鐵路公司都破產了!”他說,“你得努力避免這種問題,因為你根本不知道最終結局會怎樣。”黑石集團已發行債券用于建設數據中心;為了避免成為破產的一員,格雷會通過與微軟、亞馬遜等科技巨頭簽訂15年的租賃協議來對沖風險,這些科技巨頭是目前信用評級最高的客戶群體之一。通常情況下,除非已有確定的客戶,否則黑石集團不會投資建設數據中心。“這不像在邁阿密或迪拜投資公寓,”格雷說。
數據中心持續建設的前提是,在棚屋里安裝更多英偉達芯片,就能開發出更先進的人工智能。到目前為止,這一前提已被證明是正確的:最新一代人工智能的性能達到了前所未有的水平。OpenAI的GPT-5甚至能夠自主開發其他相對簡單的人工智能。然而,“芯片越多,智能越高”并非鐵律,研究人員也不完全清楚這種“規模效應”為何會存在。人工智能領域先驅德米斯·哈薩比斯在談到規模效應時表示:“我們是否會遇到瓶頸,這是一個需要實證檢驗的問題。沒人能給出確切答案。”
也有可能出現某種技術創新,使這種超大規模建設變得不再必要。今年早些時候,中國公司深度求索(DeepSeek)公布了一種似乎更高效的人工智能訓練模式,消息一出,英偉達的股價應聲暴跌,單日市值蒸發近6000億美元(不過后來股價已回升)。
唐納德·特朗普已將數據中心建設列為國家優先事項;科技公司高管們在白宮宣布新項目,也漸漸成了一種慣例。但為了迎合特朗普,這些高管可能會夸大其詞。在9月的一次白宮晚宴上,馬克·扎克伯格表示,未來幾年,Meta將在數據中心及相關基礎設施上投入6000億美元。當時麥克風還開著,扎克伯格俯身對特朗普小聲說:“抱歉,我還沒準備好。我不確定你想讓我報哪個數字。”亞馬遜全球數據中心運營負責人凱里·珀森告訴我,電力公司對一些新的數據中心開發商提出的供電請求持懷疑態度。“看看這些請求隊列中的需求量,再看看建設所需的資金規模,你就會發現,根本沒有那么多錢,”珀森說。
盡管人工智能擁有種種驚人能力,但它可能會讓投資者失望。它或許會成為一種無利可圖的商品:Claude、Grok、Gemini和ChatGPT的功能都十分相似,而且技術創新很快就會被競爭對手復制。科技巨頭們其實并沒有無限的資金:隨著微軟、Meta等公司在數據中心競賽中投入巨資,它們的現金儲備正在不斷減少。投資者的預期可能也不切實際:美國股市的估值比率已接近互聯網泡沫時期的水平,風險投資市場也變得過熱。“投資者通常不會給一個只有6個人的團隊幾十億美元,卻連產品都沒有。這種情況很罕見,但如今卻在發生,”杰夫·貝佐斯最近表示。
話雖如此,也有可能這些炒作并非毫無根據。英偉達首席執行官黃仁勛(我最近出版了他的傳記)是世界級計算機科學家,正是他生產的微芯片,讓人工智能時代成為可能。“以前,我們每兩年才能推出新的芯片,”微軟工程師普里斯特說,“現在,每隔幾個月就能有新芯片問世。”英偉達目前約占標準普爾500指數市值的8%,這是至少45年來單一股票在該指數中占比最高的水平。黃仁勛能否持續研發出更先進的芯片,關系重大。如果美國人想安享退休生活,英偉達就必須取得成功。
水、電力和土地都是稀缺資源,但正如其名稱所示,數據中心最寶貴的“商品”其實是數據。Claude的訓練數據來自LibGen(圖書館 genesis),這是一個龐大的盜版電子書庫,可通過種子文件下載。今年9月,Claude的開發者Anthropic公司同意向這些書籍的版權持有人支付15億美元賠償金,平均每項侵權賠償約3000美元——這是歷史上金額最大的集體訴訟版權侵權和解案。(本刊包括我在內的部分人員也在索賠人之列。)針對OpenAI和英偉達的類似訴訟仍在審理中。
微軟并不知道客戶會向其數據中心上傳什么內容——這些數據屬于客戶私有。很難判斷人工智能時代版權侵權的規模,但在我看來,相比之下,Napster(早期音樂共享平臺)的侵權行為就像交換混音磁帶一樣微不足道。現代人工智能的開發方式,是先收集所有能獲取的在線數據——包括音頻、視頻、幾乎所有英文出版物,以及超過30億個網頁——至于后續的法律問題,則留給律師去解決。
但如今,人們開始談論“數據短缺”的問題。據估計,已建立索引的互聯網上約有400萬億個單詞,但正如OpenAI聯合創始人安德烈·卡帕西所指出的,其中大部分都是“毫無價值的垃圾”。高質量文本的獲取難度更大。研究人員表示,如果當前趨勢持續下去,到2026年至2032年間,人工智能開發者可能會耗盡可用的人類文本數據。由于人工智能聊天機器人是在“回收”現有內容,它們難免會陷入陳詞濫調,表達方式也會很快變得乏味。要讓它們生成新穎、高質量的文字并非易事——我自己就嘗試過。
微軟的普里斯特告訴我,她并不擔心數據耗盡:除了文本,還有廣闊的數據領域等待探索,人工智能開發者才剛剛起步。下一個前沿領域是“世界模型”數據,這些數據將用于訓練機器人。大量視頻數據和空間數據將被輸入數據中心,用于開發自主機器人。英偉達的黃仁勛也想進軍這個市場,去年他曾在舞臺上與兩個可移動機器人一同亮相。在洛杉磯,我曾在無人駕駛汽車后面等待過,最近還差點撞上一輛自主配送車。但直到最近一次北京之行,我才真正開始明白機器人革命將會是什么樣子。
在中國,機器人隨處可見。我在商場里看到它們整理貨架、打掃衛生。有一次,我在酒店房間點了外賣,送餐的是一個兩英尺高、外形像垃圾桶的輪式機器人,還帶著孩童般的聲音。我打開門,看到它站在門口,身上裝飾著仿管家服裝的飾品,用普通話嘰嘰喳喳地說著什么,我驚訝不已。機器人正面的艙門彈開,一盤面條滑了出來。它又嘰嘰喳喳地叫了一聲。我接過食物,艙門關上,機器人便通過滾輪離開了。我站在原地,手里拿著餐盤,心里不禁想:我以后還會和人類交流嗎??
說明:本號刊發來自各方的文章,是為了獲得更全面的信息,不代表本號支持文章中的觀點。由于微信公眾號每天只能推送一次,無法即時更新,本站目前在騰訊新聞發布最新的文章,每天24小時不間斷更新,請收藏以下地址(請完整復制),隨時刷新:
https://news.qq.com/omn/author/8QIf3nxc64AYuDfe4wc%3D
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.