Just How Bad Would an AI Bubble Be?
整個美國經(jīng)濟正依賴于人工智能帶來的生產(chǎn)力提升預期,但這種預期似乎遠未成為現(xiàn)實。
![]()
插畫:《大西洋月刊》 圖片來源:Sean Gladwell / Getty; Flavio Coelho / Getty.
若說有哪個領域已被宣稱因人工智能崛起而使人類面臨淘汰,且超級智能時代已悄然降臨,那一定是編程領域。正因如此,近期一項研究的結果才格外令人震驚。
這項于7月發(fā)表的研究中,智庫“模型評估與威脅研究”(Model Evaluation & Threat Research,簡稱METR)將一組經(jīng)驗豐富的軟件開發(fā)者隨機分組,讓他們在使用或不使用人工智能工具的情況下完成編程任務。這是迄今為止對人工智能在現(xiàn)實場景中表現(xiàn)最嚴謹?shù)臏y試。由于編程是現(xiàn)有人工智能模型已基本掌握的技能之一,幾乎所有相關人士都預計人工智能會大幅提升生產(chǎn)力。在實驗前對專家的調查中,平均預測認為人工智能能讓開發(fā)者的工作效率提升近40%。實驗結束后,參與者估計人工智能讓他們的效率提高了20%。
但當METR團隊分析開發(fā)者的實際工作產(chǎn)出時,卻發(fā)現(xiàn)使用人工智能的開發(fā)者完成任務的速度,比不使用人工智能時慢了20%。研究人員對此感到震驚。“沒人預料到這個結果,”該研究的作者之一內特·拉什告訴我,“我們甚至根本沒考慮過效率下降的可能性。”
任何單一實驗都不能作為最終結論,但許多人工智能專家認為,METR的這項研究已是目前最具說服力的成果——它也有助于解釋當下人工智能領域看似矛盾的局面。一方面,美國正經(jīng)歷一場由人工智能推動的非凡經(jīng)濟繁榮:得益于與人工智能相關的科技巨頭估值飆升,股市一路走高;同時,數(shù)千億美元投入數(shù)據(jù)中心及其他人工智能基礎設施,也為實體經(jīng)濟注入動力。支撐所有這些投資的核心信念是:人工智能將極大提升勞動者生產(chǎn)力,進而將企業(yè)利潤推向難以想象的高度。
另一方面,越來越多的證據(jù)表明,人工智能在現(xiàn)實世界中并未實現(xiàn)預期效果。投入最多資金研發(fā)人工智能的科技巨頭,距離收回投資仍遙遙無期。研究顯示,試圖融入人工智能的企業(yè),其利潤幾乎未受任何積極影響。而經(jīng)濟學家們試圖尋找人工智能導致就業(yè)崗位流失的證據(jù),結果大多一無所獲。
這些現(xiàn)象并不意味著人工智能最終無法如最狂熱的支持者所宣稱的那樣具備變革性。但“最終”可能意味著漫長的等待。這引發(fā)了一種可能性:我們目前正處于人工智能泡沫之中,投資者的熱情已遠超該技術短期內能帶來的生產(chǎn)力收益。若這一泡沫破裂,其破壞力可能讓互聯(lián)網(wǎng)泡沫破裂相形見絀——而遭受損失的,絕不僅僅是科技巨頭及其硅谷支持者。
幾乎所有人都認同,編程是當前人工智能技術最令人印象深刻的應用場景。在開展這項最新研究之前,METR最知名的成果是3月的一份分析報告:該報告顯示,最先進的人工智能系統(tǒng)能完成普通人類開發(fā)者需近一小時才能完成的編程任務。那么,為何在此次實驗中,人工智能反而降低了開發(fā)者的生產(chǎn)力?
答案與“能力-可靠性差距”有關。盡管人工智能系統(tǒng)已學會完成一系列令人驚嘆的任務,但在現(xiàn)實場景中,它們難以達到所需的穩(wěn)定性和準確性要求。例如,METR 3月那份研究的結果基于“50%的成功率”,這意味著人工智能系統(tǒng)僅能在一半的時間里可靠地完成任務——這使其本質上無法獨立發(fā)揮作用。這種差距讓人工智能在工作場景中的應用頗具挑戰(zhàn)。即便是最先進的系統(tǒng),也會犯小錯誤或對指令產(chǎn)生輕微誤解,這就需要人類仔細檢查其產(chǎn)出,并在必要時進行修改。
最新研究中似乎就出現(xiàn)了這種情況。開發(fā)者最終花費大量時間檢查并修改人工智能生成的代碼——這些時間往往比他們自己直接編寫代碼所需的時間還要多。一名參與者事后將這一過程描述為“相當于在數(shù)字世界里,有個過分自信的初級開發(fā)者在你身后盯著看(指干擾工作)”。
自實驗開展以來,人工智能編程工具的可靠性已有提升。此外,該研究聚焦的是專業(yè)開發(fā)者,而人工智能提升生產(chǎn)力的最大潛力,或許在于增強(或替代)經(jīng)驗不足的勞動者的能力。但METR的研究也可能高估了人工智能相關的生產(chǎn)力收益。許多知識型工作任務比編程更難實現(xiàn)自動化——編程之所以易于自動化,得益于海量訓練數(shù)據(jù)和清晰的成功標準。“編程是人工智能系統(tǒng)往往能做得極其出色的領域,”進步研究所(Institute for Progress)新興技術政策主任蒂姆·菲斯特告訴我,“因此,若連在編程領域,人工智能都無法提高開發(fā)者的生產(chǎn)力,那可能會徹底改變人們對人工智能如何影響整體經(jīng)濟增長的看法。”
“能力-可靠性差距”或許能解釋,為何生成式人工智能至今未能為使用它的企業(yè)帶來切實成果。麻省理工學院的研究人員近期追蹤了300個公開披露的人工智能項目,發(fā)現(xiàn)95%的項目未能為企業(yè)利潤帶來任何提升。麥肯錫咨詢公司3月的一份報告顯示,71%的受訪企業(yè)表示在使用生成式人工智能,但超過80%的企業(yè)稱該技術對收益“無切實影響”。鑒于這些趨勢,科技咨詢公司高德納(Gartner)近期宣布,人工智能已進入技術發(fā)展的“幻滅低谷期”(trough of disillusionment)。
或許人工智能的發(fā)展只是暫時遇挫。斯坦福大學經(jīng)濟學家埃里克·布林約爾松認為,所有新技術都會經(jīng)歷“生產(chǎn)力J型曲線”:起初,企業(yè)難以有效部署技術,導致生產(chǎn)力下降;但最終,企業(yè)會學會整合技術,生產(chǎn)力隨之飆升。最典型的例子是電力——19世紀80年代電力已出現(xiàn),但直到20世紀10年代亨利·福特重新設計工廠生產(chǎn)模式后,企業(yè)才開始從電力中獲得巨大的生產(chǎn)力提升。一些專家認為,人工智能經(jīng)歷這一過程的速度會快得多。“就人工智能而言,我們正處于J型曲線早期的下降階段,”布林約爾松告訴我,“但到21世紀20年代后半段,它肯定會迎來爆發(fā)。”Anthropic公司首席執(zhí)行官達里奧·阿莫代伊預測,到2027年,“或稍晚一點”,人工智能將“在幾乎所有領域都超越人類”。
這些預測的前提是,人工智能將繼續(xù)保持過去幾年的快速發(fā)展勢頭。但這并非必然。新一代人工智能模型屢屢遭遇延遲發(fā)布或項目取消;今年發(fā)布的模型,盡管研發(fā)成本遠高于以往,但總體上的重大改進卻更少。3月的一項調查中,人工智能促進協(xié)會(Association for the Advancement of Artificial Intelligence)詢問了475名人工智能研究人員:當前的人工智能開發(fā)方法能否打造出與人類智力相當或超越人類的系統(tǒng)?超過四分之三的受訪者表示“不太可能”或“極不可能”。
OpenAI最新模型GPT-5歷經(jīng)近三年研發(fā)、投入數(shù)十億美元后,于上月初發(fā)布(《大西洋月刊》于2024年與OpenAI達成企業(yè)合作)。發(fā)布前,首席執(zhí)行官山姆·奧特曼宣稱,使用GPT-5“相當于指尖擁有了一位真正的、能應對任何領域的博士級專家”。在包括編程在內的少數(shù)領域,GPT-5確實實現(xiàn)了重大突破。但從衡量人工智能性能的多數(shù)嚴謹標準來看,GPT-5充其量只是比之前的模型有小幅改進。
行業(yè)內的主流觀點認為,企業(yè)遲早會找到下一種推動人工智能快速發(fā)展的方法。這種情況或許會發(fā)生,但遠非板上釘釘。
生成式人工智能并非首個因過度炒作而風靡的科技潮流。當前局面的特殊性在于,人工智能似乎正支撐著整個美國經(jīng)濟的運轉。2023年以來,標普500指數(shù)超過一半的漲幅僅來自7家公司:字母表(Alphabet)、亞馬遜(Amazon)、蘋果(Apple)、元宇宙(Meta)、微軟(Microsoft)、英偉達(Nvidia)和特斯拉(Tesla)。這7家公司被統(tǒng)稱為“七大科技巨頭”(Magnificent Seven),被認為在人工智能革命中處于特別有利的地位,有望蓬勃發(fā)展。
然而,除了股價,這種“蓬勃發(fā)展”在其他方面幾乎未見蹤影(唯一例外是英偉達——它為其他“七大科技巨頭”提供關鍵投入品,即先進芯片)。據(jù)《華爾街日報》報道,過去兩年,字母表、亞馬遜、元宇宙和微軟的自由現(xiàn)金流下降了30%。據(jù)估算,截至今年年底,自2024年初以來,元宇宙、亞馬遜、微軟、谷歌(Google)和特斯拉在人工智能相關資本支出上的總投入將達5600億美元,而人工智能相關收入僅為350億美元。OpenAI和Anthropic的收入可觀且增長迅速,但仍遠未實現(xiàn)盈利。它們的估值(分別約為3000億美元和1830億美元,且仍在上升)是當前收入的數(shù)倍(OpenAI預計今年收入約130億美元;Anthropic預計為20億至40億美元)。投資者正大舉押注:所有這些投入很快將帶來創(chuàng)紀錄的利潤。但如果這種信念崩塌,投資者可能會開始大規(guī)模拋售股票,導致市場出現(xiàn)劇烈且痛苦的回調。
20世紀90年代互聯(lián)網(wǎng)革命期間,投資者基于“互聯(lián)網(wǎng)將徹底改變商業(yè)”的信念,向幾乎所有名稱中帶有“.com”的公司投入資金。然而到2000年,企業(yè)燒錢卻無實際成果的局面已十分明顯,投資者隨即開始拋售估值過高的科技股。2000年3月至2002年10月,標普500指數(shù)下跌了近50%。最終,互聯(lián)網(wǎng)確實改變了經(jīng)濟,并催生了人類歷史上一些最盈利的公司。但這并未阻止大量投資者血本無歸。
互聯(lián)網(wǎng)泡沫破裂造成了嚴重影響,但并未引發(fā)危機。而人工智能泡沫破裂可能會有所不同。占經(jīng)濟比重而言,當前人工智能相關投資已超過互聯(lián)網(wǎng)泡沫鼎盛時期電信行業(yè)的投資水平。今年上半年,企業(yè)在人工智能上的支出對GDP增長的貢獻,超過了所有消費者支出的總和。許多專家認為,美國經(jīng)濟之所以能在關稅壓力和大規(guī)模驅逐移民的情況下仍未陷入衰退,一個主要原因在于,用一位經(jīng)濟學家的話說,這些人工智能支出起到了“大規(guī)模私營部門刺激計劃”的作用。人工智能泡沫破裂可能會導致整體支出減少、就業(yè)崗位流失、增長放緩,甚至可能將經(jīng)濟拖入衰退。經(jīng)濟學家諾亞·史密斯認為,若為該行業(yè)擴張?zhí)峁┐罅抠Y金的不受監(jiān)管的“私人信貸”貸款同時違約,還可能引發(fā)金融危機。
若我們確實處于人工智能泡沫之中,也有一個積極面:對人工智能突然導致就業(yè)崗位流失的擔憂被夸大了。經(jīng)濟學家薩拉·埃克哈特和內森·戈德施拉格近期開展的一項分析中,通過五種不同的人工智能接觸度衡量標準,評估了這項新技術對一系列勞動力市場指標的影響,結果發(fā)現(xiàn)它對這些指標幾乎沒有任何作用。例如,他們指出,受人工智能影響最小的勞動者(如建筑工人和健身教練)的失業(yè)率上升速度,是受影響最大的勞動者(如電話營銷員和軟件開發(fā)者)的三倍。其他大多數(shù)研究(盡管并非全部)也得出了類似結論。
但還存在一種更奇怪的中間可能性:即便人工智能工具無法提高生產(chǎn)力,圍繞它們的炒作仍可能促使企業(yè)繼續(xù)擴大其應用范圍。“我從企業(yè)那里反復聽到同樣的說法,”麻省理工學院經(jīng)濟學家達龍·阿西莫格魯告訴我,“中高層管理者接到老板的指令:為了讓董事會滿意,他們工作中必須有X%的內容要使用人工智能。”這些企業(yè)甚至可能裁員或放緩招聘——因為它們像METR研究中的軟件開發(fā)者一樣,堅信人工智能提高了自身生產(chǎn)力,即便實際情況并非如此。其結果將是失業(yè)率上升,且無法通過實際生產(chǎn)力提升來抵消這一影響。
盡管這種情況聽起來不太可能,但在不久前的過去,類似事件曾真實發(fā)生過。計算機科學家卡爾·紐波特在其2021年的著作《沒有電子郵件的世界》(A World Without Email)中指出,20世紀80年代起,計算機、電子郵件、在線日歷等工具讓知識型工作者能夠自主處理溝通事務和安排會議。隨后,許多公司決定解雇秘書和打字員。但結果事與愿違:高技能員工開始花費大量時間發(fā)送電子郵件、撰寫會議紀要和安排會議,導致他們在實際工作上的生產(chǎn)力大幅下降,企業(yè)不得不雇傭更多人手來完成同等工作量。后來對20家財富500強企業(yè)的研究發(fā)現(xiàn),那些因計算機技術導致“人員配置失衡”的企業(yè),在薪資上的支出比實際所需多了15%。“電子郵件是那種讓人感覺生產(chǎn)力提高、但實際效果相反的技術,”紐波特告訴我,“我擔心我們在人工智能領域可能正重蹈覆轍。”
話又說回來,若另一種結局是股市崩盤引發(fā)衰退或金融危機,那么上述情況或許還不算太糟。
作者羅杰·卡瑪(Rogé Karma)是《大西洋月刊》的一名撰稿人。
說明:本號刊發(fā)來自各方的文章,是為了獲得更全面的信息,不代表本號支持文章中的觀點。由于微信公眾號每天只能推送一次,無法即時更新,本站目前在騰訊新聞發(fā)布最新的文章,每天24小時不間斷更新,請收藏以下地址(請完整復制),隨時刷新:
https://news.qq.com/omn/author/8QIf3nxc64AYuDfe4wc%3D
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.