在“AGI 近在咫尺”的熱潮中,這位 AI 領(lǐng)域的核心人物選擇踩下了剎車。Andrej Karpathy,曾任特斯拉 AI 總監(jiān)、OpenAI 創(chuàng)始成員的硅谷頂尖技術(shù)專家,近日在 Dwarkesh Patel 的播客中發(fā)表了一場長達(dá)兩個多小時的深度對話,并在隨后發(fā)布的長文中系統(tǒng)闡述了他對人工智能發(fā)展的思考。
從 AGI 時間表、強(qiáng)化學(xué)習(xí)的局限、智能體的真實(shí)能力,到教育與人類未來的圖景,Karpathy 系統(tǒng)地提出了一個核心觀點(diǎn):“AGI 仍需十年。但這是一個樂觀、但需要冷靜面對的十年。”
他以自動駕駛的十年征途、代碼生成的缺陷、以及“無聲崩潰”的模型現(xiàn)象,為當(dāng)前整個行業(yè)對未來的狂熱預(yù)期校準(zhǔn)了表達(dá)方式。
![]()
(來源:youtube @ Dwarkesh Patel)
近年來,隨著大型語言模型(LLM)能力的飛躍,從“AI 元年”到“AGI 元年”的口號不絕于耳,行業(yè)內(nèi)的普遍預(yù)期似乎已將 AGI 的實(shí)現(xiàn)壓縮到了短短幾年之內(nèi)。Karpathy 對此持有保留態(tài)度。他認(rèn)為,當(dāng)前行業(yè)中彌漫著過度預(yù)測的傾向,而這種過于激進(jìn)的期待忽視了現(xiàn)實(shí)層面的復(fù)雜性和偶然性。他強(qiáng)調(diào),更加準(zhǔn)確的表述應(yīng)該是我們正步入“智能體的十年(Decade of Agents)”。
從業(yè)二十年的經(jīng)驗告訴 Karpathy,當(dāng)前被寄予厚望,認(rèn)為可以替代實(shí)習(xí)生、甚至是正式員工工作的的智能體,目前來說“根本還跑不通”。他指出了當(dāng)前智能體存在的根本性認(rèn)知缺陷(Cognitive Deficits)——缺乏真正的持續(xù)學(xué)習(xí)能力。也就是說,你無法真正教會它們某件事,它們的多模態(tài)能力仍處初級階段。在 Karpathy 看來,這些問題無疑是棘手的和困難的,但也是可以克服的。但解決這些問題,至少需要一個十年的尺度。
但這并不代表 Karpathy 正在唱衰 AGI 的未來,相反,他想強(qiáng)調(diào)人類確實(shí)在過去幾年里取得了 LLM 帶來的驚人進(jìn)展,但距離能在任意崗位上取代人類的通用智能,仍有漫長的系統(tǒng)集成與現(xiàn)實(shí)約束需要克服,包括對物理世界的感知、執(zhí)行、社會協(xié)調(diào)、安全與防護(hù)等層面。
Karpathy 的“十年之論”很大程度上源于他領(lǐng)導(dǎo)特斯拉自動駕駛五年的深刻教訓(xùn)。他指出,自動駕駛領(lǐng)域存在一個巨大的演示(Demo)到產(chǎn)品(Product)的鴻溝。盡管在 1986 年就存在過卡車自動駕駛的演示,Karpathy 本人在 2014 年體驗 Waymo 時,也獲得了近乎完美的駕駛體驗,但縱觀過去十年,自動駕駛行業(yè)仍步履蹣跚。
Karpathy 使用了三個“九”來形容這一過程:實(shí)現(xiàn) 90% 的可靠性(第一個九)相對容易,但從 90% 到 99%(第二個九),再到 99.9%(第三個九),“每增加一個九,都需要投入與之前同樣多的工作量”。在特斯拉的五年里,他們可能只推進(jìn)了兩到三個“九”。相同的增長曲線也存在于 AI 智能體的發(fā)展中,尤其是涉及高風(fēng)險的軟件工程領(lǐng)域。一個表現(xiàn)近乎完美的 AI 程序員,如果每七年(相當(dāng)于自動駕駛的平均事故間隔)犯一個重大錯誤,就可能泄露數(shù)億人的社保號碼,其后果是災(zāi)難性的。
目前,行業(yè)對 AGI 路徑的最大賭注之一是“AI 自動化 AI 研究”,即 AI 智能體通過編寫代碼實(shí)現(xiàn)遞歸式自我改進(jìn)。然而,Karpathy 以自己構(gòu)建 nanochat(一個 ChatGPT 的極簡復(fù)刻版)的親身經(jīng)歷,對此提出了反對意見。他發(fā)現(xiàn),在編寫這種智力密集型的、非樣板化的新代碼時,現(xiàn)有的 AI 編程助手幾乎沒有幫助。他將當(dāng)前的代碼 AI 斥為殘次品(Slop)。
具體而言,Karpathy 認(rèn)為 AI 的認(rèn)知缺陷表現(xiàn)在三個層面:
第一是無法理解“定制化”:當(dāng) Karpathy 沒有使用 PyTorch 標(biāo)準(zhǔn)的 DDP(分布式數(shù)據(jù)并行)容器,而是編寫了自己的同步程序時,AI 助手完全無法理解,并非常焦慮地試圖讓他用回標(biāo)準(zhǔn)庫;
第二是“臃腫與過時”:Karpathy 認(rèn)為,AI 助手傾向于過度防御,編寫大量“try-catch”語句,試圖構(gòu)建生產(chǎn)級代碼庫,導(dǎo)致代碼臃腫,并且頻繁使用“已棄用的 API”;
第三是“高昂的溝通成本”:他發(fā)現(xiàn)用自然語言向 AI 解釋自己想要什么(Vibe Coding)效率極低,遠(yuǎn)不如自己定位到代碼,輸入前幾個字母,讓自動補(bǔ)全來完成。
一言以蔽之,Karpathy 認(rèn)為整個行業(yè)都高估了 AI 的自主性。他更認(rèn)同于自動滑塊(Autonomy Slider)的比喻:AI 目前更像是一個更好的編譯器或語法高亮(highlight),而不是一個自主的程序員。人類正在緩慢地提升自己的抽象層次,但遠(yuǎn)未到被取代的時刻。
同時,Karpathy 多次批評強(qiáng)化學(xué)習(xí)(RL),認(rèn)為它是用吸管吸監(jiān)督信號的低效方式。在他看來,RL 的信號稀薄且嘈雜存在著錯誤答案可能被獎勵(誤打誤撞),和正確推理可能被懲罰(后續(xù)出錯)的情況。他看好的是新的學(xué)習(xí)范式,比如系統(tǒng)提示學(xué)習(xí)(System Prompt Learning)與基于智能體交互的學(xué)習(xí)(Agentic Interaction)。
這些思路試圖讓模型通過持續(xù)交互和任務(wù)驅(qū)動形成學(xué)習(xí)閉環(huán),而不是靠脆弱的獎勵函數(shù)。
他認(rèn)為,ChatGPT 的記憶系統(tǒng)就是這種新型學(xué)習(xí)范式的早期原型。
除此之外,Karpathy 還提出了 Cognitive Core(認(rèn)知核心)的概念,即通過剝離模型的記憶能力,讓它更好地泛化。他指出,人類記憶有限,反而形成了強(qiáng)大的抽象與推理能力;
而 LLM 記憶過多,傾向于復(fù)述,而非理解。因此,有意限制模型記憶,可能是一種“正則化”。他還提出,一個反直覺的趨勢是:“模型必須先變得更大,然后才能變得更小”——先獲得足夠的多樣性,再提煉出核心結(jié)構(gòu)。
對于業(yè)界最關(guān)心的AGI 是否會帶來經(jīng)濟(jì)爆炸問題,Karpathy 給出了最出人意料的答案:不會。
他預(yù)測,AGI 的到來,將平滑地“融入”過去數(shù)百年 2% 的 GDP 年增長曲線中。Karpathy 認(rèn)為,AI 并非一種全新的、能打破規(guī)律的技術(shù),它從根本上是計算的延伸。縱觀歷史,無論是計算機(jī)的發(fā)明、互聯(lián)網(wǎng)的普及,還是 iPhone 的誕生,這些“革命性”技術(shù)都沒有在 GDP 曲線上造成一個突兀的“尖峰”。它們的影響是巨大的,但擴(kuò)散是緩慢的、漸進(jìn)的,最終都被平滑地吸收到 2% 的增長中。
“我們已經(jīng)處于一場智能爆炸中數(shù)十年了,”Karpathy 說,“只是我們在以慢動作的方式經(jīng)歷它”。從工業(yè)革命開始,自動化和遞歸式自我改進(jìn)就一直在發(fā)生。編譯器是早期的軟件自動化,Google 搜索、IDE,乃至今日的 AI,都只是這條平滑曲線上的最新一步。AGI 不會改變這條曲線的斜率,它只是“使我們能繼續(xù)保持在 2% 增長軌跡上”的原因。
![]()
(來源:X @Andrej Karpathy)
在為行業(yè)的狂熱降溫后,Karpathy 也分享了自己的下一步——創(chuàng)辦教育項目“Eureka”。他坦言,他最恐懼的未來不是 AGI 失控,而是《機(jī)器人總動員》(WALL-E)或《蠢蛋進(jìn)化論》(Idiocracy)中的景象:人類被 AI 剝奪了權(quán)力,淪為無用的旁觀者。
他將自己的項目比作“星際艦隊學(xué)院”(Starfleet Academy),一個旨在培養(yǎng)人類精英、駕馭前沿技術(shù)的機(jī)構(gòu)。他認(rèn)為,教育是一個構(gòu)建知識坡道的、高難度的技術(shù)問題。Karpathy 描繪了一個“AGI 之后”的教育圖景。屆時,教育的目的不再是有用(為了賺錢),而是有趣(for fun)。他將其比作去健身房:現(xiàn)代人不需要強(qiáng)大的體力來搬運(yùn)重物,但人們依然健身,因為它“有趣、健康,而且‘六塊腹肌’看起來很性感”。
他相信,當(dāng) AI 消除了學(xué)習(xí)的“摩擦力”(那種因為太難或太簡單而“碰壁”的痛苦感),學(xué)習(xí)本身將成為一種樂趣和自我實(shí)現(xiàn)。在 Karpathy 的設(shè)想中,人類的未來不是被機(jī)器取代,而是借助技術(shù),實(shí)現(xiàn)“超人化”的認(rèn)知繁榮。
參考資料:
1.https://www.dwarkesh.com/p/andrej-karpathy
2.https://x.com/karpathy/status/1979644538185752935
運(yùn)營/排版:何晨龍
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.