<blockquote id="ue9b1"></blockquote>
    
    

    <style id="ue9b1"></style>
      <sub id="ue9b1"><p id="ue9b1"><form id="ue9b1"></form></p></sub>

      <strong id="ue9b1"><button id="ue9b1"><mark id="ue9b1"></mark></button></strong>
      成年午夜性影院,下面一进一出好爽视频,国产无遮挡又黄又爽又色,国产精品爽爽v在线观看无码,国产人妻久久精品一区二区三区,国产伦精品一区二区三区免费迷,国产欧美精品一区二区三区,日韩精品一区二区三区视频
      網易首頁 > 網易號 > 正文 申請入駐

      Meta裁員、OpenAI重組:萬字復盤谷歌起筆的AI史詩,如何被改寫劇本

      0
      分享至

      機器之心報道

      編輯:+0

      近期各大 AI 公司大動作頻出,Meta FAIR 部門遭裁員、OpenAI 資本重組、AWS 大裁員……這一系列動蕩表明 AI 行業正從「無限淘金熱」轉向殘酷的「陣地戰」。資本開始重新評估價值,巨頭們在激烈的軍備競賽中也不得不審視成本與效率。

      那么,這場「陣地戰」是怎么打起來的?巨頭們手里的牌、背上的包袱,又是怎么來的?

      知名科技播客《Acquired》最近的一期節目,以谷歌(Google)的 AI 發展史與戰略為主線,巧妙地穿插了其他 AI 巨頭的崛起歷程,節目幾乎涵蓋了當今 AI 領域大部分的關鍵人物,為聽眾系統地梳理出一部簡明的 AI 發展史。



      • 播客地址:https://www.acquired.fm/episodes/google-the-ai-company

      本文將循著《Acquired》這期節目的討論脈絡,同時深入挖掘并征引節目中提及的兩本關鍵著作《In the Plex》與《Genius Makers》(中文版:深度學習革命)中的相關細節,結合當下 AI 圈現狀,對 AI 的發展歷史與大公司戰略博弈進行一次深度的復盤。

      刻在谷歌基因里的 AI 目標

      不同于許多后來者,人工智能并非谷歌在某個階段才「轉向」的風口,而是從誕生之初就是其核心理念。

      1998 年,Google 成立。創始人之一 Larry Page 將谷歌視為一家人工智能公司,這很大程度上源于他父親——一位早期就專注于機器學習和人工智能領域的計算機科學教授的影響。

      讓我們先把時間撥回 42 年前:1956 年。在美國的達特茅斯學院,一群充滿激情的科學家們正式提出了「人工智能(Artificial Intelligence)」這個名字。他們樂觀地相信,用不了多久,具有人類智慧的機器就將出現。



      然而,現實很快給過于樂觀的預言潑了冷水。由于計算能力的限制、數據的匱乏以及理論的瓶頸,許多承諾無法兌現,AI 研究的資金和熱情隨之驟減,進入了長達數十年的兩次「AI 寒冬」。

      在那個 AI 被普遍視為「浪費時間」的年代,Larry Page 父親的堅持就頗具反叛色彩。

      Larry Page 在 2000 年就斷言:「人工智能將是谷歌的終極版本……如果我們擁有終極搜索引擎,它將理解網絡上的一切……這顯然就是人工智能……我們正朝著這個方向努力」。

      甚至可以說,谷歌賴以起家的 PageRank 算法,其本身運用統計方法排序網頁,就已帶有早期 AI 思想的印記。



      「壓縮即理解」

      谷歌 AI 故事的一個關鍵源頭,始于 2000 年末或 2001 年初的一次午餐閑談。早期工程師 George Herrick 向同事 Ben Gomes 及 Noam Shazeer 提出了一個理論:壓縮數據在技術上等同于理解數據。核心在于,高效壓縮并能無損恢復信息的過程,本身就蘊含了對信息的深層理解。

      這個想法吸引了天才工程師 Noam Shazeer。在當時谷歌自由的工程師文化下,Herrick 和 Shazeer 決定全力探索語言模型和機器理解。盡管并非所有人都看好,但 Jeff Dean 等人的支持給了他們信心。

      他們的研究深入到自然語言的概率模型領域,即預測給定詞語序列后,下一個最可能出現的詞語序列是什么。這正是現代 LLM 「Next Token Prediction」思想的早期體現。



      這項研究的首個直接成果,就是谷歌搜索中極為實用的「您是不是要找」(Did you mean)拼寫糾錯功能,由 Shazeer 主導開發。它不僅改善了用戶體驗,還通過減少錯誤查詢,為谷歌節省了大量無效計算資源。

      隨后,他們構建了一個在當時看來相當「大」的語言模型,并將其命名為PHIL(Probabilistic Hierarchical Inferential Learner,概率分層推理學習器)。這個模型很快在谷歌的核心業務中扮演了關鍵角色。

      2003 年,PHIL 被 Jeff Dean 用于快速實現 AdSense 系統,理解網頁內容以匹配廣告。AdSense 一夜之間為谷歌帶來了數十億美元的新收入。

      到了 2000 年代中期,據估計 PHIL 消耗了谷歌數據中心整體資源的 15%,足見其重要性與計算強度。

      機器翻譯與神經網絡

      谷歌對語言理解能力的追求,自然延伸到了機器翻譯領域。

      2007 年前后,由 Franz Och 領導的 Google Translate 團隊,Och 團隊構建了一個基于海量 N-gram(詞語組合)的語言模型,該模型在一個包含兩萬億單詞的谷歌搜索索引子集上進行了訓練。團隊憑借巨大的 N-gram 模型贏得 DARPA 競賽,但模型效率極低,翻譯一句話需 12 小時。

      Jeff Dean 再次介入,他意識到翻譯過程可并行化,利用 Google 強大的分布式計算平臺,與團隊合作在數月內將翻譯時間縮短至 100 毫秒,成功將其投入生產。這成為谷歌第一個生產環境的「大型」語言模型,進一步激發了將此類技術用于更多場景的想象。

      與此同時,另一股更具革命性的思潮也開始悄然叩響谷歌的大門:神經網絡與深度學習。這,得益于 Sebastian Thrun 的引薦。

      這位前斯坦福 AI 實驗室(SAIL)主任于 2007 年加入 Google,在成功主導「Ground Truth」地圖項目后,他說服 Larry Page 和 Sergey Brin 邀請頂尖學者兼職參與 Google 研究。

      2007 年 12 月,Sebastian Thrun 邀請了當時在多倫多大學、相對不為人所知的機器學習教授 Geoff Hinton 來到谷歌進行技術講座。

      Hinton 是神經網絡研究的長期倡導者,他和他的學生(包括 Yann LeCun)堅信,隨著計算能力的提升,構建更深層次的神經網絡(即「深度學習」)將能釋放其巨大潛力。

      Hinton 的講座在谷歌內部引發了強烈反響,特別是讓 Jeff Dean 等人看到了現有語言模型工作的全新可能性。隨后,辛頓以顧問乃至「實習生」的身份開始與谷歌合作,將深度學習的火種正式帶入了這家未來的 AI 巨頭。

      值得一提的是,Hinton 等人所倡導的神經網絡,在當時正處于被學術界邊緣化的最低谷。如《Genius Makers》所述,自 70 年代 Marvin Minsky 對「感知機」的著名批判以來,AI 領域的主流已轉向「專家系統」。然而專家系統在現實世界的復雜性面前屢屢碰壁,導致了 AI 的第二次寒冬。

      而 Google 的 PageRank 和機器翻譯所依賴的統計方法,本身就是對僵化專家系統的一種反叛。Hinton 的到來,預示著一種基于數據、統計和仿生計算的更深刻范式,即將與 Google 的工程能力相結合。

      到 2011 年,谷歌不僅在傳統機器學習和大規模系統工程方面積累了深厚實力,也開始接觸并擁抱深度學習這一即將掀起滔天巨浪的新思潮。人才的引進、內部項目的成功以及對前沿理論的開放態度,共同為谷歌下一階段的 AI 爆發奠定了堅實的基礎。

      從「大腦」到「貓」

      Hinton 帶來的深度學習火種,很快在 Google 內部找到了適宜生長的土壤。大規模數據和強大的計算基礎設施,恰是神經網絡研究所需的關鍵要素。

      正是在這一背景下,Google 內部一個專注于將深度學習推向新高度的核心團隊應運而生,并迅速取得了令世界矚目的突破。

      Google Brain 誕生

      隨著 Sebastian Thrun 全職加入 Google 并創建 Google X 部門,他將在斯坦福 AI 實驗室(SAIL)的繼任者、另一位杰出學者吳恩達(Andrew Ng)也引入 Google 兼職。

      值得一提的是,近日,英偉達市值突破5萬億美元,而吳恩達及其團隊早在 2009 年的一篇論文中就指出了 GPU 對 AI 重要性。



      • 論文標題:Large-scale Deep Unsupervised Learning using Graphics Processors
      • 論文地址:https://dl.acm.org/doi/10.1145/1553374.1553486

      回到正題。2010 至 2011 年間的一天,吳恩達在 Google 園區偶遇 Jeff Dean,兩人交流起各自在語言模型和深度學習方面的想法。他們很快意識到,結合 Hinton 的理論與 Google 無與倫比的并行計算能力,或許可以真正構建一個前所未有的大規模深度學習模型。

      這個想法很快得到了推動。2011 年,吳恩達、Jeff Dean 以及神經科學博士 Greg Corrado 共同發起了 Google X 內部的第二個官方項目:Google Brain。他們的目標明確:在 Google 的基礎設施上,構建一個真正「深」且「大」的神經網絡。

      為了支撐這個龐大的計算任務,Jeff Dean 主導開發了一個名為 DistBelief 的新分布式計算系統。

      DistBelief 的設計頗具爭議,它允許不同計算節點異步更新模型參數,這意味著更新可能基于「過時」的信息。這與當時主流研究認為同步更新對保證模型收斂至關重要的觀點相悖。

      許多人,包括 Google 內外的專家,都對此表示懷疑(Disbelief),這也是系統名稱的雙關含義。然而,Jeff Dean 的工程直覺再次被證明是正確的,DistBelief 不僅可行,而且效率很高。

      石破天驚的「貓論文」

      有了強大的計算平臺,Google Brain 團隊迅速展開了一項里程碑式的實驗。他們構建了一個包含九個層級的深度神經網絡,并利用 DistBelief 系統,在 1000 臺機器上的 16000 個 CPU 核心進行訓練。訓練數據是 1000 萬幀從未經人工標注的 YouTube 視頻中隨機抽取的。

      實驗結果震驚了世界。這個神經網絡在沒有被告知什么是「貓」的情況下,通過無監督學習,自主地在最高層網絡中形成了一個「貓神經元」:這個神經元會對包含貓臉(特別是正面視角)的圖像產生強烈興奮,而對其他圖像則反應平淡。



      這項成果,后來以論文形式發表,但更廣為人知的名字是「貓論文」(Cat Paper)。



      • 論文標題:Building High-Level Features Using Large-Scale Unsupervised Learning
      • 論文地址:https://arxiv.org/abs/1112.6209

      「貓論文」的意義極其深遠。首先,它證明了大規模深度神經網絡具備在沒有人類監督的情況下,從海量原始數據中學習有意義的高級特征的能力。其次,它驗證了 Google 自研的分布式系統能夠有效支撐這種規模的訓練。

      對于 Google 內部而言,這次成功極具說服力。據時任高管的 Sundar Pichai 回憶,看到「貓論文」是他記憶中 Google AI 故事的關鍵時刻之一。在一次 TGIF(Thank God It's Friday,谷歌內部周五例會)上展示該成果后,許多員工表示「一切都改變了」。

      更重要的是,「貓論文」直接催生了巨大的商業價值。當時 YouTube 面臨著視頻內容理解不足的難題,用戶上傳的標題和描述往往不足以支撐有效的搜索和推薦。Google Brain 的技術使得機器能夠「看懂」視頻內容,極大地提升了 YouTube 的推薦精度和用戶粘性,也為后續的內容審核、版權識別等關鍵功能奠定了基礎。

      可以說,「貓論文」開啟了 YouTube 乃至整個社交媒體和內容平臺的「算法推薦時代」,間接驅動了此后十年數百億乃至數千億美元的產業價值。

      AlexNet

      幾乎與「貓論文」同時期,另一項來自學術界的突破則徹底改變了深度學習的硬件基礎。

      2012 年,在多倫多大學,Geoff Hinton 指導的兩名學生 Alex Krizhevsky 和 Ilya Sutskever,憑借他們設計的深度卷積神經網絡 AlexNet,在著名的 ImageNet 圖像識別競賽中取得了「大爆炸」式的成功。



      ImageNet 競賽要求算法識別數百萬張已標注圖片中的物體。此前數年,最優算法的錯誤率仍在 25% 以上。而 AlexNet 橫空出世,將錯誤率一舉降至 15.3%,比前一年最好的結果提升了超過 40%。



      這一飛躍的關鍵,在于 Krizhevsky 和 Sutskever 創造性地使用了兩塊當時主要用于游戲圖形處理的 NVIDIA GeForce GTX 580 GPU 進行并行計算訓練。他們意識到 GPU 的大規模并行計算架構天然適合神經網絡運算,并通過 NVIDIA 的 CUDA 編程語言重寫了算法。

      AlexNet 的勝利不僅宣告了深度學習時代的全面到來,更確立了 GPU 作為 AI 計算核心硬件的地位。正如 NVIDIA CEO 黃仁勛所言,這是 AI 的「大爆炸時刻」。這一事件也直接將 NVIDIA 從一家 PC 游戲配件制造商,推上了日后 AI 浪潮之巔,成為全球市值最高的公司之一。

      DNN Research 收購大戰

      AlexNet 的巨大成功讓其背后的三人團隊身價倍增,他們迅速成立了一家名為 DNN Research 的公司,這家公司沒有產品,唯一的資產就是這三位頂尖的 AI 研究大腦。

      一場圍繞這家初創公司的激烈競購戰隨之展開。Hinton 決定采用一種類似拍賣的方式來決定公司的歸屬,以期獲得公平的市場價值。

      最初百度出價 1200 萬美元,隨后,谷歌、微軟以及當時還名不見經傳的初創公司 DeepMind 都加入了競標。競價在內華達州太浩湖哈里斯賭場酒店(NIPS/NeurIPS 會議期間)Hinton 的房間里激烈進行。

      DeepMind 因資金不足早早退出,最終,競價在谷歌和百度之間進行,一路飆升。當價格達到 4400 萬美元時,考慮到谷歌的研究環境、資源以及已有的人脈關系,Hinton 團隊決定停止競價,接受了谷歌的收購要約。

      據說,他們三人最初計劃平分股權,但 Krizhevsky 和 Sutskever 主動提出讓導師 Hinton 占 40%,他們各占 30%。

      這次收購被認為是谷歌 AI 歷史上最劃算的交易之一。它不僅將 AlexNet 的核心團隊整體并入 Google Brain,進一步鞏固了谷歌在深度學習領域的領導地位,而且這支團隊后續為谷歌創造的價值被認為遠超收購價格,甚至足以覆蓋 Google X 部門的所有其他「登月項目」的投入。

      Facebook 與 FAIR

      AlexNet 的驚人表現和 Google 對 DNN Research 的迅速收購,點燃了科技巨頭對深度學習人才的渴望。Google 并非唯一的買家,扎克伯格也敏銳地意識到了這場風暴。

      正如《深度學習革命》中所述,扎克伯格意識到,Google 用來優化 YouTube 推薦和廣告的技術,同樣可以用來改造 Facebook 的核心產品:動態消息(News Feed)。他將 AI 視為「下一個大事件」,并決心迅速建立 Facebook 自己的頂尖 AI 實驗室。

      扎克伯格的目標非常明確:他需要一位像 Geoff Hinton 一樣的領軍人物。這個人選就是 Hinton 的前博士后、當時在紐約大學任教的Yann LeCun。LeCun 是深度學習領域的另一位「教父」,尤其以其在卷積神經網絡(CNNs)上的開創性工作而聞名。



      2013 年,扎克伯格親自致電 LeCun,力邀其加盟,并給出了非常有誠意的讓步:FAIR(Facebook AI Research) 實驗室可以設在紐約,LeCun 本人也可以保留在紐約大學的教職。



      更重要的是,LeCun 堅持 FAIR 必須采用開放的研究模式,即像學術界一樣公開發表論文。他認為這是吸引和留住頂尖人才的唯一途徑,因為頂尖學者渴望的是同行認可和推動科學進步,而非僅僅是高薪。扎克伯格同意了這一點,這與 Google Brain 當時逐漸形成的開放研究文化不謀而合。

      如我們所見,FAIR 為 Meta(原 Facebook)提供了源源不斷的核心技術、開源工具(PyTorch)和前沿探索。

      FAIR 通過其Llama系列模型為 Meta 確立了獨特的戰略地位。從 Llama 1 到 Llama 3,FAIR 開發了行業領先的開源大語言模型。 堅持開源策略,使 Meta 成為開放 AI 生態的領導者,對抗了 OpenAI 和 Google 的閉源模型。



      但在 AI 競爭日益殘酷的今天,從限制論文發表到裁員,FAIR 也不可避免地迎來了「理想主義」的退潮,開始直面成本與效率的殘酷考驗。

      DeepMind、TPU 以及 OpenAI 的崛起

      在收購了 DNN Research 的核心團隊后,Google 在深度學習領域的領先地位似乎更加穩固。然而,AI 的版圖遠未定型。接下來的幾年,Google 通過一次世紀收購進一步擴張了其 AI 帝國,但也同時在內部啟動了一場深刻的硬件革命以應對算力挑戰。

      與此同時,其強大的「人才引力場」也開始顯現離心力,催生了日后最強勁的競爭對手。

      DeepMind 與 Google

      就在 Google Brain 高歌猛進之時,大西洋彼岸的倫敦,一家名為DeepMind的初創公司正以其「解決智能,再用智能解決一切」的宏大愿景吸引著特定圈層的注意。

      由神經科學博士、前游戲開發者 Demis Hassabis、Shane Legg 以及 Mustafa Suleyman 共同創立的 DeepMind,目標直指通用人工智能(AGI),這在當時被許多人視為「瘋子般的邊緣想法」。



      DeepMind 早期獲得了 Peter Thiel(PayPal 聯合創始人、Facebook 首位外部投資人)和馬斯克的投資。隨著 DeepMind 在強化學習(尤其是在玩 Atari 游戲上取得突破)等領域展現出驚人潛力,它很快吸引了科技巨頭的目光。

      2013 年末,扎克伯格率先提出收購,據傳報價高達 8 億美元,但因無法滿足 DeepMind 保持獨立研究和設立外部監督委員會的要求而未能成功。Elon Musk 也提出用 Tesla 股票收購,意圖將其技術用于自動駕駛,同樣與 DeepMind 的核心目標不符。

      關鍵的轉折點來自 Larry Page。他對 AI 的長期愿景與 Hassabis 一拍即合,相比扎克伯格和馬斯克,Page 更能理解并愿意支持 DeepMind 保持相對獨立,專注于 AGI 研究。Google 內部已有 Google Brain 負責產品應用,DeepMind 可與之互補。此外,Google 擁有的龐大計算資源對 DeepMind 也是巨大的吸引力。

      最終,Google 在 2014 年初以約 5.5 億至 6.5 億美元的價格成功收購 DeepMind。這筆收購在當時被視為谷歌的巨大勝利,但也埋下了日后內部文化沖突的種子。

      DeepMind 長期與 Google Brain 在公司內部爭奪資源和主導權,這種內耗在一定程度上拖慢了谷歌的腳步。而當年被谷歌重金「買下」的聯合創始人 Mustafa Suleyman,在經歷了內部的邊緣化后最終離開,并極具戲劇性地在 2024 年加入了谷歌的死敵微軟,成為了其消費者 AI 業務的負責人,調轉槍口與老東家正面對壘。

      收購后,DeepMind 迅速展現價值,不僅在AlphaGo項目中擊敗世界圍棋冠軍李世石,震驚世界,還通過優化算法將 Google 數據中心的冷卻能耗降低了 40%。



      然而,這次收購也徹底激怒了馬斯克,為日后 OpenAI 的誕生埋下了最重要的伏筆。

      從 GPU 依賴到自研 TPU

      就在 Google 將 DeepMind 收入囊中,進一步鞏固其在 AI 研究領域地位的同時,其內部也正悄然進行一場硬件革命。

      AlexNet 的成功已經證明了 GPU 在深度學習訓練中的巨大優勢。Alex Krizhevsky 加入 Google 后,驚訝地發現公司內部仍主要依賴 CPU 進行模型訓練,甚至自己買了 GPU 偷偷使用。

      雖然 Google 內部早有人提出使用 GPU,但基礎設施團隊出于維護同構集群簡單性的考慮一直有所抵觸。然而,隨著深度學習應用(如語音識別)的需求爆炸性增長,僅僅依賴 CPU 已難以為繼。

      Jeff Dean 甚至估算,如果所有 Android 用戶每天使用幾分鐘語音識別,Google 就需要將現有數據中心規模翻倍才能支撐。他向負責基礎設施的 Urs H?lzle 直言:「我們需要再造一個 Google。」

      面對如此嚴峻的算力瓶頸和對外部供應商(主要是 NVIDIA)日益增長的依賴,Google 決定另辟蹊徑:自研專門用于神經網絡計算的芯片。

      基于 Jonathan Ross 等工程師在 20% 時間項目中使用 FPGA(現場可編程門陣列)的探索,Google 正式立項開發 ASIC(專用集成電路),即 TPU(Tensor Processing Unit)。

      TPU 的核心設計理念是針對神經網絡中大量的矩陣(張量)運算進行優化,并大膽采用了低精度計算。通過犧牲一定的計算精度(例如,只保留較少的小數位數),可以在同樣的功耗和芯片面積下,大幅提升計算吞吐量。這對于容錯性相對較強的神經網絡模型來說是完全可行的。

      TPU 項目推進神速,15 個月內完成設計到部署,并巧妙設計成可替換服務器硬盤的形態。TPU 在 AlphaGo 對決中首次亮相并取得成功,此后成為 Google AI 基礎設施的核心競爭力,為其提供了顯著的成本優勢和戰略自主權。

      OpenAI 的誕生

      Google 對 DeepMind 的收購,以及其在 AI 人才和算力上的絕對優勢,讓馬斯克越發警惕。他擔心 Google 會在 AGI 研發上形成壟斷,并可能帶來不可控的風險。

      這種擔憂促使他在 2015 年夏天,聯合時任 Y Combinator 總裁的 Sam Altman,在硅谷心臟地帶的 Rosewood 酒店組織了一場旨在「策反」頂尖 AI 研究員的晚宴。

      他們的目標是說服在 Google 和 Facebook 等巨頭工作的研究人員,加入一個全新的、非盈利的、旨在為全人類福祉而開放研究 AGI 的實驗室。

      然而,面對 Google 提供的優厚待遇、頂級同事和無限資源,絕大多數受邀者都表示無法被撼動。唯一的例外是 Ilya Sutskever,這位 AlexNet 的共同作者、已在 Google Brain 做出杰出貢獻的研究員,被 OpenAI 的開放、非盈利和「造福人類」的使命深深吸引。盡管 Jeff Dean 親自出面提供了極具競爭力的反聘方案(據傳是雙倍薪酬),Sutskever 還是毅然決定加入這個前途未卜的新生組織。

      他的加入起到了關鍵的示范效應,吸引了包括 Dario Amodei 在內的一小批頂尖人才離開 Google,構成了 OpenAI 最初的核心技術力量。

      從事后看,這段「出走」充滿了歷史的回旋鏢。Ilya Sutskever,這位被「造福人類」使命感召的聯合創始人,在多年后成為了那場罷免 Sam Altman 董事會政變的關鍵人物,最終在內斗后黯然離開了公司。而與他一同離開 Google 的 Dario Amodei,后來也因對公司安全和商業化路徑的根本分歧,帶領一批核心成員出走,創辦了 OpenAI 的直接競爭對手 Anthropic。

      OpenAI 于 2015 年底正式宣告成立,獲得了來自馬斯克、Sam Altman 等人的 10 億美元初始承諾捐款(盡管實際到位的遠少于此)。



      在最初幾年,OpenAI 的研究路徑很大程度上追隨 DeepMind,專注于在復雜的游戲環境(如 Dota 2、Atari 游戲)中訓練 AI 智能體,以此展示其實力并推動 AGI 研究。

      谷歌的「饋贈」與 AI 新紀元

      當 Google 同時擁有 Google Brain 和 DeepMind 兩大頂尖 AI 實驗室,并掌握了自研芯片 TPU 這一算力利器時,它在全球 AI 領域的領導地位似乎已無可撼動。

      然而,歷史的吊詭之處在于,一項源自 Google 內部、本意是為了改進機器翻譯的研究成果,最終卻成為了「潘多拉魔盒」,不僅為競爭對手提供了趕超的「奇點」,也迫使 Google 自身陷入了一場前所未有的「創新者窘境」保衛戰。

      這便是 Transformer 的故事,它開啟了 AI 的新紀元。

      Attention Is All You Need

      2017 年,那篇堪稱偉大的論文出現在 arXiv 上:Attention Is All You Need,署名是來自 Google Brain 的八位研究員。



      • 論文標題:Attention Is All You Need
      • 論文地址:https://arxiv.org/abs/1706.03762

      這篇論文旨在解決當時主流用于處理序列數據(如語言)的循環神經網絡(RNN)及其變種長短期記憶網絡(LSTM)所面臨的兩個核心難題:難以捕捉長距離依賴關系,以及計算過程難以并行化。RNN/LSTM 在處理句子時需要按順序逐詞進行,這限制了利用現代硬件進行大規模并行訓練的效率。

      論文提出了一種全新的神經網絡架構:Transformer,其核心是一種被稱為「自注意力」的機制。自注意力機制允許模型在處理序列中的某個詞時,同時「關注」到序列中所有其他詞與該詞的關系及其重要性,而不受距離遠近的限制。這種基于注意力的計算過程可以高度并行化,完美契合了 GPU 和 TPU 等并行計算硬件的優勢。



      Transformer 架構極其簡潔、優雅,甚至讓一些研究者最初懷疑「這不可能有效,太簡單了」。但在 Google 內部,由 Noam Shazeer 等核心人物的深度參與和優化下,基于 Transformer 的模型在機器翻譯任務上很快就超越了當時最先進的基于 LSTM 的系統。

      更令人興奮的是,研究人員發現 Transformer 模型展現出驚人的「可擴展性」:隨著模型規模增大、訓練數據增多,其性能似乎可以持續、可預測地提升。

      這預示著一種全新的 AI 范式:「更多數據 + 更大模型 + 更多算力 ≈ 更好的智能」,正如后來 Rich Sutton 在其著名文章《苦澀的教訓》中所總結的那樣。

      論文的作者們在末尾也富有遠見地指出,計劃將 Transformer 應用于文本之外的圖像、音頻和視頻等模態。



      Google 內部迅速認識到了 Transformer 的重要性,并基于它開發了 BERT 等模型,顯著提升了 Google 搜索理解用戶查詢意圖的能力,進一步鞏固了其核心業務。

      然而,遵循其一直以來的開放研究傳統,Google 允許這篇論文公開發表。這一決定,雖然促進了整個 AI 領域的進步,但也無異于將開啟下一個時代的「鑰匙」交給了全世界——包括其潛在的競爭對手。

      更具諷刺意味的是,在接下來的幾年里,這篇論文的全部八位作者因各種原因相繼離開了 Google,其中就包括后來回歸并成為 Gemini 技術負責人的 Noam Shazeer。

      OpenAI 轉型

      當 Transformer 論文發表時,OpenAI 正處于關鍵的十字路口。

      Elon Musk 由于在公司發展方向(特別是與 Tesla 自動駕駛的結合)、控制權以及對進展速度的不滿,于 2018 年初與 OpenAI 分道揚鑣,并撤回了后續的資金支持。這使得原本就資金不算充裕的 OpenAI(10 億美元承諾僅到位約 1.3 億)陷入了生存危機。

      與此同時,OpenAI 的研究團隊敏銳地捕捉到了 Transformer 架構的巨大潛力。他們意識到,基于 Transformer 構建大規模預訓練語言模型(即 GPT 系列)是一條充滿希望的技術路徑。然而,訓練這些巨型模型需要天文數字般的計算資源,這遠非一個非盈利組織所能負擔。

      在資金和算力的雙重壓力下,Sam Altman 做出了一個改變 OpenAI 命運的決定:

      2018 年,微軟同意向 OpenAI 投資 10 億美元(部分為 Azure 云信用額度),以換取其技術的優先使用權和一定的商業化獨占權。為了促成這筆交易,OpenAI 進行了一次頗具爭議的重組,設立了一個「利潤上限」的營利性子公司 OpenAI LP,由非盈利的母公司 OpenAI Inc. 控制。



      最近,OpenAI 宣布的重大資本重組,當年那個為生存而設立的「利潤上限」子公司,如今已演變為估值超 1300 億美元的「公開利益公司」(OpenAI Group PBC)。而最初的非盈利母公司,現在成為了「OpenAI 基金會」,僅憑其持有的 26% 股權,就有望成為「歷史上資源最充足的慈善組織之一」。

      說回 OpenAI 和微軟的合作,這次「聯姻」對雙方都意義重大。OpenAI 獲得了續命的資金和進行大規模模型訓練所必需的 Azure 云計算資源;而微軟則通過這筆在當時看來頗具風險的投資,在 AI 競賽的關鍵時刻綁定了一個潛力無限的技術伙伴,為其后續在 AI 應用層(如 Bing 搜索、Office Copilot)的快速布局奠定了基礎。

      與此形成對比的是,Google 擁有自己的云平臺 Google Cloud 和自研芯片 TPU,在基礎設施上完全自給自足。

      獲得了微軟支持后,OpenAI 開始全力投入 GPT 模型的研發。GPT-2(2019 年)和 GPT-3(2020 年)相繼發布,模型能力不斷提升,尤其 GPT-3 已經展現出驚人的文本生成和理解能力,開始引發業界廣泛關注。

      2021 年,基于 GPT-3 的 GitHub Copilot 發布,成為第一個大規模落地的生成式 AI 產品,預示著一場生產力革命的到來。

      Anthropic 的誕生

      OpenAI 與微軟的深度綁定及其向「利潤上限」模式的轉變,雖然解決了生存問題,但也導致了其內部關于 AI 安全和商業化路徑的深刻分歧。

      這種緊張關系在 2020 年底達到了頂點。時任 OpenAI 研究副總裁、同樣出身 Google Brain 的 Dario Amodei,對他所認為的公司日益增長的商業化傾向和對安全問題的忽視感到越發不安。

      2021 年初,Dario Amodei 帶領一批 OpenAI 的核心研究人員集體出走,創立了Anthropic。這家新公司明確將「AI 安全」置于首位,并以開發「合憲 AI」(Constitutional AI)的獨特方法論而聞名,并且 Anthropic 確實至今一直在發表 AI 安全相關的博客文章。



      Anthropic 隨后獲得了 Google 等公司的投資,成為 AI 領域不可忽視的新力量,其產品 Claude 也成為 ChatGPT 和 Gemini 的主要競爭對手之一。

      Anthropic 的成立,不僅標志著 AI 頂尖人才的再次分流,也正式開啟了 AI 領域關于發展路徑(追求能力 vs 確保安全)的「路線之爭」。

      ChatGPT 橫空出世

      2022 年 11 月 30 日,一個看似普通的研究預覽發布,卻意外地點燃了全球對生成式 AI 的熱情。

      OpenAI 推出了基于 GPT-3.5 模型的聊天界面:ChatGPT。原本只是內部為了測試模型能力、或是為了趕在競爭對手 Anthropic 發布類似產品前推出的一個簡單應用,卻憑借其流暢自然的對話體驗和強大的通用能力迅速引爆網絡。一周用戶破百萬,兩個月破億,ChatGPT 成為史上用戶增長最快的消費級應用,其品牌名幾乎成了 AI 聊天的代名詞。



      ChatGPT 的巨大成功,震醒了沉睡的巨人 Google。Google 高層迅速意識到,這種直接提供答案的交互模式,對其賴以生存的核心搜索業務構成了直接的、生存級別的威脅。

      2022 年 12 月,CEO Sundar Pichai 在公司內部拉響了「Code Red」(紅色警報)。這意味著 Google 必須將 AI 從過去十年作為「維持性創新」來改進現有產品的策略,緊急調整為應對「顛覆性創新」的戰時狀態。

      讓局勢更加嚴峻的是,微軟迅速抓住了機會。2023 年初,微軟宣布向 OpenAI 追加 100 億美元投資,并高調發布了由 OpenAI 技術驅動的新版 Bing 搜索引擎和 Edge 瀏覽器。

      Satya Nadella 公開宣稱:「搜索的新時代從今天開始……我們要讓 Google 跳舞」。Google 最強大的老對手,借助其「盟友」的顛覆性技術,卷土重來,直指 Google 的心臟地帶。

      此時,Google 內部并非沒有類似的技術儲備。Noam Shazeer 早在離開前就曾開發過一個名為 Mina 的內部聊天機器人,后來演變為 LaMDA 模型。

      然而,出于對安全性、準確性、品牌聲譽風險的擔憂,以及更深層次的商業模式沖突(AI 直接給答案會減少用戶點擊廣告的機會,動搖搜索廣告這一現金牛業務)和潛在的法律風險等多重因素考量,Google 一直未能將這些內部原型產品推向大眾市場。

      相比之下,OpenAI 作為挑戰者,沒有這些歷史包袱,可以選擇「快速行動,打破陳規」。

      All in Gemini

      面對內憂外患,Google 的初步反擊顯得有些倉促。

      2023 年 2 月,Google 匆忙推出了基于 LaMDA 模型的聊天機器人 Bard。然而,Bard 在發布演示中就出現了事實性錯誤,導致 Google 股價大跌。隨后的用戶體驗也普遍反映 Bard 的能力明顯落后于同期基于 GPT-3.5 乃至后續 GPT-4 的 ChatGPT。

      這次挫折促使 Sundar Pichai 下定決心進行大刀闊斧的改革。2023 年中,他做出了兩個關鍵決定:

      • 合并 Google Brain 和 DeepMind:結束內部兩大 AI 團隊長期并立甚至有所內耗的局面,組建統一的 Google DeepMind 部門,由 Demis Hassabis 全權領導。這意味著打破了收購 DeepMind 時關于其獨立性的部分承諾,但也顯示了整合力量、聚焦目標的決心。
      • All in Gemini:集中最精英的力量,開發一個單一的、統一的、原生的多模態旗艦模型系列:Gemini。要求 Google 所有產品線都要積極尋找與 Gemini 整合的機會。這既是為了集中資源打造最強模型,也是利用 Google 的生態優勢推廣 Gemini。



      為了確保 Gemini 項目的成功,Google 不惜代價。不僅 Jeff Dean 等原 Google Brain 的核心大將與 DeepMind 團隊緊密協作,久未參與一線工作的聯合創始人 Sergey Brin 也回歸參與模型研發。

      同時,Google 斥資數十億美元與 Noam Shazeer 創立的 Character.AI 達成一項復雜的合作協議,實質上將這位 Transformer 論文的關鍵作者之一請回,與 Jeff Dean 共同擔任 Gemini 項目(特別是下一代模型)的技術負責人。

      這一系列雷厲風行的舉措迅速見效。從 2023 年底開始,Gemini 系列模型以驚人的速度發布并迭代。如今,Gemini 2.5 Pro已是頂尖模型之一,大家對即將發布的 Gemini 3.0 也充滿期待。

      Google 逐步將 Gemini 整合進搜索(推出 AI Overviews 功能)、推出獨立的 Gemini App 取代 Bard,并在搜索頁面嘗試引入「AI Mode」。同時,在文生視頻(Veo)、文生圖(Imagen)、游戲環境生成(Genie)等多模態領域也發布了一系列令人矚目的技術。

      此外,Google DeepMind 在 AI for science 領域取得重大突破。其AlphaFold 2系統在 2020 年高精度地預測了蛋白質的三維空間結構,解決了困擾生物學界半個世紀的「蛋白質折疊問題」,對生命科學與新藥研發具有深遠意義。

      基于此項貢獻,AlphaFold 2 核心開發者 Demis Hassabis、John Jumper 與計算蛋白設計先驅 David Baker 共同獲得了2024 年諾貝爾化學獎,以表彰其革命性貢獻。

      結語

      縱觀 AI 發展的波瀾壯闊,巨頭們在開疆拓土的同時,也背負上了各自沉重的「包袱」。

      谷歌手握最好的牌,提出一系列開創性工作,但又受大公司體制的束縛,一度將王牌拱手讓人;OpenAI 從最初的理想國,到一度分崩離析,再到今天成為最具實力的玩家之一;Meta 曾穩坐開源王座,如今也不得不在軍備競賽與成本效益的平衡中艱難變革。

      與此同時,中國 AI 力量也異軍突起。DeepSeek 一夜成名,Qwen 成為新的「源神」,Seed、Kimi 等奮力追趕,搶占高地;即夢、可靈等則在多模B態的新戰場上攻城略地。

      浪潮之巔,沒有永遠的王者。 巨頭今日的霸權,隨時可能被自身的沉疴所拖垮;后起之秀的威脅,也從未像今天這般迫近。

      但無論如何,這場激烈的競爭,連同背后無數科學家的執著探索,正匯聚成一股推動歷史進程的強大合力,帶領人類走向那個充滿未知但值得期待的未來。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      安徽一地發現金礦,3000多戶拆遷?當地回應

      安徽一地發現金礦,3000多戶拆遷?當地回應

      極目新聞
      2025-11-05 16:08:13
      “向中方提交了2000份稀土申請,剛過了一半”

      “向中方提交了2000份稀土申請,剛過了一半”

      觀察者網
      2025-11-06 08:23:17
      “你要毀了我嗎?”地鐵USB接口被吐槽“老掉牙” ,最新回應:已在迭代

      “你要毀了我嗎?”地鐵USB接口被吐槽“老掉牙” ,最新回應:已在迭代

      極目新聞
      2025-11-05 22:45:54
      鬧掰!王傳君拿下東京電影節影帝!白百何提前離場,發文引猜測

      鬧掰!王傳君拿下東京電影節影帝!白百何提前離場,發文引猜測

      千言娛樂記
      2025-11-05 22:54:31
      為何毒蛇再毒也殺不死豬?有科學依據能證明,豬是毒蛇的天敵嗎?

      為何毒蛇再毒也殺不死豬?有科學依據能證明,豬是毒蛇的天敵嗎?

      溫讀史
      2025-11-05 19:05:37
      憤怒的川普

      憤怒的川普

      西樓飲月
      2025-11-05 19:14:33
      A股:剛剛,兩部門權威宣布,重要信號出現,周四將迎大級別變化

      A股:剛剛,兩部門權威宣布,重要信號出現,周四將迎大級別變化

      云鵬敘事
      2025-11-06 00:00:03
      美聯儲,大消息!特朗普,突發!美股突然拉升!

      美聯儲,大消息!特朗普,突發!美股突然拉升!

      證券時報e公司
      2025-11-06 07:43:49
      新聞多一度丨神二十推遲返回 空間碎片影響有多大?

      新聞多一度丨神二十推遲返回 空間碎片影響有多大?

      新京報
      2025-11-05 18:11:09
      美國政府破紀錄繼續停擺,400萬美國人將失去醫療保險,特朗普:停擺結束前,將停止向4200萬人發放食品補貼

      美國政府破紀錄繼續停擺,400萬美國人將失去醫療保險,特朗普:停擺結束前,將停止向4200萬人發放食品補貼

      極目新聞
      2025-11-06 09:49:27
      出大事了,日本凌晨發生地震;菲軍機墜毀;美軍航母悄悄來到亞洲

      出大事了,日本凌晨發生地震;菲軍機墜毀;美軍航母悄悄來到亞洲

      林子說事
      2025-11-06 08:07:09
      一中國貨車在俄羅斯伊爾庫茨克州發生碰撞致中國司機一死一傷,中領館提醒注意交通安全

      一中國貨車在俄羅斯伊爾庫茨克州發生碰撞致中國司機一死一傷,中領館提醒注意交通安全

      界面新聞
      2025-11-06 07:09:00
      震驚!深圳一學校取消統一采購校服,家長成功讓校服“消失”了

      震驚!深圳一學校取消統一采購校服,家長成功讓校服“消失”了

      火山詩話
      2025-11-06 04:36:57
      曼聯離隊隊醫獸醫實錘?阿莫林陣容目前零傷病,不只因為比賽少

      曼聯離隊隊醫獸醫實錘?阿莫林陣容目前零傷病,不只因為比賽少

      羅米的曼聯博客
      2025-11-06 10:35:54
      上海父母狀告兒子兒媳,小夫妻崩潰落淚!兒媳:早知如此,我不會嫁!

      上海父母狀告兒子兒媳,小夫妻崩潰落淚!兒媳:早知如此,我不會嫁!

      FM93浙江交通之聲
      2025-11-04 14:45:37
      暴扣2+1鎖勝局!波特32+11為籃網結束7連敗 掘金換卡約成敗筆?

      暴扣2+1鎖勝局!波特32+11為籃網結束7連敗 掘金換卡約成敗筆?

      顏小白的籃球夢
      2025-11-06 10:44:23
      烏克蘭公布“罕見”作戰畫面!外媒:烏特種部隊乘“黑鷹”直升機突襲波克羅夫斯克

      烏克蘭公布“罕見”作戰畫面!外媒:烏特種部隊乘“黑鷹”直升機突襲波克羅夫斯克

      環球網資訊
      2025-11-05 16:09:59
      老大求交易,老二提不滿!西部大黑馬被打崩,但你們的前途很光明

      老大求交易,老二提不滿!西部大黑馬被打崩,但你們的前途很光明

      毒舌NBA
      2025-11-05 22:06:28
      陳百祥評TVB:行業衰落,曾志偉炒余詠珊魷魚引關注

      陳百祥評TVB:行業衰落,曾志偉炒余詠珊魷魚引關注

      悅君兮君不知
      2025-11-05 09:39:45
      WTT冠軍賽!誕生11-0,日本遇首敗,張本美和零封,中國名將絕殺

      WTT冠軍賽!誕生11-0,日本遇首敗,張本美和零封,中國名將絕殺

      知軒體育
      2025-11-06 00:20:08
      2025-11-06 11:16:49
      機器之心Pro incentive-icons
      機器之心Pro
      專業的人工智能媒體
      11656文章數 142499關注度
      往期回顧 全部

      科技要聞

      蘋果“認輸”!曝每年10億美元租用谷歌AI

      頭條要聞

      美最高法院就關稅政策合法性展開辯論 美財長罕見出席

      頭條要聞

      美最高法院就關稅政策合法性展開辯論 美財長罕見出席

      體育要聞

      贏下皇馬,會是利物浦的轉折點嗎?

      娛樂要聞

      白百何好友揭露爭獎細節

      財經要聞

      特朗普關稅遭美國高院大法官輪番質疑

      汽車要聞

      方向盤?不存在的 特斯拉 Cybercab亞太首秀

      態度原創

      藝術
      本地
      房產
      游戲
      公開課

      藝術要聞

      毛主席書法作品首次在美國現身,內容引人關注!

      本地新聞

      這屆干飯人,已經把博物館吃成了食堂

      房產要聞

      江東,給你留「門」兒了!

      經典地下城RPG《冬宮原》2026年4月登陸Switch

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 成人午夜免费无码视频在线观看| 午夜成人无码免费看网站| 国产午夜精品福利视频| 办公室强奷漂亮少妇视频| 亚洲AV国产福利精品在现观看| 人妻体内射精一区二区三区| 亚洲精品国产精品国在线| 国产做a爱片久久毛片a片| 中文字幕人妻无码一区二区三区| 久久精品国产99久久美女| 亚洲 欧美 影音先锋| 日本无人区一区二区三区| 亚洲另类丝袜综合网| 好紧好湿好黄的视频| 天天干天天干| 精品国产乱码久久久久APP下载| 她也色tayese在线视频| 亚洲男同志网站| 四虎永久免费高清视频| 吉川爱美一区二区三区视频 | 国产精品无码a∨麻豆| 精品一二三四区在线观看| 蜜臀久久精品亚洲一区| 成人精品天堂一区二区三区| 国产内射xxxxx在线| 精品国产AV无码一区二区三区| 亚洲精品久久无码av片软件| 妺妺窝人体色WWW看人体| 亚洲国产欧美日韩另类| 日日碰狠狠添天天爽五月婷| 清新县| 日韩人妻一区中文字幕| 国产精品亚欧美一区二区三区| 亚洲av成人在线一区| 国产成人亚洲精品自产在线| 国产短视频一区二区三区| 国产精品 自在自线| 亚洲国产精品一二三区| 真实单亲乱l仑对白视频| 午夜福利在线观看入口| 国产欧美日韩免费看AⅤ视频|