![]()
本文來自微信公眾號:直面AI,作者:苗正,題圖來自:AI生成
在2025年10月21日,OpenAI的新品發布會中,奧特曼正式發布了首款AI瀏覽器——Atlas。
奧特曼是這么介紹這個新玩意的,“我們認為,人工智能代表了一個罕見的、十年一次的機會,可以重新思考瀏覽器是什么,以及如何最高效、愉快地使用網絡。”
奧特曼補充道,“將世界上最好的人工智能助手置于瀏覽體驗的核心,將改變我們在線完成工作的方式。”
可以肯定的是,瀏覽器作為用戶接入互聯網的主要入口,通過推出AI瀏覽器,OpenAI試圖重新定義用戶與網絡交互的方式,從被動的信息獲取轉向主動的任務執行。與其說Atlas是一個瀏覽器,不如說它是OpenAI的預告。OpenAI正在轉變身份,不再拘泥于提供基座大模型的AI工具提供商。
然而在驚喜過后我發現,Atlas并沒有和市面上那些成熟的MCP瀏覽器,比如Comet和Neon,有多大差別,甚至在某些地方還有不足之處,OpenAI更像是“蹭了一下AI瀏覽器”的熱度。
01
從技術實現的角度來看,當前AI瀏覽器主要采用兩種技術路徑。視覺識別路徑通過截圖分析網頁元素,延遲高、成本昂貴(約200美元/月),錯誤率相對較高。
DOM解析路徑將網頁元素轉化為AI可讀的結構化格式,任務成功率達89.1%,成本降低90%,能夠解決動態網頁適配問題。Atlas更傾向于采用后者,而實際上絕大多數AI瀏覽器都是DOM。
但是在設計上,Atlas與現有MCP瀏覽器高度相似,幾乎沒有突破性創新。側邊欄AI助手設計方面,Atlas的“Ask ChatGPT”側邊欄與Comet的“Comet Assistant”、Opera Neon的“Neon Chat”在交互邏輯上如出一轍,都是在瀏覽器右側提供一個常駐的AI對話窗口。
網頁內容總結功能方面,Atlas能總結網頁內容,但Comet、Opera Neon、甚至Brave的Summarizer都有相同功能,且在準確性和速度上并無明顯差距。
分屏瀏覽模式也不是什么新鮮事。Atlas宣傳的“無縫分屏體驗”,實際上Comet在2024年7月推出時就已經實現。當用戶點擊搜索結果時,Comet會自動在左側顯示網頁,右側保持AI對話窗口。更進一步的是,Comet還支持多標簽頁同時分析,用戶可以讓AI同時處理多個網頁的信息并進行交叉對比,這一點Atlas并未做到。
最重要的是agent方面,Atlas的agent需要用戶授權后才能執行操作,執行過程中會顯示進度,用戶可以隨時暫停。這與Opera Neon的“Neon Do”功能完全一致,甚至Opera Neon還允許用戶創建可重復使用的"Cards"來保存常用操作流程,這一點Atlas反而沒有。
安全限制的相同性方面,在涉及敏感操作時,Atlas與其他MCP瀏覽器面臨完全相同的困境。無論是輸入密碼、確認支付、還是授權敏感權限,所有MCP瀏覽器都必須切換回手動模式。
技術架構的趨同方面,Atlas基于Chromium內核,Comet、Opera Neon同樣基于Chromium。在DOM解析、網頁元素識別等底層技術上,各家瀏覽器采用的方案大同小異,并無革命性突破。
Atlas在某些方面甚至落后于競品。Comet已經實現了完全免費(免費用戶有使用頻率的限制),而Atlas的核心功能agent模式僅對付費用戶開放(Plus、Pro用戶)。
Opera Neon提供了工具,可以幫助用戶創建網站、游戲、視頻等內容,Atlas并無此類創作功能。Comet的“Background Assistant”可以在后臺同時處理多個任務,而Atlas的agent一次只能執行一個任務流程。在跨平臺支持上,Atlas目前僅支持macOS,而Comet早已支持Windows、macOS和Linux,移動端也在開發中。
雖然基于Chromium內核,但Atlas并不支持所有Chrome插件,這可能源于macOS系統限制。此外,部分網站如紐約時報阻止Atlas總結內容,而CNN等其他媒體網站運行正常。
![]()
![]()
02
瀏覽器是入口,它能將AI無縫集成到用戶日常工作流,減少用戶在不同應用間的切換,提高AI服務的使用頻率和粘性。
誠然,比起網頁,瀏覽器作為工具,更能建立直接的用戶付費關系。但Atlas最先解決的應該是安全問題,在開啟agent模式后會有一句話提示,存在風險,Atlas的操作可能會導致用戶丟失財產。
![]()
這個問題不僅是Atlas獨有的,而是整個MCP瀏覽器生態都尚未解決的核心挑戰。
Atlas要解決的問題還有很多。當用戶嘗試讓Atlas幫助在電商網站下單時,它能夠幫助瀏覽商品、添加購物車,但到了輸入支付密碼的環節,系統會強制切換回手動模式,并彈出安全警告。
這與之前的MCP瀏覽器一樣看起來很智能,但在關鍵時刻還是要靠人工。
而且Atlas還有一些BUG需要解決,比如在訪問網頁的過程中,時不時就會出現Atlas阻擋了訪問。但是當你要求Atlas重復該次操作的時候,網頁就又能訪問了。
![]()
![]()
OpenAI表示這是一個技術上的失誤,后續版本對這個情況進行了修正,但是截止目前為止,依然能碰上這樣的問題。
除了這些技術上的漏洞之外,Atlas還有很多問題要處理。比如讓它畫個愛心,結果它卻畫了個歪曲的形狀。
![]()
OpenAI的短期目標包括擴展到Windows、iOS、Android平臺、建立開發者生態支持第三方AI應用集成,以及最重要的,完善Agent模式功能提高任務執行成功率。
因為Atlas在奧特曼眼中,是AGI的主要界面。奧特曼多次在公開場合表達對瀏覽器領域的重視,甚至也調侃過,如果谷歌愿意出售Chrome瀏覽器,那他會毫不猶豫地買下來。
在奧特曼的設想中,未來的瀏覽器不再僅僅是網頁展示工具,而將成為智能代理的載體,幫助用戶完成越來越復雜的數字化任務。
隨著互聯網用戶越來越依賴AI,入口之爭愈發激烈。
對OpenAI而言,成為用戶通向互聯網的主要入口,可能讓該公司吸引更多流量。
這里面有著一套很清晰的商業邏輯。OpenAI目前的主要收入來源是ChatGPT訂閱服務和API調用費用。而ChatGPT目前擁有超過8億用戶,但其中付費用戶占比不到5%,大部分用戶仍在使用免費版本。這意味著OpenAI需要找到新的變現途徑。
瀏覽器可以為OpenAI提供多種商業可能性,比如廣告。
當然,一旦談到廣告和搜索,OpenAI就必須面對谷歌,要知道,Chrome目前在全球擁有約30億用戶,并已整合谷歌自家的AI大模型Gemini。
AI瀏覽器的競爭不僅僅是技術層面的,更是生態系統的競爭。誰能建立起更完善的開發者生態,誰能吸引更多第三方工具接入,誰就能在競爭中占據優勢。
MCP協議的開放性為這種生態競爭提供了基礎,但最終勝出的,將是那些能夠提供最佳用戶體驗、最強AI能力、最完善隱私保護的產品。
03
Anthropic于2024年11月推出MCP(Model Context Protocol,模型上下文協議)作為一種以Agent 和大模型為中心的開放標準通信協議,旨在簡化與外部系統的集成架構和優化上下文傳輸的處理邏輯。
也正是因為MCP的問世,才有了如今這些名字不同,但本質上都大差不差的AI瀏覽器。
在MCP出現之前,AI模型想要調用外部工具需要開發者為每個模型和工具單獨編寫交互邏輯,導致集成成本高,難以通用。MCP最大的意義,就是通過標準化的系統架構,提供了統一的接口和協議,使得AI模型能夠訪問各種數據源和工具。
正是因為統一了不同大模型調用外部工具的標準,這才能讓用戶可以直接跟大模型對話,瀏覽器就會自動使用各種工具完成用戶想要的操作。
MCP生態也在快速擴張。截至2025年10月,已經有超過200個第三方開發者為MCP貢獻了各類Server,涵蓋數據分析、文檔處理、代碼生成、圖像編輯等多個領域。這種開放的生態模式讓AI瀏覽器的功能擴展變得極為便捷,就像Chrome插件商店一樣,但MCP的標準化程度更高,兼容性更好。
OpenAI用的也是這個協議來開發AI瀏覽器。
但在這之上,OpenAI做了對一個蘋果智能(Apple Intelligence)的特殊支持。
![]()
Atlas里專門有個打開蘋果智能的選項,打開后就可以通過本地的處理器來總結網頁,而不是通過ChatGPT的服務器,同時還支持Siri喚醒。
用戶可以獲得無縫的跨應用體驗,比如在瀏覽器中處理的信息可以自動同步到其他蘋果應用中,或者利用Siri的語音交互能力來控制瀏覽器功能。
雖然更早的M系列處理器也可以使用Atlas,但是Atlas仍然像是一個蘋果M5的廣告,而新版的Mac Pro使用的就是M5。
蘋果M5芯片于2025年10月15日正式發布,這款基于第三代3納米制程打造的處理器在AI運算、圖形性能及能效方面均實現重大提升。
M5芯片采用新一代10核GPU架構,每核均配備Neural Accelerator神經加速器,使得基于GPU的AI工作負載處理速度大幅提升,峰值GPU計算性能達M4芯片的四倍有余。該GPU同時提供更強的圖形處理能力及第三代光線追蹤技術,綜合圖形性能較M4提升達45%。
在Atlas發布的當日,作為競爭對手的谷歌股價大跌。盤中跌幅一度擴大至近5%,最低觸及245美元,最終收跌2.21%。
不過實際上這和Atlas并沒有太大的關聯,相反這是由于谷歌自身的問題。
此前,谷歌AI Studio負責人Logan Kilpatrick在X(原名推特)上宣布于10月20日發推預告,AI Studio將迎來重大更新。
而就在此前,谷歌的下一代基座大模型Gemini 3在KingBench上刷榜。所以大家就覺得,谷歌會像Gemini 2.5預覽版那樣的策略一樣,將Gemini 3性能最低的版本以預覽版的形式發布在AI Studio上。
![]()
但結果就是,AI Studio只是對開發流程進行了優化更新,讓市場上所有期待全都落了空。
截止至發稿,谷歌并沒有對Atlas進行回應。但是谷歌可能也無需太擔心,因為在Atlas面前出現的AI瀏覽器有很多,但是依然阻礙不了Chrome占據全球約3分之2的市場。
更關鍵的是,Chrome背后是谷歌龐大的服務生態。Gmail、Google Drive、Google Docs、YouTube等服務與Chrome的無縫集成。當用戶在Chrome中登錄谷歌賬號后,所有服務數據都能實現跨設備同步,這種便利性是Atlas目前無法提供的。
從開發者生態來看,Chrome Web Store擁有超過10萬個擴展程序,涵蓋了從廣告攔截、密碼管理到開發工具、生產力增強等各個領域。這些擴展程序經過多年的迭代優化,已經成為許多用戶日常工作不可或缺的一部分。
Atlas雖然基于Chromium內核,但并不完全兼容Chrome插件,這意味著用戶如果切換到Atlas,將失去大量已經習慣使用的工具。對于那些依賴特定插件完成工作的用戶來說,這是一個難以接受的代價。
性能和穩定性也是Chrome的重要優勢。雖然Chrome因為占用內存較多而被用戶調侃為“內存殺手”,但是它的穩定性和兼容性是市面上最好的。
Atlas作為一款剛剛發布的產品,在技術成熟度上與Chrome還有相當大的差距,前面提到的訪問阻擋問題、操作失誤等BUG,都說明Atlas還需要大量時間來打磨產品。
![]()
Reddit網友也普遍認為,Atlas無法撼動Chrome的地位。
不過話又說回來了,Atlas也會給谷歌一個新的思路,比如也給Gemini做一個AI瀏覽器。
從技術發展趨勢來看,AI瀏覽器代表了下一代互聯網交互方式的發展方向。傳統的搜索引擎模式正在被AI問答模式逐步取代,用戶不再滿足于獲得一堆搜索結果,而是希望直接得到答案和解決方案。在這種趨勢下,能夠理解用戶意圖、主動完成任務的AI瀏覽器將具有明顯的競爭優勢。
對于普通用戶而言,AI瀏覽器也是一種全新的上網體驗,只要你敢于承擔AI瀏覽器帶來的風險,比如瀏覽器誤操作,導致資產和信息泄露等等。
從更長遠的視角來看,AI瀏覽器可能只是一個過渡形態。奧特曼設想的AGI界面,最終可能不是傳統意義上的瀏覽器,而是一個能夠理解用戶意圖、主動完成任務、無縫連接各種服務的智能代理系統。
本文來自微信公眾號:直面AI,作者:苗正
本內容為作者獨立觀點,不代表虎嗅立場。未經允許不得轉載,授權事宜請聯系 hezuo@huxiu.com
本文來自虎嗅,原文鏈接:https://www.huxiu.com/article/4795953.html?f=wyxwapp
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.