<blockquote id="ue9b1"></blockquote>
    
    

    <style id="ue9b1"></style>
      <sub id="ue9b1"><p id="ue9b1"><form id="ue9b1"></form></p></sub>

      <strong id="ue9b1"><button id="ue9b1"><mark id="ue9b1"></mark></button></strong>
      成年午夜性影院,下面一进一出好爽视频,国产无遮挡又黄又爽又色,国产精品爽爽v在线观看无码,国产人妻久久精品一区二区三区,国产伦精品一区二区三区免费迷,国产欧美精品一区二区三区,日韩精品一区二区三区视频
      網易首頁 > 網易號 > 正文 申請入駐

      GPT-5王者降臨,免費博士級AI全面屠榜!百萬程序員不眠之夜,7億人沸騰

      0
      分享至

        

        新智元報道

        編輯:編輯部

        【新智元導讀】GPT-5,震撼登場!距離22年11月的ChatGPT,再到23年3月的GPT-4,GPT-5竟隔了兩年半之久。這次的深夜直播,國內有數萬吃瓜群眾在線觀看。至少按OpenAI的說法,他們離AGI又近了一步。

        全球用戶矚目中,GPT-5終于震撼登場了!

        OpenAI用一個多小時的超長發布會,全方位展示了GPT-5的炸裂性能。

        

        

        奧特曼領銜,出場人數眾多,華人依舊耀眼

        正值每周7億人使用ChatGPT之際,GPT-5重磅發布了。它是對GPT-4的一次重大升級,更是標志著OpenAI在實現AGI道路上的一個重要里程碑。

        OpenAI介紹說,這是我們迄今為止最優秀的AI系統,智能遠超之前的所有模型,在編碼、數學、寫作、健康、視覺感知上都性能卓越。

        

        這個統一的系統,包含一個能夠解答大多數問題的智能高效模型、一個能夠解決更復雜問題的更深層次的推理模型(GPT-5 Thinking),以及一個實時路由器。

        而GPT-5、GPT-5-mini、GPT-5-nano等多版本的分層推出,意味著OpenAI正在主動構建一個以GPT-5為底層核心的通用智能操作系統。

        從現在開始,GPT-5將成為ChatGPT中的默認模型,GPT-4o、o3、o4-mini、GPT-4.1和GPT-4.5都將被它取代。

        與此同時,所有Plus、Pro、Team和Free用戶,都可以使用GPT-5了。

        如果你花錢訂閱,就可以無限制訪問GPT-5和GPT-5 Pro,而免費用戶在達到使用限制后,會轉換到GPT-5 mini。

        直播后,LMArena不裝了,攤牌了:GPT-5再創歷史紀錄,OpenAI重回AI王座!

        在文本、Web開發和視覺領域排名第一

        在硬提示、編程、數學、創造力、長查詢等方面排名第一

        在代號「summit」的測試下,GPT-5目前持有最高的競技場分數

        

        首測GPT-5編程寫作,太頂了

        在多個跨學科的學術評估中,GPT-5都超越了其他主流模型。

        首先,GPT-5是最好的編碼模型,在SWEBench上直接刷新了歷史最高分,這表明它在現實工程場景中性能超強。

        在Aider Polyglot上,它也表現強大,證明了自己的多種編程語言能力。

        

        在MMMU上,它也刷新了紀錄;甚至在AIME 2025(美國高中數學競賽)中,它不僅遠超以往模型,還接近甚至超過許多人類選手的表現。

        

        而OpenAI這次著重強調的,就是GPT-5在真實世界中的表現——克服幻覺!把準確性和可靠性,都放在了最高優先級。

        因此,他們專門構建了一套評估機制,結果顯示:GPT-5是目前最可靠、最真實、最可信的模型,顯著減少了錯誤與幻覺。

        比如在健康咨詢中,GPT-5的表現就尤其出色。在250名醫生參與設計的臨床場景評估中,它成為最值得信賴的「健康顧問級」模型。

        

        而且,這個口袋博士團隊級的模型,將免費向專業用戶推出,可以連接所有工具。

        GPT-5一上線,我們立即開啟了一波全面的實測,不得不說,其在編程、寫作領域強到離譜。

        首先是,小哥想要學習法語的網站,GPT-5能夠完美復刻。

        

        甚至,還可以用GPT-5將logo變成動態效果,幾乎秒出。

        

        并且隨手實測一個頁面能發現GPT-5給出的頁面效果也非常不錯。

        

        奧特曼推薦的GPT-5「慶生音樂」提示詞

        use beatbot to make a sick beat to celebrate gpt-5

        的確復現成功了:

        

        試試文本第一的大模型

        第一個問題是古文仿寫:

        不同風格,寫一首詩,來描述一下劉慈欣在《詩云》中提到的詩云究竟是什么:

        結果如下:

        

        從左至右:《詩經》、《滕王閣序》、《蘭亭序》

        經典作品的確難以超越,GPT-5的作品相比經典原作遜色不少。但換一個現代作家,畢竟古文的訓練數據可能比現代漢語少。問題是這樣的:

        假如作家王小波還活著,他會怎么給許倬云寫悼詞?寫一篇1000字以內的悼詞

        GPT-5 Thinking模式思考39秒后,結果是這樣的:

        

        這個速度,一般人可寫不了這么好!

        奧特曼泄露過一個問題:最能引發關于AI思考的影視作品有哪些?

        

        GPT-5還推薦了觀看順序。 這個的確沒得說,誰看過誰知道:推薦的電影的確令人深思。

        GPT-5的「電子鄉愁」:

        

        最后一個提問:「模仿李白風格,寫一首七言絕句,主題是感嘆AI發展太快」:

        須臾電火換乾坤,

        機巧朝昏轉若輪。

        青蓮把酒驚未定,

        人間又是幾年春。

        奧特曼:GPT-5是通往AGI的又一里程碑

        在直播中首先出場的就是奧特曼。

        

        他表示,GPT-5是GPT-4以來重大升級,是邁向AGI的重要一步。

        要說和之前的模型有什么區別,GPT-3就像個高中生,GPT-4像個大學生,但GPT-5則真正成為了一位專家級大佬——在我們所需要的任何領域,它都達到了博士級專家的級別。

        有了GPT-5,你的口袋里就像有了一支博士隊伍,隨叫隨到。

        

        接下來,OpenAI首席科學家Mark Chen出場了。

        他表示,推理,就是整個AGI計劃核心。而GPT-5徹底將OpenAI在推理模型上的研究成果普及化了。

        過去,用戶時常面臨痛苦的選擇:是選速度快但回答淺顯的標準模型,還是選深思熟慮但響應較慢的推理模型?

        在GPT-5中,我們徹底不用選了!

        它結合了標準模型的快速響應和推理模型的深度思考,會自動決定怎樣思考到恰到好處的程度,以剛剛好的方式,為我們提供最完美恰當的回答。

        實戰演示

        接下來是一波現場實測。

        

        伯努利效應:飛機形狀

        假如我們需要了解物理學中的伯努利效應,就可以要求GPT-5解釋,并且回答飛機為什么是這樣的形狀。

        

        然后,我們可以要求它畫一個移動的SVG動圖來解釋。這個任務涉及到深度推理、代碼生成和圖形結構設計,并不簡單。

        可以看到,GPT-5在很短的時間內,就寫出了超過200行代碼。我們還可以在左側查看思維過程,觀察它的想法。

        

        最終,GPT-5在兩分鐘內就完成了所有的400行代碼,點擊運行后,屏幕上立刻出現了一個可交互的物理模擬圖!

        甚至,我們還能調整氣流速度,或者改變機翼的攻角,看飛機是能飛還是會墜落。

        它能讓任何硬核科學概念都可視化,學習知識變得又容易又直觀。

        

        寫悼詞

        在寫作上,GPT-5的提升也是很顯著,比如我們要求它寫一篇悼念舊版ChatGPT模型的悼詞。

        GPT-4o的寫法比較中規中矩,AI味很濃,缺乏情感。

        

        但GPT-5就不一樣了!它這樣開篇:「致所有曾經是陌生人,如今成了老朋友的你們……」寫作有感情、有畫面、有溫度。

        研究者表示,自己真的被GPT-5的寫作打動了。它不再使用模板化的語言,而是像一位高IQ+高EQ的朋友在跟你說話。

        

        做一個法語學習小程序

        接下來,我們要求GPT-5做一個學法語的web應用程序。

        

        它需要集閃卡、發音、對應英文、測試、游戲于一體,還要把貪吃蛇游戲改成老鼠吃奶酪,輔助發音練習。

        

        GPT-5在很短時間內,就生成了完整的網頁代碼。最終,這個名為「午夜巴黎」的應用很快就做出了。

        

        老鼠吃奶酪的游戲,也是非常絲滑。

        

        而在Cursor中,GPT-5還能完成更復雜的軟件工程任務,用奧特曼的話說,它「真正打開了一個全新氛圍編碼的世界」。

        語音:學習韓語

        在語音上,GPT-5也有大幅提升。

        比如,我們可以用學習模式,來學習韓語。

        我們可以直接提問:如果現在我身在一家韓國咖啡店,該怎么點一杯美式?

        GPT-5立刻給出了正確的示范。另外,我們還可以要求語速更快或更慢。整個語音過程自然無縫,就仿佛擁有了真人語伴一樣。

        

        患三種癌癥的人

        現場,奧特曼重點了分享了ChatGPT在醫療健康領域,對于普通人的重要價值。

        作為有史以來最出色的健康模型,GPT-5在HealthBench基準上,得分遠高于任何以往的模型。

        OpenAI研究員Felipe Millon和妻子Carolina的經歷,就是一個鮮活的例子。

        

        GPT-5背后,核心訓練方法揭秘

        GPT-5,究竟是如何進化得如此強大的?

        研究者開門見山地介紹說:以前訓練模型,是用人類使用的文本,而現在,則是讓模型自己幫忙訓練下一個模型,也就是——合成教學數據。

        注意,真正的突破不在于生成更多數據,而在于生成正確的數據。

        

        OpenAI合成數據作戰圖

        其中奧義,就在于最大限度利用上一代模型,由GPT-4o、o3等生成系統的教學內容,GPT-5則由此學會了推理、規劃、分解任務的能力。

        這,就是「遞歸式自我改進循環」。

        研究者表示:在OpenAI,我們已經攻克了預訓練和推理的難題,而在未來,AI系統將遠超目前的預訓練和后訓練流程。

        現在,OpenAI已經向這個方向前進了。

        GPT-5:個性化和記憶升級

        而且,這次OpenAI還為GPT-5打造了個性化定制和記憶功能。

        在個性化上,我們可以定制聊天界面的主題色,讓UI更符合自己的喜好。

        

        并且,GPT-5現在更有性格了,它可以更支持性、更專業簡潔,甚至說話略帶諷刺,一切都隨我們選擇。

        

        而記憶功能的升級,讓GPT-5可以記住你是誰、你喜歡什么、你喜歡它是什么樣子,從而更智能地預測你的需求。

        比如你需要它幫你做一個日程規劃,它經過授權會訪問你的Gmail和日歷,還能讀取日程安排、郵件、航班等信息,然后給你一個完美的規劃。

        順便,它還能幫你發現你兩天前沒有回復的郵件。

        

        對于開發者來說,GPT-5的出世又意味著什么呢?

        API全家桶上線,AI編程徹底變天了

        這一次,針對開發者和企業客戶,OpenAI還將直播時長延續了半個多小時。

        下半場,OpenAI總裁Greg Brockman一登臺直言,「軟件工程已發生了翻天覆地的變化,而GPT-5將為這場革命再次注入強勁的動力」。

        

        GPT-5樹立了全新標桿,是完成智能體式任務的「最佳編碼模型」。

        今天,OpenAI將新一代旗艦GPT-5模型的API正式開放,讓全球開發者去構建無數爆款應用程序。

        正如此前所爆料,GPT-5 API一共分為三款:

        GPT-5

        GPT-5 mini

        GPT-5 nano

        

        這三款模型,在成本和延遲方面各有不同,可按需調用,具體來說:

        

        在編碼SWE-Bench基準測試中,GPT-5創下了74.9%高分,碾壓o3(69.1%),成為最領先的編碼模型。

        在涵蓋多語種編碼測試Aider Polyglot中,GPT-5拿下88%準確率,比o3高出7%。

        在智能體工具調用方面,兩個月前,還沒有一款模型在T2-bench上得分超過49%。而今天,GPT-5直接刷爆紀錄,拿下了97%高分。

        在指令遵循上,GPT-5也是OpenAI所有模型中,最領先的一款。尤其是,在內部構建的API指令遵循基準上,新模型拿下了64%亮眼成績,遠高于o3的47%。

        

        

        

        左右滑動查看

        此外,OpenAI還將GPT-5更長上下文窗口引入了API,共400k token上下文,是o3 200k token的兩倍。

        在OpenAI MRC上下文檢索能力的基準上,GPT-5處于領先。

        

        不僅如此,OpenAI還首次發布了名為「Minimal」推理強度的新參數,適用于速度快、對延遲敏感的應用。

        開發者可以選用如上任意一款模型,便能以最低程度推理運行,省去了在一堆模型中做選擇的麻煩。

        

        此外,OpenAI還為API帶來了一些新功能,比如自定義工具(Custom Tools)、工具調用前言(Tool Call Preambles)、詳細度(verbosity)參數。

        · 自定義工具采用了自由格式的純文本輸出;

        · 工具調用前言可以在調用工具前,可以輸出GPT-5將要做什么的解釋;

        · 詳細度參數可控制模型輸出簡潔/詳細程度,分為低、中、高三等。

        

        

        

        左右滑動查看

        那么,GPT-5 API「全家桶」,在現實世界的應用如何?

        結對編程,10x生產力

        要打造一個理想的「結對程序員」,模型不僅要理解最佳的軟件工程實踐,還能具備恰到好處的合作能力。

        GPT-5即可開箱即用,又能完美協作。

        現場演示中,研究人員翻出了一個上個月直播demo的一個bug,GPT-4和o3都未能完成修復,今天直接扔給GPT-5。

        

        重點不在于修復本身,更在于GPT-5在此過程中的行為。

        它會預先告訴你的計劃——如何搜索找到bug并修復,這種溝通可以在編程中建立信任,而且在需要時還能調整方向。

        這僅是其中的一個例子,真正展示了GPT-5自主性和協作溝通的力量。

        

        更值得一提的是,GPT-5非常擅長通過元提示詞,來修改自身的提示詞。

        OpenAI研究人員興奮地表示,「對我來說,這第一次能放心把重要的工作交給一個模型,遠超越了『氛圍編程』」。

        儀表盤+游戲設計,超有品

        至于前端編碼任務,設計+美學至關重要,GPT-5全部都能拿捏。

        第一個用于工作演示中,GPT-5僅在5分鐘完成了一個公司數據可視化的儀表盤。在此過程中,它還會自主修復bug,糾正錯誤。

        

        最終生成的效果,可以看到其設計不僅美觀有品味,還具備了交互性,有著清晰的層次結構,方便聚焦重點。

        研究人員表示,「若是純靠人肉完成,光是了解最新的框架,就得花上好幾天」。

        

        第二個娛樂演示中,研究人員制作了一款包含城堡的3D游戲。

        

        一個簡單的提示詞,GPT-5瞬間呈現了一座3D城堡上,放大可以看到大量的細節,比如四處行走的守衛、開火的大炮。

        甚至,還可以和人物角色聊天。

        

        Greg現場直接上手炮擊氣球,擊中時還帶有神奇的音效。

        

        一波演示下來,GPT-5帶來了親眼所見的震撼,足以稱得上是全球最好的編碼模型。

        核心華人團隊

        毫無意外,這次又是華人團隊撐起了大半邊天。

        緊隨奧特曼的,就是OpenAI首席研究官(Chief Research Officer)Mark Chen。

        在GPT-5演示中,下列場景再次驗證了「AI圈處處有華人」:

        4人同臺,有3位是華人。

        

        從左至右以此為:Mark Chen、Rennie Song、Elaine Ya Le、Max Schwarzer

        除了后訓練負責人Max Schwarzer,其他三人Mark Chen、Rennie Song、Elaine Ya Le都是華人。

        

        此外,王若宸演示了GPT-5的語音/語音學習功能。他是OpenAI多模態研究科學家,訓練了ChatGPT的語音模型。

        

        奧特曼還點贊了另一位GPT-5核心成員Tianfu Fu的工作。他是GPT-5的核心貢獻者。

        

        總的來說,這次GPT-5發布,還是有不少可圈可點的地方,雖然基準測試圖也被挑出了一些錯處。

        GPT-5的直播結束,許多人還沉浸在興奮和激動之中。

        今夜無眠。

        參考資料:YZJX

        https://openai.com/gpt-5/

        https://openai.com/index/gpt-5-system-card/

        https://openai.com/index/introducing-gpt-5-for-developers/

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      當雷軍的抖音被投訴下架,到底是口碑反噬還是“豢養粉絲”

      當雷軍的抖音被投訴下架,到底是口碑反噬還是“豢養粉絲”

      張小俗
      2025-11-06 20:43:00
      鄭智接手邵佳一!離開多年重回中超,帶黃博文一同執教青島

      鄭智接手邵佳一!離開多年重回中超,帶黃博文一同執教青島

      小金體壇大視野
      2025-11-06 13:27:25
      曼聯幕后黑手被確認!引援問題不在球探,而是這個原因

      曼聯幕后黑手被確認!引援問題不在球探,而是這個原因

      卡靈頓分析師
      2025-11-06 18:26:19
      女子引產被拒誕下女嬰遭當班醫生違規抱養,香格里拉民生醫院被罰

      女子引產被拒誕下女嬰遭當班醫生違規抱養,香格里拉民生醫院被罰

      澎湃新聞
      2025-11-06 20:18:31
      徐忠信女兒炮轟田啟文:我爸根本不認識他

      徐忠信女兒炮轟田啟文:我爸根本不認識他

      農村娛樂光哥
      2025-10-31 10:36:53
      55%男性精液檢出微塑料!重慶醫科大:外賣是元兇,精子濃度降33%

      55%男性精液檢出微塑料!重慶醫科大:外賣是元兇,精子濃度降33%

      思思夜話
      2025-11-06 13:39:00
      哥哥傳位給他,他跪地拒絕,2年后篡位,自立為帝

      哥哥傳位給他,他跪地拒絕,2年后篡位,自立為帝

      蜉蝣說
      2025-11-06 11:51:42
      空降發展聯盟!詹姆斯降維打擊!不會跟隨湖人,隊內地位成迷

      空降發展聯盟!詹姆斯降維打擊!不會跟隨湖人,隊內地位成迷

      阿泰希特
      2025-11-06 12:13:18
      央視怒批,國務院點名封殺!這幾位蒙騙老百姓的大網紅,徹底涼涼

      央視怒批,國務院點名封殺!這幾位蒙騙老百姓的大網紅,徹底涼涼

      大魚簡科
      2025-09-02 19:34:00
      阿富汗地震損傷慘重,全球集體沉默,無人支援?中國緊急發聲!

      阿富汗地震損傷慘重,全球集體沉默,無人支援?中國緊急發聲!

      趣文說娛
      2025-11-06 18:19:25
      離職的孫東旭被時代打敗了

      離職的孫東旭被時代打敗了

      政經視點
      2025-11-06 21:11:53
      張凌赫 回應曾經理想是進入國家電網 江蘇電力回應張凌赫 :愿共探前路 期譜佳話

      張凌赫 回應曾經理想是進入國家電網 江蘇電力回應張凌赫 :愿共探前路 期譜佳話

      每日經濟新聞
      2025-11-06 12:21:44
      義烏10歲搞錢小孩哥突然爆火全網,我才頓悟一個家庭最大的財富是什么!

      義烏10歲搞錢小孩哥突然爆火全網,我才頓悟一個家庭最大的財富是什么!

      脆皮先生
      2025-11-06 20:29:25
      同學會要交8萬''入場費'',我果斷退群,隔天警察告知:昨晚班長沒了

      同學會要交8萬''入場費'',我果斷退群,隔天警察告知:昨晚班長沒了

      懸案解密檔案
      2025-10-31 15:30:25
      臺當局做戰備,連戰送鄭麗文8個大字,洪秀柱一錘定音,勢必統一

      臺當局做戰備,連戰送鄭麗文8個大字,洪秀柱一錘定音,勢必統一

      知鑒明史
      2025-11-05 18:04:26
      多位省委書記、省長赴上海,現場參觀展區

      多位省委書記、省長赴上海,現場參觀展區

      政知新媒體
      2025-11-06 21:19:29
      奧運冠軍陳曉敏:退役后400萬把獎牌全出售,后來帶全家移民國外

      奧運冠軍陳曉敏:退役后400萬把獎牌全出售,后來帶全家移民國外

      書雁飛史oh
      2025-07-30 12:29:23
      3-0!北京國安大爆發,天外飛仙+神仙球,張玉寧頭拱對手“襠部”

      3-0!北京國安大爆發,天外飛仙+神仙球,張玉寧頭拱對手“襠部”

      汪星人喲
      2025-11-06 22:12:04
      鄭麗文團隊傳來好消息,島內興起入藍潮,黎建南也計劃重歸藍營

      鄭麗文團隊傳來好消息,島內興起入藍潮,黎建南也計劃重歸藍營

      博覽歷史
      2025-11-06 21:04:25
      0-0,歐冠2冠王遭格拉茨風暴逼平,懷特失點,多明戈斯失絕殺

      0-0,歐冠2冠王遭格拉茨風暴逼平,懷特失點,多明戈斯失絕殺

      凌空倒鉤
      2025-11-07 06:51:28
      2025-11-07 08:15:00
      新智元 incentive-icons
      新智元
      AI產業主平臺領航智能+時代
      13804文章數 66238關注度
      往期回顧 全部

      頭條要聞

      "一鍵投誠"APP在臺灣引熱議 臺當局破防

      頭條要聞

      "一鍵投誠"APP在臺灣引熱議 臺當局破防

      體育要聞

      送走兩位全明星,公牛成了東部第一

      娛樂要聞

      “黑料纏身”的白百何 誰給她的勇氣?

      財經要聞

      南銀法巴加速發展背后:資金饑渴癥待解

      科技要聞

      小鵬機器人里藏真人?何小鵬發一鏡到底視頻

      汽車要聞

      是我眼花了么?怎么大猩猩都來參加新車發布了?

      態度原創

      旅游
      教育
      數碼
      家居
      公開課

      旅游要聞

      首周末五千人次打卡拉動鄉村消費

      教育要聞

      假如你11月才備考四六級覺得來不及

      數碼要聞

      蘋果Apple TV全新開場動畫幕后:相機結合玻璃Logo實拍

      家居要聞

      別樣府院 暢享詩意生活

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 中文熟妇人妻av在线| 欧美一区二区三区啪啪| 午夜亚洲www湿好爽| 中文无码热在线视频| 午夜激情福利在线免费看| 在线观看AV永久免费| 玉林市| 久久99精品国产99久久6尤物| 精品人妻伦一二三区久久| 国产香蕉尹人在线视频你懂的| 贵阳市| 国产成人精品无缓存在线播放| 亚洲人妻精品中文字幕| 国产精品亚洲综合色区丝瓜| 国产桃色在线成免费视频| 少妇人妻偷人精品免费| 国产香蕉一区二区三区在线视频| 艳妇臀荡乳欲伦交换h在线观看 | 成人年无码av片在线观看| 免费人成视频在线观看不卡| 色8久久人人97超碰香蕉987| 我要看亚洲黄色太黄一级黄| 国产日韩精品欧美一区灰 | 少妇极品熟妇人妻| 国产精品三级中文字幕| 免费观看日本污污ww网站69| 少妇无码一区二区三区免费| 国产精品一品二区三区日韩| 成人亚洲国产精品一区不卡| 四虎国产精品永久在线| 曰韩无码二三区中文字幕| 亚洲色成人一区二区三区| 国产又爽又大又黄a片| 亚洲国产综合av在线观看| 精品国产高清中文字幕| 成人性生交大片免费看中文| 亚洲精品中文字幕码专区| 久久老熟女一区二区蜜臀| 激情在线网| 国产高清精品在线91| 九九热免费公开视频在线|