<blockquote id="ue9b1"></blockquote>
    
    

    <style id="ue9b1"></style>
      <sub id="ue9b1"><p id="ue9b1"><form id="ue9b1"></form></p></sub>

      <strong id="ue9b1"><button id="ue9b1"><mark id="ue9b1"></mark></button></strong>
      成年午夜性影院,下面一进一出好爽视频,国产无遮挡又黄又爽又色,国产精品爽爽v在线观看无码,国产人妻久久精品一区二区三区,国产伦精品一区二区三区免费迷,国产欧美精品一区二区三区,日韩精品一区二区三区视频
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      數(shù)學(xué)界無視「30年漏洞」,GPT-5一眼看穿!陶哲軒:AI科研革命開始了

      0
      分享至


      新智元報道

      編輯:KingHZ

      【新智元導(dǎo)讀】星星之火,可以燎原!證明的尊嚴(yán)在于可驗(yàn)證;這一次,GPT-5讓數(shù)學(xué)證據(jù)落在了代碼里。

      一雪前恥,ChatGPT為OpenAI「正名」!

      被Hassabis吐槽太尷尬之后,GPT-5真啟發(fā)了新的數(shù)學(xué)結(jié)論。

      OpenAI的科學(xué)家Sebastien Bubeck高調(diào)宣揚(yáng)GPT-5破解了十道Erd?s難題。

      但被指出GPT并非解決了Erd?s問題,而是找到了已經(jīng)解決這些問題的文獻(xiàn)。

      之后,他刪除了推文并表示自己并非有意誤導(dǎo)。


      Yann LeCun斥之為「自食其果」:OpenAI被他們自己的GPTards所害。


      之后,他在LinkedIn上的發(fā)帖,明顯低調(diào)多了:


      現(xiàn)在,事情來了反轉(zhuǎn)——

      Sebastien Bubeck被「冤枉」了,AI的確在加速科學(xué)進(jìn)步。


      反轉(zhuǎn)

      ChatGPT為OpenAI「正名」

      昨天,這個故事來了一個反轉(zhuǎn)——

      普林斯頓大學(xué)數(shù)學(xué)博士Boris Alexeev(下圖左)和俄亥俄州立大學(xué)副教授Dustin G. Mixon(下圖右)發(fā)現(xiàn),懸賞1000美元的707號Erd?s問題,在被提出前30年,就已經(jīng)被解決了。



      論文地址:https://borisalexeev.com/pdf/erdos707.pdf

      事情有些離譜,堪稱數(shù)學(xué)家的「虛空索敵」——

      答案比問題早30年,但直到前不久,外界還普遍以為問題沒有被解決!

      目前,707號Erd?s問題已被標(biāo)注為「Disproved」(被證偽)。


      傳送門:https://www.erdosproblems.com/go_to/707

      這次,Sebastien Bubeck扳回一局,發(fā)推表示:

      看來文獻(xiàn)檢索,終究不是件簡單的事。

      潛臺詞是說,GPT-5過去找到的10個已有解答,并非易事。

      但后面的更精彩。

      ChatGPT輔助數(shù)學(xué)證明,陶哲軒點(diǎn)贊

      兩位數(shù)學(xué)家也懷疑結(jié)果,于是決定用GPT5在Lean中生成形式化證明。最后,居然成功了!

      注意??:ChatGPT和Lean被列入了合作者,但論文內(nèi)容中還是作者「手搓」。


      不過,人類在這個過程中可沒少花功夫,需要不斷給GPT5提供反饋,完善形式化論證。

      在「Erd?s的難題」網(wǎng)站上,近期涌現(xiàn)了不少成功案例,研究者利用大語言模型在現(xiàn)有文獻(xiàn)中找到了埃爾德什問題的解法。

      值得一提的是,用AI找到Erd?s問題的「已有答案」,

      陶哲軒也注意到了這次新證明,認(rèn)為這是計算機(jī)輔助證明的有趣例子。


      在研究過程中,兩位數(shù)學(xué)家確信Lean能幫助驗(yàn)證已有論文的真?zhèn)危?dāng)時既不熟悉Lean,又覺得其操作界面不夠友好。

      然而由于ChatGPT能編寫Lean代碼,他們決定通過氛圍編程(vibe coding)方式形式化整個證明。

      這個過程耗時約一周,體驗(yàn)頗為煎熬,但最終意外成功了——

      形式系統(tǒng)中,ChatGPT嚴(yán)格證明了Erd?s猜想的否命題。

      最終生成的證明超過6000行代碼,包含26個定義、169個引理和4個定理(最終的反例驗(yàn)證部分)。在普通筆記本電腦上,代碼驗(yàn)證耗時不足半分鐘。

      經(jīng)過數(shù)輪往復(fù)的互動后,Boris和Dustin認(rèn)為,如果大語言模型的接口能與Lean深度整合,并針對這種交互方式進(jìn)行適當(dāng)微調(diào),許多問題都會大大緩解。

      即使是少量的針對性優(yōu)化,也足以讓這種「人機(jī)協(xié)作證明」的體驗(yàn)更加流暢、自然。

      陶哲軒高度認(rèn)可這次AI輔助證明。他表示,這是在研究論文中負(fù)責(zé)任地使用LLM輸出的罕見用例之一:

      重要的是,沒有任何LLM生成的輸出被直接放入正文(除了為了說明目的引用LLM生成的 Lean 代碼片段外);

      相反,這種輸出僅用于完全可驗(yàn)證的上下文中(在本例中,用于生成可由 Lean進(jìn)行類型檢查的代碼)。

      不過,陶哲軒強(qiáng)調(diào):「Lean形式化只是對人類證明的補(bǔ)充,并不能取而代之?!?/p>

      此外,他幾乎可以預(yù)見會有一些夸張的報道——「這回LLM真解決了一個Erd?s問題!」

      —— 但事實(shí)遠(yuǎn)比這復(fù)雜微妙。要得出任何結(jié)論,都需要先把來龍去脈仔細(xì)梳理清楚。

      GPT-5推動研究,端倪初現(xiàn)

      加州大學(xué)歐文分校數(shù)學(xué)教授Paata Ivanisvili,也把ChatGPT列為論文合作者。


      新論文由數(shù)學(xué)教授Paata Ivanisvili、2022屆中科大本科校友Xinyuan Xie (謝新元)合作,ChatGPT是第一作者。


      這一探索起源于兩人請GPT-5 Pro在公開的未解問題(下文)中尋找反例。


      鏈接:https://simons.berkeley.edu/sites/default/files/openprobsmerged.pdf

      標(biāo)題:Real Analysis in Computer Science:A collection of Open Problems

      經(jīng)過若干數(shù)值實(shí)驗(yàn)后,它提出了一個關(guān)于帶擦除的非交互相關(guān)蒸餾問題(Non-Interactive Correlation Distillation, NICD with erasures)的反例:

      一個定義在5比特上的布爾函數(shù),在擦除參數(shù)p=0.40時,其 E∣f(z)∣值 嚴(yán)格大于 5比特多數(shù)函數(shù)(majority function)的對應(yīng)值。

      他們記錄了這一發(fā)現(xiàn)并驗(yàn)證全部計算過程。

      這一結(jié)果與線性閾值函數(shù)中關(guān)于「Majority is Least Stable」的經(jīng)典反例,形成了呼應(yīng):即便AI只是將已知的反例模式應(yīng)用于新場景并加以驗(yàn)證,其貢獻(xiàn)依然值得肯定。


      傳送門:https://arxiv.org/abs/1703.07657

      這是理論計算機(jī)科學(xué)中AI的「星星之火」:以往大語言模型(LLMs)多用于文獻(xiàn)檢索或數(shù)值輔助,而此次則真正生成了一個具體、有限且可驗(yàn)證的反例。

      此外,UCLA的數(shù)學(xué)教授Ernest Ryu,借助GPT-5 Pro解決了一個凸優(yōu)化領(lǐng)域的開放問題。


      盡管模型約有80%的證明嘗試是錯誤的,卻提出了多條新穎思路。


      GPT-5 Pro的具體貢獻(xiàn):

      • 給出了最終可行的證明思路與論證框架

      • 通過快速排除無效路線,大幅加速了探索進(jìn)程

      這項(xiàng)工作耗時約12小時,分3天完成。事后,Ernest Ryu回想起來,這個證明其實(shí)非常簡單。

      ChatGPT生成的證明的關(guān)鍵步驟:






      可以上下滾動的圖片

      Ernest Ryu總結(jié)了他自己的貢獻(xiàn):

      • 篩選出不正確的論點(diǎn),并積累一系列正確的事實(shí)。

      • 識別有前景的新推理思路,并引導(dǎo) ChatGPT 進(jìn)一步探索這些思路

      • 認(rèn)識到何時某個策略已被充分探索,并決定何時轉(zhuǎn)向其他方向。

      他還將繼續(xù)開發(fā)這個項(xiàng)目,并將結(jié)果發(fā)表在專業(yè)的優(yōu)化理論期刊上,并分享更新和未來的部分。

      被吐槽的OpenAI科學(xué)家Sebastien Bubeck,也復(fù)現(xiàn)了類似的場景——

      GPT-5可以證明有趣的數(shù)學(xué)結(jié)論。


      不過,人類實(shí)際上搶先了gpt-5 一步:-)。另一位作者完全填補(bǔ)了差距,證明了新的界限。

      GPT-5提出的證明:


      GPT-5已經(jīng)提出了多個具有研究價值的新想法。不僅如此,它實(shí)際上自己想出了大部分提示詞:


      傳送門:https://github.com/Dicklesworthstone/model_guided_research

      AI輔助研究大門,正在打開。

      或許,歷史銘記的不是那句「太尷尬了」,而是那行悄無聲息通過編譯的qed

      參考資料:

      https://x.com/SebastienBubeck/status/1980804267524116569

      https://x.com/PI010101/status/1981014478969033156

      https://borisalexeev.com/pdf/erdos707.pdf

      https://mathstodon.xyz/@tao/115416211466664814

      https://x.com/slow_developer/status/1980990021248160009

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      紅軍城爭奪戰(zhàn)結(jié)束,俄軍進(jìn)行最后清剿,大量烏軍投降

      紅軍城爭奪戰(zhàn)結(jié)束,俄軍進(jìn)行最后清剿,大量烏軍投降

      兵國大事
      2025-11-04 17:30:59
      萬萬沒想到!灣灣博主擊碎具俊曄最后的體面,原來他留臺原因很多

      萬萬沒想到!灣灣博主擊碎具俊曄最后的體面,原來他留臺原因很多

      小娛樂悠悠
      2025-11-05 09:33:40
      停擺第36天,終釀成大禍!實(shí)在熬不住,美四大航司集體倒向共和黨

      停擺第36天,終釀成大禍!實(shí)在熬不住,美四大航司集體倒向共和黨

      南宗歷史
      2025-11-05 17:08:21
      歐盟高層爆發(fā)內(nèi)斗,反華外長挑戰(zhàn)馮德萊恩,所有人都站在同一邊

      歐盟高層爆發(fā)內(nèi)斗,反華外長挑戰(zhàn)馮德萊恩,所有人都站在同一邊

      沈言論
      2025-11-05 19:40:03
      車船稅新政11月落地!大排量車稅負(fù)上漲,1.6L以下或享優(yōu)惠

      車船稅新政11月落地!大排量車稅負(fù)上漲,1.6L以下或享優(yōu)惠

      芭比衣櫥
      2025-11-04 05:34:09
      離婚四年后,大衣哥終于等來好消息,前兒媳陳亞男悔得腸子都青了

      離婚四年后,大衣哥終于等來好消息,前兒媳陳亞男悔得腸子都青了

      說歷史的老牢
      2025-11-04 15:02:03
      古二成功毀掉王家衛(wèi),《繁花》電影版流產(chǎn),導(dǎo)演生涯基本結(jié)束

      古二成功毀掉王家衛(wèi),《繁花》電影版流產(chǎn),導(dǎo)演生涯基本結(jié)束

      光影新天地
      2025-11-04 14:48:35
      西媒:亞馬爾父親疑似訂婚 女方僅比亞馬爾大5歲

      西媒:亞馬爾父親疑似訂婚 女方僅比亞馬爾大5歲

      搜狐體育
      2025-11-05 14:41:26
      從此,請叫“貝爵爺”!貝克漢姆獲封英國王室最高爵士頭銜

      從此,請叫“貝爵爺”!貝克漢姆獲封英國王室最高爵士頭銜

      封面新聞
      2025-11-05 16:29:05
      A股:今日,讓人刮目相看,出現(xiàn)三個信號,股市即將步入尾聲了?

      A股:今日,讓人刮目相看,出現(xiàn)三個信號,股市即將步入尾聲了?

      深析古今
      2025-11-05 12:00:15
      市委書記女兒去縣財政局工作,局長處處為難她,某天書記來探班

      市委書記女兒去縣財政局工作,局長處處為難她,某天書記來探班

      秋風(fēng)專欄
      2025-10-23 11:23:56
      特朗普果然不值得信任!剛在釜山見完面,航母編隊就逼近黃巖島

      特朗普果然不值得信任!剛在釜山見完面,航母編隊就逼近黃巖島

      朔方瞭望
      2025-11-05 17:47:13
      日本連開3槍,全方位反華?王毅開始上場,第一擊就讓日本老實(shí)了

      日本連開3槍,全方位反華?王毅開始上場,第一擊就讓日本老實(shí)了

      田園小歸
      2025-11-04 09:11:29
      斷供的人多了,銀行都開始急了

      斷供的人多了,銀行都開始急了

      深藍(lán)夜讀
      2025-11-05 10:04:34
      秦雯編劇電視劇被央視撤檔,此前王家衛(wèi)秦雯私密錄音曝光惹爭議

      秦雯編劇電視劇被央視撤檔,此前王家衛(wèi)秦雯私密錄音曝光惹爭議

      魯中晨報
      2025-11-05 11:31:09
      突發(fā)!阿嬌前夫再曝離婚,結(jié)束人生第三段婚姻,妻子一夜刪光合照

      突發(fā)!阿嬌前夫再曝離婚,結(jié)束人生第三段婚姻,妻子一夜刪光合照

      阿訊說天下
      2025-11-05 13:36:52
      鴿武緣不打算親自出山,手中還有王炸沒出:體重300斤的巨人徒弟

      鴿武緣不打算親自出山,手中還有王炸沒出:體重300斤的巨人徒弟

      楊華評論
      2025-11-04 23:20:33
      澤連斯基勇赴火線;預(yù)測一下他的未來

      澤連斯基勇赴火線;預(yù)測一下他的未來

      近距離
      2025-11-05 10:33:58
      斯諾克半數(shù)8強(qiáng)誕生!中國軍團(tuán)2勝1負(fù),吳宜澤6連鞭逆轉(zhuǎn)世界第1!

      斯諾克半數(shù)8強(qiáng)誕生!中國軍團(tuán)2勝1負(fù),吳宜澤6連鞭逆轉(zhuǎn)世界第1!

      劉姚堯的文字城堡
      2025-11-05 18:00:53
      國務(wù)院空降地方任職!他們?nèi)问∥N?>
    </a>
        <h3>
      <a href=上觀新聞
      2025-11-04 20:29:04
      2025-11-05 20:23:00
      新智元 incentive-icons
      新智元
      AI產(chǎn)業(yè)主平臺領(lǐng)航智能+時代
      13794文章數(shù) 66238關(guān)注度
      往期回顧 全部

      科技要聞

      大轉(zhuǎn)彎!特朗普再提名馬斯克盟友任NASA局長

      頭條要聞

      國足換帥 邵佳一曾被贊是在德國踢球最成功的中國球員

      頭條要聞

      國足換帥 邵佳一曾被贊是在德國踢球最成功的中國球員

      體育要聞

      贏下皇馬,會是利物浦的轉(zhuǎn)折點(diǎn)嗎?

      娛樂要聞

      港星林尚武突發(fā)心臟病去世

      財經(jīng)要聞

      中方官宣!對美關(guān)稅,調(diào)整!

      汽車要聞

      智己LS9入局"9系"混戰(zhàn) 全尺寸SUV市場迎來新變量

      態(tài)度原創(chuàng)

      家居
      時尚
      數(shù)碼
      本地
      旅游

      家居要聞

      別樣府院 暢享詩意生活

      壞了,看到劇本殺鼻祖了!

      數(shù)碼要聞

      威聯(lián)通發(fā)布24盤位企業(yè)級NAS:銳龍7 PRO 7000加持,支持192GB內(nèi)存

      本地新聞

      這屆干飯人,已經(jīng)把博物館吃成了食堂

      旅游要聞

      組圖丨泰山秋景隱藏款!彩石溪更新絢麗“皮膚”

      無障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 视频二区国产精品职场同事| 国产精品亚洲欧美大片在线看| 亚洲久悠悠色悠在线播放| 日韩内射美女人妻一区二区三区 | 亚洲成亚洲成网| 亚洲国产av永久精品成人| 亚洲一区二区中文av| 强奷乱码中文字幕| 人妻少妇精品视频三区二区| 亚洲精品不卡av在线播放| 一区二区亚洲精品国产精| 欧美激情内射喷水高潮| 国产办公室秘书无码精品99| 深夜宅男福利免费在线观看| 亚洲高清日韩heyzo| 久久天天躁狠狠躁夜夜躁2012| 国产一区二区三区色成人| 国产激情视频在线观看首页| 午夜视频免费试看| 久热这里有精彩视频免费| 99精品国产丝袜在线拍国语 | 无套内谢少妇毛片在线| 人妻教师痴汉电车波多野结衣| 中文字幕国产精品日韩| 成人亚欧欧美激情在线观看| 熟女蜜臀av麻豆一区二区| 亚洲爆乳WWW无码专区| 精品日韩人妻中文字幕| 日本精品aⅴ一区二区三区| 午夜一区欧美二区高清三区| 亚洲国产中文字幕在线视频综合| 亚洲一区二区三区影院| 97成人碰碰久久人人超级碰oo| 亚洲高清WWW色好看美女| 久久96热人妻偷产精品| 国产一区二区三区我不卡| 日韩有码中文字幕国产| 深夜免费av在线观看| 国产色无码专区在线观看| 国产精品久久亚洲不卡| 中文字幕在线日韩|