<blockquote id="ue9b1"></blockquote>
    
    

    <style id="ue9b1"></style>
      <sub id="ue9b1"><p id="ue9b1"><form id="ue9b1"></form></p></sub>

      <strong id="ue9b1"><button id="ue9b1"><mark id="ue9b1"></mark></button></strong>
      成年午夜性影院,下面一进一出好爽视频,国产无遮挡又黄又爽又色,国产精品爽爽v在线观看无码,国产人妻久久精品一区二区三区,国产伦精品一区二区三区免费迷,国产欧美精品一区二区三区,日韩精品一区二区三区视频
      網易首頁 > 網易號 > 正文 申請入駐

      牛頓力學在AI中失效?哈佛團隊揭示模型缺失物理常識

      0
      分享至

      一個在 1,000 萬個太陽系相關數據上訓練的 Transformer 模型能夠精準地預測行星軌道,卻對引力定律一竅不通。那么,預測模型和世界模型有什么區別?是否存在簡單直接的指標可以檢驗這種差異?來自美國哈佛大學和美國麻省理工學院的研究人員認為,或許最具影響力的世界模型,最初正是從一個預測模型起步的。


      (來源:https://x.com/keyonV/status/1943730502948511937)



      當開普勒和牛頓“遇見”AI

      為了研究上述 AI 問題,他們追溯到了 400 年前的科學成果。在英國科學家艾薩克?牛頓(Isaac Newton)于 17 世紀提出萬有引力定律之前,德國天文學家約翰內斯?開普勒(Johannes Kepler)的行星軌道預測模型早已存在,開普勒的預測促成了牛頓萬有引力定律的發現。

      而本次研究團隊認為,基礎模型的前景依賴于這樣一個核心假設:學習預測序列能夠揭示更深層次的規律,甚至樂觀地說其能構建出一個世界模型。雖然從某種意義上說這個想法是新穎的,但從另一種意義上說它又是古老的。

      如前所述,數百年前開普勒發現了一些幾何規律,借助這些規律能夠精準預測夜空中行星未來的位置。牛頓后來在這一進展的基礎上發展并創立了牛頓力學,這些基本定律不僅能夠預測行星的運動,還能解釋宇宙中的各種物理特性。這條“從預測序列到理解其背后深層機制”的路徑,并非物理學所獨有。在生物學領域,動物育種者們早已觀察到后代性狀的規律,而他們這些具有預測性的見解,啟發著奧地利帝國生物學家格雷戈爾?約翰?孟德爾(Gregor Johann Mendel)提出了遺傳學理論。

      如何才能知道基礎模型是否也已實現“從做出準確預測到構建可靠世界模型”的跨越?本次研究通過構建一個框架來回答這個問題。

      具體而言,研究團隊開發了一種檢測框架:當給定基礎模型和世界模型時,該框架能夠驗證基礎模型是否已經習得目標世界模型。研究團隊將這種技術稱為歸納偏置探針,它基于這樣一個簡單的見解:基礎模型的隱性世界模型會通過“其如何從少量信息中進行推斷”而顯現出來,即從少量數據中做出推斷。同樣,基礎模型的歸納偏置也能揭示其世界模型。


      (來源:https://arxiv.org/pdf/2507.06952)



      靈魂一問:模型是否掌握了牛頓力學?

      研究中,研究團隊通過以下實驗來驗證相關觀點:他們測試一個經過行星運動位置預測訓練的 Transformer 模型是否真正掌握了牛頓力學體系。具體來說,他們首先訓練一個模型來預測太陽系中行星的位置。盡管該模型能夠準確預測行星的未來軌跡,但是歸納偏置探針表明它對牛頓力學的歸納偏置較低。

      比如,當對該模型進行微調以便預測行星的力向量(牛頓力學的核心要素)時,其預測結果所隱含的引力定律是毫無意義的。研究團隊發現,該模型所習得的是零散的啟發式方法,而非一個簡潔的世界模型,它會根據所應用的數據片段采用不同的引力定律。

      幾個世紀以來,天文學家和物理學家一直致力于預測行星圍繞太陽運行的軌道。開普勒提出了一個具有開創性的模型,他的模型基于幾何圖案而提出:例如,每個行星的軌道都遵循一個橢圓,而太陽位于該橢圓的一個焦點上。盡管該模型能夠以近乎完美的精確度預測軌道,但它無法解釋行星為何遵循這些幾何軌道,也無法應用于預測軌道之外的新問題。

      后來,牛頓利用新的運動定律對上述模型進行了拓展,這些定律現在被稱為牛頓力學。這些定律涉及到計算運動中行星群的各種屬性,例如它們的相對速度和質量。利用這些特性,不僅能夠推導出開普勒早先提出的軌道運動定律,也能進一步理解力與引力等核心物理概念。

      可以說,從開普勒到牛頓,科學家們實現了從序列預測模型到深層理論認知的跨越。本次研究之中,研究團隊測試了一個能夠預測軌道軌跡序列的 Transformer 模型,以便探究它究竟僅僅是一個優秀的序列模型?還是已經實現了向世界模型的轉變?

      為此,研究團隊模擬了一個序列數據集,其中每個序列都描述了行星繞太陽運行的情況。他們隨機采樣初始條件(例如行星的質量、位置及其初始相對速度),以便匹配在已知系外行星中觀察到的軌道形狀。同時,他們根據牛頓運動定律模擬每顆行星圍繞太陽的軌跡。

      由于行星的質量遠遠小于太陽,因此行星之間的相互作用微乎其微,所以忽略不計這些相互作用。為了將軌道轉換為序列,研究團隊每隔一定時間記錄一次每個行星和太陽的(x,y)坐標,并將所有位置交錯排列成一個包含 1,000 個觀測值的序列,這意味著每個序列代表一個不同的太陽系。


      (來源:https://arxiv.org/pdf/2507.06952)

      此外,研究團隊考慮了兩種不同類型的時間間隔:固定間隔和變化間隔。在固定間隔中,每個序列使用相同的 6 個月間隔;在變化間隔中,隨機一半的序列使用 6 個月間隔,另一半使用1周間隔,并在開始處添加一個特殊 token 以用于指示間隔長度。

      例如,在一個擁有 K 個行星且時間間隔各異的太陽系中,第一個時間步長編碼了時間間隔的長度,接下來的 K 個觀測值是每個行星在第一個時間點的(x,y)坐標,再接下來的 K 個觀測值是每個行星在相應時間步長后的坐標,以此類推。

      同時,研究團隊設置了兩種訓練集規模:第一種是固定間隔數據集,擁有 10 億 token、涵蓋 100 萬條序列;第二種是可變間隔數據集,擁有 200 億 token、涵蓋 1,000 萬條序列。針對這兩種情況訓練的模型,得出了相似的結果。

      接下來,研究團隊訓練了一個包含 1.09 億個參數的 Transformer 模型,以用于預測訓練集中每個序列的下一個 token。他們在以下兩種方案中進行了實驗:第一種方案是采取連續坐標并使用均方誤差損失;第二種方案是采取離散化坐標并使用交叉熵損失。結果發現后者的效果更好。

      期間,研究團隊通過為每個坐標(x、y)創建 7,000 個區間,來離散化太陽系中每個天體的位置向量,其中坐標范圍為-50 至 50 天文單位。需要說明的是,訓練期間他們使用 8 個英偉達 H100 GPU 進行了 25 個周期的訓練。

      隨后,研究團隊在預留數據上針對模型預測結果進行評估,并發現預測效果較為良好,其決定系數(R2)超過 0.9999,而且顯著優于基準模型,即優于那些總是預測最近位置或軌道均值的模型。與此同時,它還能以較高的精度生成長軌道。


      (來源:https://arxiv.org/pdf/2507.06952)

      Transformer 預測結果證明它是一個非常出色的序列模型。但是,它是否掌握了牛頓力學?為了驗證這一點,研究團隊注意到,牛頓力學指出一系列軌道中的每次觀測都由一個狀態向量控制,該向量由每個行星的質量、相對速度和相對位置組成。鑒于軌道的下一個位置是確定的,所以如果基礎模型的歸納偏置依賴于牛頓力學,那么它必須基于這個狀態向量進行外推。

      研究中,研究團隊使用歸納偏差探針來評估模型的歸納偏差。他們創建了 100 個合成數據集,然后通過訓練模型來預測這些函數,從而對 Transformer 進行微調。其通過將 H 視為恒等映射,并將損失函數 ? 設為均方誤差,以便衡量模型在輸入上的外推預測能力,并通過將模型與一個基于狀態直接進行外推的“預言機”(oracle)進行對比來評估其中一個公式。

      與此同時,他們將線性模型和雙層神經網絡作為預言機,發現結果是相似的。其中,對牛頓狀態簡單函數的歸納偏倚較差。換言之,該模型的歸納偏置并不傾向于牛頓狀態。當它必須進行外推時,它會對狀態截然不同的軌道做出相似的預測,而對狀態非常相似的軌道則會做出不同的預測。

      為此,研究團隊通過創建一個序列到序列的數據集來對此進行測試,其中每個輸入是一條軌跡,每個輸出是“由軌道狀態所隱含的作用在行星上的”力向量。

      基于此,他們先是針對預訓練的 Transformer 進行微調,使其能夠預測太陽系軌道上的力向量,并使用 1% 的真實力數據作為訓練數據,結果顯示這些力預測結果不佳。

      為了評估該模型在掌握牛頓萬有引力定律方面的接近程度,研究團隊進一步對其進行微調,以便在包含 10,000 個太陽系的更大數據集上預測力的大小。

      需要說明的是,符號回歸是一種通過搜索優化回歸類目標的符號表達式的方法。而當研究團隊將符號回歸用于 Transformer 的預測結果時,得到的物理定律是毫無意義的。基準對比結果顯示:基于真實狀態訓練的 oracle 模型能夠精確預測力向量,符號回歸則能完整復現真實的物理定律。


      (來源:https://arxiv.org/pdf/2507.06952)



      基礎模型并未習得某一通用物理定律

      研究團隊表示,基礎模型的核心價值在于:序列預測能夠揭示對于潛在機制的深層理解。對于本次提出的評估框架來說,它通過分析模型在新任務遷移中的歸納偏差,來驗證模型是否習得預設世界模型。

      實證結果表明,盡管許多序列模型在 next-token 預測任務中表現出色,但是它們對于真實世界模型的歸納偏置往往有限。本次研究還發現,這些模型并非是在學習連貫的世界模型,而是可能依賴了粗略的狀態表征或非簡約的表征。

      總的來說,本次成果為理解基礎模型的缺陷提供了一個方向:如果一個模型的歸納偏置并非傾向于某種已知的現實模型,那么它傾向于什么?

      本次分析表明,這些模型實際上所表現出來的行為,更像是開發了無法泛化的任務特定啟發式規則。在物理學領域,基礎模型并未習得某一通用物理定律,而是會根據所應用的任務采用不同的、看似毫無意義的定律。 目前,相關論文已被 2025 國際機器學習會議(ICML,International Conference on Machine Learning)收錄。

      需要指出的是,本次研究需要指定一個世界模型,以此來測試基礎模型。世界模型需要明確定義的要求,雖與學界共識一致,但卻導致模型真實表征機制的溯因分析存在固有局限。盡管研究團隊提出了測試候選世界模型的策略(例如基于 next-token 分區的驗證方法),但未來研究應該優先開發“能夠自動構建基礎模型行為中隱式世界模型”的技術。

      參考資料:

      https://arxiv.org/pdf/2507.06952

      https://x.com/keyonV/status/1943730495264584079

      https://x.com/keyonV/status/1943730486280331460

      https://x.com/keyonV/status/1943730502948511937

      運營/排版:何晨龍

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      不到48小時,大陸同意鄭麗文請求!民進黨禍臺十年,是時候做了結

      不到48小時,大陸同意鄭麗文請求!民進黨禍臺十年,是時候做了結

      朗威游戲說
      2025-11-06 12:59:02
      百病不離肝!對肝臟最好的3種食物,一周吃2次,養肝護肝,別錯過

      百病不離肝!對肝臟最好的3種食物,一周吃2次,養肝護肝,別錯過

      阿龍美食記
      2025-10-30 11:53:11
      37歲景甜在安徽小鎮的街頭出現,皮膚好白皙身材豐腴,像女大學生

      37歲景甜在安徽小鎮的街頭出現,皮膚好白皙身材豐腴,像女大學生

      阿廢冷眼觀察所
      2025-11-06 11:19:05
      CBA資訊速遞,廣東迎高人相助,薩姆納空降,新疆隊棄用王薪凱!

      CBA資訊速遞,廣東迎高人相助,薩姆納空降,新疆隊棄用王薪凱!

      體壇小快靈
      2025-11-06 08:56:07
      暴拉!千億龍頭秒漲停,AI的盡頭是電力?滬指重回4000點!科技股再度強勢,寒武紀大漲超9%...

      暴拉!千億龍頭秒漲停,AI的盡頭是電力?滬指重回4000點!科技股再度強勢,寒武紀大漲超9%...

      雪球
      2025-11-06 15:57:02
      俄軍一艘快艇在赫爾松左岸登陸時遭殲滅畫面曝光!尸體漂浮水面

      俄軍一艘快艇在赫爾松左岸登陸時遭殲滅畫面曝光!尸體漂浮水面

      環球熱點快評
      2025-11-06 20:34:37
      王楚欽大可放心,樊振東參加全運會不是來奪冠的,而是另有所圖

      王楚欽大可放心,樊振東參加全運會不是來奪冠的,而是另有所圖

      鴻印百合
      2025-11-06 09:33:23
      耳光大賽曾有選手被擊倒后腦出血去世,最高獎金8萬美元 趙鴻剛被KO后戴墨鏡接受采訪:現在看人還是“重影”

      耳光大賽曾有選手被擊倒后腦出血去世,最高獎金8萬美元 趙鴻剛被KO后戴墨鏡接受采訪:現在看人還是“重影”

      魯中晨報
      2025-11-06 06:55:29
      單價近35萬元/平、總價1.99億元 瑞慈醫療在上海入手一套豪宅

      單價近35萬元/平、總價1.99億元 瑞慈醫療在上海入手一套豪宅

      財聯社
      2025-11-06 11:54:06
      俄外交部發言人:若非遭西方敗壞,烏克蘭本可成為經濟明珠

      俄外交部發言人:若非遭西方敗壞,烏克蘭本可成為經濟明珠

      俄羅斯衛星通訊社
      2025-11-06 15:25:22
      戰機墜海后,美航母沖向黃巖島,中國要拔4根釘子,戰區高度戒備

      戰機墜海后,美航母沖向黃巖島,中國要拔4根釘子,戰區高度戒備

      時時有聊
      2025-11-04 16:17:32
      如果在家突發心梗,黃金5分鐘自救法,快了解,關鍵時刻可自救

      如果在家突發心梗,黃金5分鐘自救法,快了解,關鍵時刻可自救

      風信子的花
      2025-10-24 23:59:39
      譴責蘇聯強占北方四島的霸權主義行徑1975年10月23日《人民日報》

      譴責蘇聯強占北方四島的霸權主義行徑1975年10月23日《人民日報》

      那些看得見的老照片
      2025-11-04 15:02:18
      岡村富夫當選捷克眾議院主席

      岡村富夫當選捷克眾議院主席

      界面新聞
      2025-11-06 07:21:22
      京東001號快遞員退休1年多,勤懇工作16年,劉強東承諾的房給了嗎

      京東001號快遞員退休1年多,勤懇工作16年,劉強東承諾的房給了嗎

      攬星河的筆記
      2025-10-30 21:38:08
      荷蘭與廣州同為1800多萬人,荷蘭創造1.22萬億GDP,廣州令人意外

      荷蘭與廣州同為1800多萬人,荷蘭創造1.22萬億GDP,廣州令人意外

      近史談
      2025-11-01 16:36:25
      吳鎮宇17歲兒子費曼在香港被偶遇,他打扮普通,頭發亂糟糟的 不帥

      吳鎮宇17歲兒子費曼在香港被偶遇,他打扮普通,頭發亂糟糟的 不帥

      TVB的四小花
      2025-11-05 07:32:13
      安東尼兒子首秀15+3+3!60%命中率!這表現比布朗尼強啊!

      安東尼兒子首秀15+3+3!60%命中率!這表現比布朗尼強啊!

      Haviven聊球
      2025-11-05 22:57:13
      國產機太慘了:全球60%的市場,只有40%的營收,僅15%的利潤

      國產機太慘了:全球60%的市場,只有40%的營收,僅15%的利潤

      互聯網.亂侃秀
      2025-11-05 16:36:17
      朝鮮副國級高官叛逃脫北,曝光金家秘聞:酒池肉林、80萬買軒尼詩

      朝鮮副國級高官叛逃脫北,曝光金家秘聞:酒池肉林、80萬買軒尼詩

      貓眼觀史
      2024-03-25 14:31:14
      2025-11-06 21:55:00
      DeepTech深科技 incentive-icons
      DeepTech深科技
      麻省理工科技評論獨家合作
      15827文章數 514268關注度
      往期回顧 全部

      科技要聞

      小鵬機器人里藏真人?何小鵬發一鏡到底視頻

      頭條要聞

      男子到堰塘釣魚時觸碰高壓線身亡 供電公司被判賠37萬

      頭條要聞

      男子到堰塘釣魚時觸碰高壓線身亡 供電公司被判賠37萬

      體育要聞

      送走兩位全明星,公牛成了東部第一

      娛樂要聞

      “黑料纏身”的白百何 誰給她的勇氣?

      財經要聞

      南銀法巴加速發展背后:資金饑渴癥待解

      汽車要聞

      是我眼花了么?怎么大猩猩都來參加新車發布了?

      態度原創

      游戲
      房產
      本地
      手機
      旅游

      PS5串流掌機重磅更新!除云游戲外還有超多體驗優化

      房產要聞

      錨定居住新趨勢!廣佛新世界重構灣區“理想生活投資學”

      本地新聞

      這屆干飯人,已經把博物館吃成了食堂

      手機要聞

      硬剛到底!iPhone Air賣爆冷仍推二代,明年能翻身嗎?

      旅游要聞

      浪漫“中國冷極”:點燃篝火 邀約冰雪

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 亚洲中文字幕国产精品| 国产一区二区精品久久岳| 2020国产欧洲精品网站| 欧美videosdesexo吹潮| 久久爱在线视频在线观看| 九色国产精品一区二区久久| 枝江市| 亚洲精品一区二区18禁| 高清中文字幕国产精品| 国产成人精品18| 久久www免费人成看片中文| 亚洲日韩亚洲另类激情文学| 亚洲色大成网站WWW久久 | 内射老妇bbwx0c0ck| 国产乱色国产精品免费视频| 国产精品一区二区三区色 | 777米奇色狠狠俺去啦| 国产av永久无码天堂影院| 激情综合网一区二区三区| 色哟哟www网站入口成人学校| 久久亚洲AV成人网站玖玖| 激情97综合亚洲色婷婷五| 内射少妇一区27p| 在线看片免费人成视久网| 加勒比无码人妻东京热| 国产精品制服丝袜白丝| 亚洲欧洲日产国码久在线| 亚洲成亚洲成网| 蜜芽久久人人超碰爱香蕉| 蜜臀av在线观看| 国产久爱免费精品视频| 国产精品亚洲二区在线看| 日韩av裸体在线播放| 制服丝袜美腿一区二区| 长腿校花无力呻吟娇喘| 日韩精品自拍偷拍一区二区| 日韩av一区二区三区在线| 亚洲av免费成人在线| 人妻少妇88久久中文字幕| 99re在线视频观看| 人妻少妇偷人作爱av|