自人類(lèi)抬首望向星空以來(lái),對(duì)宇宙的好奇與探索便從未止步。當(dāng)前階段的宇宙學(xué),尤其是對(duì)宇宙大尺度結(jié)構(gòu)(Large-Scale Structure, LSS)的研究,已經(jīng)進(jìn)入了數(shù)據(jù)驅(qū)動(dòng)和超算依賴(lài)的時(shí)代。科學(xué)家們?cè)噲D通過(guò)精密的計(jì)算機(jī)模擬,去追溯宇宙從誕生之初微小的量子擾動(dòng),如何演化成今天我們所見(jiàn)——一個(gè)由星系團(tuán)、超星系團(tuán)、宇宙纖維以及巨大空洞所構(gòu)成的巨型網(wǎng)絡(luò)。
然而,這類(lèi)模擬所需的巨量信息資源,通常只有世界上少數(shù)幾臺(tái)頂尖的超級(jí)計(jì)算機(jī)才能勝任,且每次運(yùn)行往往需耗時(shí)數(shù)周乃至數(shù)月。但近日,由加拿大滑鐵盧大學(xué)領(lǐng)銜開(kāi)發(fā)的一項(xiàng)軟件工具,正有望改寫(xiě)這一游戲規(guī)則。
![]()
(來(lái)源:github)
這款名為 Effort.jl 的軟件,采用了一種被稱(chēng)為 AI 模擬器(Emulator)的技術(shù)模式,來(lái)取代傳統(tǒng)的、從頭開(kāi)始的物理模擬。這款工具不是簡(jiǎn)單地重復(fù)大尺度結(jié)構(gòu)有效場(chǎng)論(EFTofLSS)復(fù)雜的計(jì)算步驟,而是選擇訓(xùn)練一個(gè)優(yōu)化的神經(jīng)網(wǎng)絡(luò),來(lái)掌握和復(fù)制大模型的輸出模式。
我們可以將傳統(tǒng)的 EFTofLSS 模擬想象成一個(gè)極度精密的工廠,每次生產(chǎn)(模擬)都需要消耗大量的能源和時(shí)間。而 Effort.jl 就像一個(gè)高性能的代理系統(tǒng),它通過(guò)學(xué)習(xí)這家工廠的歷史生產(chǎn)記錄(即模型已有的計(jì)算結(jié)果),建立起一個(gè)高效的預(yù)測(cè)模型。這個(gè)網(wǎng)絡(luò)學(xué)習(xí)了從輸入?yún)?shù)(如暗物質(zhì)的密度、暗能量的特性等)到輸出預(yù)測(cè)(如星系在空間中的分布特征)之間的關(guān)系。
Effort.jl 的訓(xùn)練過(guò)程使用了 60,000 組不同宇宙學(xué)參數(shù)配置及其對(duì)應(yīng)的功率譜數(shù)據(jù), 通過(guò)五層隱藏層、每層 64 個(gè)神經(jīng)元的神經(jīng)網(wǎng)絡(luò)架構(gòu)來(lái)捕捉這些復(fù)雜關(guān)系。整個(gè)訓(xùn)練過(guò)程在一臺(tái)配備 8 核 CPU 的普通工作站上僅需約一小時(shí)。
正是基于這種技術(shù)方法上的創(chuàng)新,Effort.jl 可以在一臺(tái)普通的筆記本電腦上運(yùn)行,不再需要完全依賴(lài)超算的力量,極大降低了該方向的研究成本。
而在訓(xùn)練完成后, Effort.jl 的計(jì)算速度進(jìn)化也十分驚人:它對(duì)于星系功率譜的單次計(jì)算時(shí)間只需大約15 微秒——這個(gè)速度比傳統(tǒng)方法快了數(shù)個(gè)數(shù)量級(jí)。具體來(lái)說(shuō),傳統(tǒng)上需要超級(jí)計(jì)算集群“數(shù)天”才能完成的高收斂度分析任務(wù),Effort.jl 在一臺(tái)標(biāo)準(zhǔn)硬件上僅用略微超過(guò) 1 小時(shí)便可以完成。
不過(guò),速度的提升必須以保證精度為前提。研究團(tuán)隊(duì)在《宇宙學(xué)和天體粒子物理學(xué)雜志》上發(fā)布了對(duì)于模型的測(cè)試結(jié)果——這些測(cè)試涵蓋了多個(gè)基準(zhǔn)數(shù)據(jù)集,包括對(duì)BOSS 巡天數(shù)據(jù)等真實(shí)觀測(cè)數(shù)據(jù)集的分析。結(jié)果顯示,Effort.jl 的預(yù)測(cè)結(jié)果與業(yè)界公認(rèn)、耗費(fèi)大量資源的 EFTofLSS 代碼pybird所得的貝葉斯后驗(yàn)概率分布(用于確定參數(shù)最佳值的統(tǒng)計(jì)分布)達(dá)到了高度的一致性。
該研究的第一作者 Marco Bonici 補(bǔ)充道:“在某些情況下,使用模型時(shí)你必須裁剪部分分析以加快速度,而使用 Effort.jl,我們能夠?qū)⒛切┤笔У牟糠忠舶ㄟM(jìn)來(lái)。”這意味著,在某些分析上,這款模仿器甚至能比傳統(tǒng)超算提供更精細(xì)的細(xì)節(jié)。
![]()
圖 | 相關(guān)論文(來(lái)源:arXiv)
當(dāng)然,Effort.jl 也并非萬(wàn)能。Bonici 特別強(qiáng)調(diào),這個(gè)工具無(wú)法替代科學(xué)家的專(zhuān)業(yè)判斷:"宇宙學(xué)家仍然需要負(fù)責(zé)設(shè)定合理的參數(shù)先驗(yàn)、解讀分析結(jié)果,并運(yùn)用物理直覺(jué)來(lái)確保結(jié)論的意義。Effort.jl 提供的是計(jì)算加速,而非科學(xué)洞察本身。"此外,模擬器的準(zhǔn)確性依賴(lài)于訓(xùn)練數(shù)據(jù)的質(zhì)量和覆蓋范圍——如果待分析的模型參數(shù)落在訓(xùn)練集邊界之外,預(yù)測(cè)精度可能會(huì)下降。不過(guò)團(tuán)隊(duì)已經(jīng)通過(guò)符號(hào)回歸 (symbolic regression)等技術(shù)來(lái)進(jìn)一步擴(kuò)展模擬器的適用范圍,從而在不損失精度的前提下進(jìn)一步提速。
這項(xiàng)工作的意義遠(yuǎn)不止于讓宇宙學(xué)計(jì)算變得更便宜、更快捷。它也代表了一種研究范式的轉(zhuǎn)變:從“我們能研究什么問(wèn)題”轉(zhuǎn)向“我們想研究什么問(wèn)題”。在過(guò)去,許多理論物理學(xué)家因?yàn)橛?jì)算成本過(guò)高而不得不簡(jiǎn)化模型假設(shè),或者在參數(shù)空間中只探索有限的區(qū)域。Effort.jl 這類(lèi)工具的出現(xiàn),意味著研究者可以更自由地嘗試復(fù)雜模型,進(jìn)行更細(xì)致的敏感性分析,甚至在數(shù)據(jù)分析過(guò)程中實(shí)時(shí)調(diào)整策略。
目前,團(tuán)隊(duì)已經(jīng)將這款工具在 GitHub 平臺(tái)上進(jìn)行開(kāi)源發(fā)布。無(wú)論是小型研究團(tuán)隊(duì)、還是單個(gè)的研究人員,都有機(jī)會(huì)利用一臺(tái)普通的電腦,參與到宇宙學(xué)數(shù)據(jù)分析中來(lái)。
而在未來(lái)幾年,對(duì)于即將到來(lái)的 DESI (Dark Energy Spectroscopic Instrument,暗能量光譜儀) 和 Euclid(歐幾里得空間望遠(yuǎn)鏡)等下一代大型巡天項(xiàng)目,這種能力尤為關(guān)鍵——這些項(xiàng)目將產(chǎn)生比以往多出數(shù)個(gè)數(shù)量級(jí)的數(shù)據(jù)量,傳統(tǒng)計(jì)算方法根本無(wú)力應(yīng)對(duì)。屆時(shí) Effort.jl 或?qū)⒋箫@身手。
![]()
1.https://arxiv.org/html/2501.04639v1
2.https://www.sciencedaily.com/releases/2025/09/250918225001.htm#
運(yùn)營(yíng)/排版:何晨龍
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.