中國科學(xué)院國家天文臺 茍利軍 編譯自 Tara Shears.
Physics World,2025,(9):20)
本文選自《物理》2025年第10期
人工智能在物理學(xué)中的應(yīng)用已屢見不鮮,但物理學(xué)是否也能反過來幫助人工智能?英國物理學(xué)會最近發(fā)布了一份調(diào)研與報(bào)告,塔拉·謝爾斯(Tara Shears)在這份報(bào)告中探討了這兩個(gè)領(lǐng)域之間的關(guān)系。
套用簡·奧斯汀(Jane Austen)的名言:凡是擁有龐大數(shù)據(jù)集的科研項(xiàng)目,必定“渴望”人工智能(artificial intelligence,AI)的助力。
費(fèi)米實(shí)驗(yàn)室對撞機(jī)探測器(CDF)是一個(gè)大型國際合作項(xiàng)目,聚集了來自15個(gè)國家約60家機(jī)構(gòu)的科學(xué)家。其中一支團(tuán)隊(duì)來自德國的卡爾斯魯厄大學(xué)(現(xiàn)為卡爾斯魯厄理工學(xué)院),他們試圖在對撞機(jī)的數(shù)據(jù)中分辨出底夸克(譯者注:bottom quark,又被稱為美夸克,beauty quark)的物質(zhì)與反物質(zhì)類型。這項(xiàng)任務(wù)出了名的困難——背景噪聲極高,信號極其微弱,而數(shù)據(jù)量龐大。更棘手的是,在許多變量上,信號與背景之間僅存在細(xì)微差異。
面對這樣的數(shù)據(jù)挑戰(zhàn),該團(tuán)隊(duì)的Michael Feindt教授開發(fā)了一種神經(jīng)網(wǎng)絡(luò)算法來解決問題。這類算法模仿人腦中神經(jīng)元的學(xué)習(xí)方式,能夠通過訓(xùn)練識別數(shù)據(jù)中的模式。Feindt的神經(jīng)網(wǎng)絡(luò)在使用合適的信號與背景樣本進(jìn)行訓(xùn)練后,能夠有效地區(qū)分二者,并以最優(yōu)方式結(jié)合變量,從而識別出物質(zhì)與反物質(zhì)的底夸克。
在當(dāng)時(shí),這項(xiàng)工作之所以引人注目,僅僅是因?yàn)樗峁┝艘环N全新的思路:如何在龐大的噪聲背景中提取微弱信號。然而事實(shí)證明,這一神經(jīng)網(wǎng)絡(luò)成為對撞機(jī)探測器諸多物理成果的重要基石,其中就包括具有里程碑意義的發(fā)現(xiàn)——Bs介子(由反底夸克與奇異夸克組成的粒子)在物質(zhì)與反物質(zhì)形態(tài)之間的振蕩。
此后,該算法的改進(jìn)版本被廣泛應(yīng)用于其他場合,包括歐洲核子研究中心大型強(qiáng)子對撞機(jī)(LHC)的四大實(shí)驗(yàn)中的三項(xiàng)。在每一個(gè)案例中,這種方法都讓研究人員能夠以更少的數(shù)據(jù)提取更多的信息,從而加快了科學(xué)進(jìn)展的步伐。
更有意思的是,這種神經(jīng)網(wǎng)絡(luò)方法的受益范圍遠(yuǎn)不止粒子物理學(xué),它還曾短暫地被應(yīng)用于對沖基金管理以及汽車保險(xiǎn)費(fèi)率預(yù)測。后來,一家名為菲-T(Phi-T,之后改名為藍(lán)色遠(yuǎn)方,BlueYonder)的公司從卡爾斯魯厄大學(xué)孵化出來,并將該算法應(yīng)用于供應(yīng)鏈物流優(yōu)化。經(jīng)過幾輪收購,這家公司如今已成為屢獲殊榮的全球性企業(yè)。而這套神經(jīng)網(wǎng)絡(luò)卻依然免費(fèi)供粒子物理學(xué)家們使用。
![]()
雙向大道。機(jī)器學(xué)習(xí)算法在分析大型物理實(shí)驗(yàn)產(chǎn)生的海量數(shù)據(jù)時(shí)極為寶貴。但與此同時(shí),物理學(xué)也推動了許多人工智能技術(shù)的發(fā)展
從實(shí)驗(yàn)室到客廳
如今,許多類型的神經(jīng)網(wǎng)絡(luò)和其他人工智能方法已被常規(guī)地用于獲取和分析粒子物理數(shù)據(jù)。事實(shí)上,我們的數(shù)據(jù)集龐大到必須依賴計(jì)算機(jī)的幫助,它們的使用已經(jīng)從“新奇之舉”變?yōu)椤氨夭豢缮佟薄?/p>
可以讓你感受一下數(shù)據(jù)規(guī)模之大,在LHC的下一輪運(yùn)行期間,其實(shí)驗(yàn)預(yù)計(jì)每年會產(chǎn)生約2000拍字節(jié)(2×1018字節(jié))的真實(shí)與模擬數(shù)據(jù),從而供研究者分析。這一數(shù)據(jù)量幾乎是YouTube上一年上傳視頻總量的10倍,是谷歌年度網(wǎng)頁數(shù)據(jù)集的30倍,相當(dāng)于Outlook一年郵件流量的三分之一以上。這樣的數(shù)據(jù)規(guī)模,毫無疑問需要人工智能來進(jìn)行分析。
粒子物理或許是人工智能的早期應(yīng)用者,但如今AI已經(jīng)廣泛滲透到整個(gè)物理學(xué)領(lǐng)域。這并不令人意外。物理學(xué)本身數(shù)據(jù)量巨大、計(jì)算密集,因此在數(shù)據(jù)分析、物理系統(tǒng)模擬,以及復(fù)雜實(shí)驗(yàn)的自動化控制等方面,都能顯著受益于人工智能帶來的速度提升和計(jì)算能力。
例如,在天文巡天中,人工智能已被用于對引力透鏡圖像進(jìn)行分類。它幫助研究人員在不同的暗能量模型下,對觀測到的物質(zhì)分布進(jìn)行解釋。實(shí)際上,2024年時(shí),AI讓暗能量巡天的研究成果有了相當(dāng)于數(shù)據(jù)樣本量翻四倍的提升(詳見“AI宇宙”)。
人工智能甚至幫助設(shè)計(jì)了新材料。2023年,谷歌DeepMind發(fā)現(xiàn)了數(shù)百萬種可能支撐未來技術(shù)發(fā)展的新晶體,這一成果相當(dāng)于800年的研究積累。而且還有許多類似的突破——AI已成為加速科學(xué)進(jìn)展的一股強(qiáng)大力量。
但人工智能并不局限于復(fù)雜的實(shí)驗(yàn)。事實(shí)上,我們每天都在使用它。AI為網(wǎng)絡(luò)搜索提供動力,幫助人們理解概念,甚至有時(shí)通過傳遞錯(cuò)誤信息讓人們產(chǎn)生誤解。如今,AI已經(jīng)滲透到生活的方方面面,每一次出現(xiàn)都同時(shí)帶來挑戰(zhàn)與機(jī)遇。
AI 宇宙
暗能量巡天合作項(xiàng)目已經(jīng)使用AI方法來研究暗能量(被認(rèn)為是驅(qū)動宇宙膨脹的神秘現(xiàn)象)。
此前,暗能量巡天研究人員通過分析來自星系光線的畸變,來推斷光在抵達(dá)觀測者之前所經(jīng)過物質(zhì)的引力效應(yīng),從而繪制出宇宙中的物質(zhì)分布。這種分布既依賴于可見物質(zhì)和暗物質(zhì)(它們將星系彼此吸引),也依賴于暗能量(它使星系相互遠(yuǎn)離)。
在2024年的一項(xiàng)研究中,研究人員利用AI技術(shù)模擬了一系列物質(zhì)分布,每一種分布對應(yīng)著暗物質(zhì)、暗能量及其他宇宙學(xué)參數(shù)的不同取值。隨后,他們將這些模擬結(jié)果與實(shí)際觀測到的物質(zhì)分布進(jìn)行比較。通過判斷哪些模擬結(jié)果與數(shù)據(jù)相符,得以提取出相應(yīng)的暗能量參數(shù)數(shù)值。
由于AI方法能夠利用比傳統(tǒng)手段更多的信息進(jìn)行對比,結(jié)果也更加精確。研究人員的精度提升了一倍,相當(dāng)于用以往方法增加四倍數(shù)據(jù)量才能達(dá)到的效果。
![]()
用深度學(xué)習(xí)解析黑暗宇宙。這是一個(gè)由名為“高爾街(GowerStreet)”的AI工具生成的暗物質(zhì)模擬圖
物理學(xué)家的聲音
正是這種挑戰(zhàn)與機(jī)遇并存的局面,讓當(dāng)下成為審視物理與人工智能關(guān)系的關(guān)鍵時(shí)刻,思考兩者能夠如何互相賦能。事實(shí)上,英國物理學(xué)會最近就此主題發(fā)布了一份“先導(dǎo)”研究報(bào)告,謝爾斯也擔(dān)任了顧問。所謂“先導(dǎo)研究”,是對某一主題進(jìn)行全景式的探索,明確后續(xù)更深入、更詳細(xì)的“影響”研究應(yīng)當(dāng)拓展的方向。
這份先導(dǎo)研究的標(biāo)題是《物理與AI:物理學(xué)界的視角》。它基于對英國物理學(xué)會會員的調(diào)查(調(diào)查他們對AI及其用途的態(tài)度),以及一次專家研討會(討論未來的創(chuàng)新潛力)。最終形成的報(bào)告于2025年4月發(fā)布,揭示了人工智能在物理學(xué)中已是如此廣泛的應(yīng)用現(xiàn)狀。
在約700名調(diào)查參與者中,約有三分之二的人表示在某種程度上使用過AI,而且在物理學(xué)的各個(gè)分支領(lǐng)域,都有相當(dāng)一部分人對其有所了解。最常見的是與各種機(jī)器學(xué)習(xí)方法或生成式AI相關(guān),但也有人接觸過AI倫理與政策、計(jì)算機(jī)視覺和自然語言處理。這表明AI的用途極其廣泛,從非常具體的模式識別和圖像分類任務(wù),到理解它更廣泛的社會影響與監(jiān)管需求。
謹(jǐn)慎前行
盡管人工智能確實(shí)能夠顯著加速物理研究,但我們必須保持謹(jǐn)慎。正如許多調(diào)查參與者指出的那樣,AI是一種強(qiáng)有力的輔助工具,但如果僅僅把它當(dāng)作黑箱來用,并想當(dāng)然地認(rèn)為它會給出正確結(jié)果,這是非常危險(xiǎn)的。AI工具本身及我們賦予它們的任務(wù)都十分復(fù)雜——我們必須確保理解它們在做什么、效果如何,才能對其結(jié)果有足夠信心。
關(guān)于AI使用不當(dāng)導(dǎo)致結(jié)果失真,有數(shù)不清的警示案例。美國麻省理工學(xué)院的Joy Adowaa Buolamwini在2017年的碩士論文中,分析了三種商用的人臉識別技術(shù),揭示出這些算法因訓(xùn)練集不完整而存在性別與種族偏見。訓(xùn)練數(shù)據(jù)集中以白人男性面孔為主,導(dǎo)致有色人種女性被誤判的比例高達(dá)35%,而白人男性的識別準(zhǔn)確率卻高達(dá)99%。這一發(fā)現(xiàn)促使IBM和微軟對其算法進(jìn)行了修正。
![]()
謹(jǐn)慎的理由。基于人工智能的人臉識別技術(shù)在黑人女性群體中的表現(xiàn)最差,這種偏差可能帶來嚴(yán)重的現(xiàn)實(shí)負(fù)面后果。其根源在于訓(xùn)練數(shù)據(jù)集嚴(yán)重偏向白人男性
即便只是評估機(jī)器學(xué)習(xí)應(yīng)用中的不確定性,也充滿了復(fù)雜性。訓(xùn)練數(shù)據(jù)從來都不完美。例如,模擬數(shù)據(jù)可能無法完全準(zhǔn)確地描述實(shí)驗(yàn)中設(shè)備的響應(yīng),或者如前例所示,若訓(xùn)練數(shù)據(jù)集不完整,真實(shí)數(shù)據(jù)中的關(guān)鍵過程就可能被遺漏。而算法的表現(xiàn)也從不完美,訓(xùn)練方式和參數(shù)選擇本身都會帶來不確定性。
事實(shí)上,在這份先導(dǎo)研究的調(diào)查中,有69%的受訪者認(rèn)為人工智能對物理學(xué)帶來了多重風(fēng)險(xiǎn),其中主要擔(dān)憂之一就是訓(xùn)練數(shù)據(jù)質(zhì)量差或錯(cuò)誤導(dǎo)致的結(jié)果不準(zhǔn)確(詳見“對不確定性的‘不確定’”)。物理研究中若出現(xiàn)結(jié)果錯(cuò)誤,可能會“發(fā)現(xiàn)”一個(gè)并不存在的粒子,或錯(cuò)過一個(gè)真正的新粒子,這已足夠嚴(yán)重。試想一下,如果未經(jīng)充分理解的AI方法被用于解讀醫(yī)學(xué)影像,作出醫(yī)療決策,或被用于金融投資的模型建議,其風(fēng)險(xiǎn)之大可想而知。然而,盡管后果嚴(yán)重,在這些現(xiàn)實(shí)場景中應(yīng)用的AI方法往往校準(zhǔn)不足,其不確定性也并未被清晰界定。
物理學(xué)界正考慮一些新方法,試圖將源于模擬訓(xùn)練數(shù)據(jù)的不確定性與算法性能相關(guān)的不確定性區(qū)分開來。然而,這并不容易。美國勞倫斯伯克利國家實(shí)驗(yàn)室的Aishik Ghosh和Benjamin Nachman在2022年的一篇論文中指出,設(shè)計(jì)出一種方法,使其對“你認(rèn)為訓(xùn)練數(shù)據(jù)中存在的不確定性”不敏感,并不等同于真正對“實(shí)際存在的不確定性”不敏感。如果情況如此,不僅測量不確定性會被低估,而且根據(jù)訓(xùn)練數(shù)據(jù)與現(xiàn)實(shí)之間的差異,還可能得到錯(cuò)誤的結(jié)果。
人工智能能夠、也確實(shí)在推動物理學(xué)發(fā)展,但我們必須投入時(shí)間正確地使用它,確保結(jié)果可靠。只有這樣,其他領(lǐng)域的人們也才能從我們的工作中受益。
對不確定性的“不確定”
![]()
英國物理學(xué)會的“先導(dǎo)研究”調(diào)查向其成員提問:“在物理學(xué)研究與創(chuàng)新中,您對人工智能的最大潛在擔(dān)憂是什么?”受訪者可以選擇多個(gè)答案,而最普遍的擔(dān)憂是人工智能的不準(zhǔn)確性。
物理學(xué)如何幫助人工智能
物理學(xué)是一個(gè)對精確度要求極高的領(lǐng)域,我們在理解結(jié)果中的偏差和不確定性時(shí)力求嚴(yán)謹(jǐn)。事實(shí)上,先導(dǎo)研究報(bào)告強(qiáng)調(diào),我們量化不確定性的方法同樣是能夠推動和強(qiáng)化人工智能的方法。這對于未來的創(chuàng)新以及提升人們對人工智能應(yīng)用的信任至關(guān)重要。
相關(guān)進(jìn)展已經(jīng)在展開。其中之一是2017年首次提出的“物理約束神經(jīng)網(wǎng)絡(luò)”。這種方法不僅利用與特定應(yīng)用相關(guān)的訓(xùn)練數(shù)據(jù),還要求模型結(jié)果必須與物理定律保持一致。引入物理規(guī)律有助于彌補(bǔ)訓(xùn)練數(shù)據(jù)的不足,并能防止出現(xiàn)違反物理規(guī)律的解,從而提高結(jié)果的準(zhǔn)確性。雖然這一領(lǐng)域還相對年輕,但發(fā)展極為迅速,已經(jīng)在計(jì)算流體力學(xué)、傳熱學(xué)、結(jié)構(gòu)力學(xué)、期權(quán)定價(jià)以及血壓估算等領(lǐng)域得到了應(yīng)用。
另一項(xiàng)進(jìn)展是貝葉斯神經(jīng)網(wǎng)絡(luò)的應(yīng)用,它能夠在預(yù)測中引入不確定性估計(jì),從而讓結(jié)果更穩(wěn)健、更具意義。這種方法已經(jīng)在醫(yī)療診斷和股市預(yù)測等決策至關(guān)重要的領(lǐng)域中進(jìn)行試驗(yàn)。
但這對物理學(xué)來說并不陌生。早在2000年代,對撞機(jī)探測器實(shí)驗(yàn)中開發(fā)的神經(jīng)網(wǎng)絡(luò)就是一種早期的貝葉斯神經(jīng)網(wǎng)絡(luò)。它被設(shè)計(jì)用來抵抗數(shù)據(jù)中的離群點(diǎn),避免因統(tǒng)計(jì)波動引起的訓(xùn)練問題,并以可靠的概率基礎(chǔ)來解釋結(jié)果。正是這些特性,使得這種方法在分析物理學(xué)以外的許多系統(tǒng)時(shí)也同樣具有不可替代的價(jià)值。
因此,物理學(xué)既從人工智能中獲益,也能推動人工智能的進(jìn)步。這是一種獨(dú)特的關(guān)系,理應(yīng)得到更廣泛的認(rèn)可,而現(xiàn)在正是將其凸顯出來的好時(shí)機(jī)。英國政府已經(jīng)表示,它認(rèn)為人工智能是“我們這一代人決定性的機(jī)遇”,能夠驅(qū)動增長和創(chuàng)新,并希望讓英國成為全球人工智能強(qiáng)國。相關(guān)行動計(jì)劃和戰(zhàn)略已經(jīng)在實(shí)施。物理學(xué)可以提供獨(dú)特的視角來助力實(shí)現(xiàn)這一目標(biāo),現(xiàn)在正是將其納入討論的時(shí)刻。
用先導(dǎo)研究報(bào)告中的話來說,我們需要清晰闡釋并展示人工智能能為物理學(xué)做些什么,以及物理學(xué)能為人工智能貢獻(xiàn)什么。讓我們從這里出發(fā),把物理學(xué)真正放上人工智能的地圖,為所有人所知。
人工智能術(shù)語與定義
以下是人工智能領(lǐng)域一些關(guān)鍵術(shù)語的定義。
人工智能(AI)
由機(jī)器展現(xiàn)出的智能行為。但“智能”的定義頗具爭議,因此一個(gè)更普遍、更容易被接受的定義是:人工智能是指系統(tǒng)能夠根據(jù)環(huán)境和既往經(jīng)驗(yàn)調(diào)整自身行為的能力。
機(jī)器學(xué)習(xí)
作為賦予機(jī)器人工智能的一類方法,機(jī)器學(xué)習(xí)本身是一個(gè)廣泛的范疇。本質(zhì)上,它是一個(gè)系統(tǒng)通過訓(xùn)練集進(jìn)行學(xué)習(xí),從而能夠在面對新數(shù)據(jù)時(shí)自主做出恰當(dāng)反應(yīng)的過程。
訓(xùn)練數(shù)據(jù)
一組真實(shí)或模擬數(shù)據(jù),用來訓(xùn)練機(jī)器學(xué)習(xí)算法,使其能夠識別數(shù)據(jù)中表征信號或背景的模式。
人工神經(jīng)網(wǎng)絡(luò)
機(jī)器學(xué)習(xí)的一個(gè)分支,其學(xué)習(xí)機(jī)制仿照生物大腦的運(yùn)作方式。輸入信號在通過層層相互連接的神經(jīng)元時(shí)會被不斷調(diào)整,最終輸出結(jié)果。“經(jīng)驗(yàn)”通過改變網(wǎng)絡(luò)中神經(jīng)元之間連接強(qiáng)度的方式被“編碼”。
生成式人工智能
一種機(jī)器學(xué)習(xí)算法,它能夠基于訓(xùn)練數(shù)據(jù)生成新的內(nèi)容,如圖像或文本。
計(jì)算機(jī)視覺
人工智能的一個(gè)分支,通過分析、解讀和提取圖像中的有用信息來識別和分類對象與模式。
自然語言處理
人工智能的一個(gè)分支,負(fù)責(zé)分析、理解和生成自然語言。
《物理》50年精選文章
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.