- 克雷西 發自 凹非寺
量子位 | 公眾號 QbitAI
陶哲軒又來安利AlphaEvolve了。
在與DeepMind高級工程師Bogdan Georgiev等人合著的新論文中,陶哲軒稱其為數學發現的有力新工具。
![]()
具體來說,他們用AlphaEvolve研究了67個數學問題,涵蓋組合數學、幾何、數學分析與數論等多個領域。
![]()
結果發現,AlphaEvolve在可擴展性、魯棒性、可解釋性方面均優于傳統工具。
更關鍵的是,AlphaEvolve已經可以自主發現新穎的數學構造,并在部分問題上超越人類已有的最優結果。
AI自主發現新數學構造
AlphaEvolve在67個問題的測試中,不僅復現了眾多已知最優解,更在多個方面展現了其獨特的發現能力。
一個關鍵的成就是AlphaEvolve能夠自主發現人類未曾一窺的新數學構造。
例如在處理Nikodym集問題時,系統生成的初步構造雖然尚未達到最優,但它為人類研究者提供了“一個極好的人類直覺跳板” 。
![]()
基于AI提供的結構,研究人員通過人工簡化和直覺推演,最終找到了一個更優的構造,改進了已知的上界,這一人機協作的成果將作為一篇獨立的數學論文發表。
![]()
同樣地,在算術Kakeya猜想中,AlphaEvolve也發揮了類似作用。
![]()
系統不僅將一個已知的下界從1.61226提升至1.668,其構造的解(形態上類似于離散高斯分布)還啟發人類數學家建立了新的漸近關系,相關成果也即將發表。
![]()
這種啟發人類研究的能力,與AlphaEvolve輸出結果的可解釋性緊密相關。
系統在大多數情況下生成的是結構清晰的程序代碼,而非難以理解的黑盒結果,這使得人類專家可以方便地分析、歸納其發現的模式,并提煉出通用的數學公式。
積木堆疊問題便是這一特性的絕佳體現。
![]()
在該問題中,系統最初生成了一個邏輯正確的遞歸程序來計算積木的放置。在隨后的演化中,系統內部的LLM分析了這段代碼的邏輯,并自主將其重構為一個更簡潔、高效的顯式程序。
這個最終程序清晰地揭示了最優解與諧波數(harmonic numbers)之間的數學關系,這與人類已知的理論公式完全一致,展示了系統從復雜解法中提煉數學本質的能力。
![]()
除了方案的清晰性,AlphaEvolve在不同類型的問題設置下也表現出了強大的魯棒性。
它能夠有效處理高維度參數空間、復雜的幾何約束以及基于蒙特卡洛模擬的近似評分函數。
比如這里有一個最小三角形密度問題。
![]()
研究人員最初設計了一個樸素的評分函數,但系統很快利用了該問題空間的非凸性,通過“欺騙”評分函數獲得了超越理論最優的不可能分數。
![]()
為了解決這個問題,研究人員設計了一個更魯棒的新評分函數,該函數基于問題的利普希茨連續性(Lipschitz type bounds)構造。
在切換到這個更復雜的連續評分函數后,AlphaEvolve不再受局部陷阱的迷惑,迅速收斂到了已知的、正確的理論最優解。
![]()
并且AlphaEvolve具備了出色的泛化能力,來看IMO 2025的第6題。
![]()
研究人員只在輸入n為完全平方數時才對系統進行評分。這種“信息限制”反而迫使AlphaEvolve去尋找這些稀疏實例背后的共同結構模式,而不是對每個n進行“過擬合”。
![]()
最終,系統成功發現并輸出了在所有完全平方數n上均達到最優的通用構造,展現出了歸納能力。
![]()
在實際應用中,AlphaEvolve的效率極高,僅需少量高質量提示即可驅動。論文指出,來自領域專家的提示(expert guidance)往往能顯著提升最終構造的質量,表明系統對人類輸入具有高度的敏感性。
同時,該系統在架構上支持并行化,允許研究人員在多個問題實例或同一問題的不同參數設置上同時運行探索,并能自動遷移成功的搜索策略,這在處理多參數的幾何類問題時尤其高效。
AlphaEvolve工作模式
AlphaEvolve并非一個單一流程的系統,而是通過不同“工作模式”適應不同類型的數學問題探索任務。
該系統主要在兩種不同的模式下運行——“搜索模式”(search mode)和“泛化模式”(generalizer mode)。
“搜索模式”是系統最常用的模式,其目標是高效地發現最優的數學構造,而不必關心構造過程是否具有可解釋性或普適性。在這種模式下,AlphaEvolve演化的不是直接生成構造的程序,而是演化用于搜索構造的程序。
每一個被演化的程序本身就是一個“搜索啟發式算法”(search heuristic)。
評估器會給予這些啟發式算法一個固定的時間預算,算法的得分取決于它在此預算內能找到的最佳構造的質量。
這種方式解決了LLM調用(緩慢且昂貴)與傳統局部搜索(快速且廉價)之間的速度差異——一次緩慢的LLM調用用于生成一個高效的搜索策略,該策略隨后可以觸發大規模的廉價計算,自主探索數百萬個候選構造。
系統演化的是一系列“改進器”(improver)函數,它們動態地適應搜索進程,早期可能偏好進行廣泛探索的啟發式算法,而當接近最優解時,則會演化出更精細的、針對特定問題進行優化的算法。
![]()
“泛化模式”則更具挑戰性 。
其目標是讓AlphaEvolve編寫一個能夠解決任意給定參數n的問題的通用程序 。系統的評估方式是考察該程序在一系列不同n值上的綜合表現。
這種模式的期望是,通過讓系統觀察自己在小規模n上找到的最優解,它能夠自主“發現模式”,并將其歸納推廣為一個適用于所有n的通用公式或算法 。
![]()
總之,AlphaEvolve展示了AI引導的演化搜索如何補充人類的直覺,為數學研究提供了一個強大的新范式。
論文地址:
https://arxiv.org/abs/2511.02864
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.