<blockquote id="ue9b1"></blockquote>
    
    

    <style id="ue9b1"></style>
      <sub id="ue9b1"><p id="ue9b1"><form id="ue9b1"></form></p></sub>

      <strong id="ue9b1"><button id="ue9b1"><mark id="ue9b1"></mark></button></strong>
      成年午夜性影院,下面一进一出好爽视频,国产无遮挡又黄又爽又色,国产精品爽爽v在线观看无码,国产人妻久久精品一区二区三区,国产伦精品一区二区三区免费迷,国产欧美精品一区二区三区,日韩精品一区二区三区视频
      網易首頁 > 網易號 > 正文 申請入駐

      參數空間對稱性:深度學習理論的統一幾何框架

      0
      分享至



      過去十年,深度學習模型的規模從上百萬參數的卷積網絡擴展到上千億參數的大語言模型,性能突飛猛進。然而,我們對這些模型為何有效仍缺乏系統性的理解。一個關鍵但常被忽視的原因在于:在神經網絡中,存在大量 “不同卻等價” 的參數配置 —— 它們實現相同的模型函數,卻讓優化與泛化的分析變得格外復雜。

      近日,加州大學圣地亞哥分校與美國東北大學的研究人員發布了一篇綜述,系統梳理了這一現象背后的數學結構:神經網絡參數空間中的對稱性(parameter space symmetry)。這篇長達三十頁的論文揭示了對稱性如何塑造損失地形、影響優化與訓練動力學,并為理解深度學習提供了一個統一的幾何視角。



      • 論文鏈接:https://arxiv.org/abs/2506.13018
      • 作者主頁:https://b-zhao.github.io/

      什么是參數空間對稱性?

      在一個神經網絡中,不同的參數組合可能產生完全相同的輸出。最直觀的例子是神經元置換:交換隱藏層中兩個神經元及其對應的輸入 / 輸出權重,網絡實現的函數不變。



      圖1置換對稱:交換隱藏層兩個單元及其關聯權重,函數保持不變

      這類保持函數不變的參數變換,被稱為參數空間對稱性 (parameter space symmetry)。

      數學上,它是一組使損失函數 L (θ) 保持不變的變換 g,即 L (g ? θ) = L (θ)。這些變換構成一個群 (group),并在參數空間中定義了等價軌道 (orbit):同一軌道上的參數都表示同一個模型函數。這個視角為理解極小值的連通性、平坦性與優化動態提供了統一語言。

      除了離散的置換對稱外,幾乎所有常見的神經網絡架構都還具有連續對稱性:

      • ReLU 網絡與 BatchNorm / LayerNorm 等歸一層具有正縮放對稱;
      • 線性層和注意力機制具有一般線性(GL)對稱;
      • Softmax 函數具有平移對稱;
      • 其他結構(如徑向激活函數、RBF 網絡)也呈現出旋轉或尺度類對稱。



      圖 2 (左)ReLU 的縮放對稱:對輸入權重與偏置按對角矩陣 g 縮放,同時將輸出權重乘以 g 的逆矩陣,函數保持不變。(右)自注意力的一般線性對稱:鍵 (WK) 與查詢 (WQ) 的線性變換 g 可以互相抵消,輸出結果不變。

      更重要的是,復雜的現代架構,如 Transformer,其對稱性是其各組件對稱性的組合。例如,多頭注意力機制同時具有每個頭內部的廣義線性對稱性、頭之間的排列對稱性,以及與輸出投影層相關的另一組線性對稱性。

      從平坦極小值到模式連通性:對稱性如何塑造損失地形

      對稱性讓優化空間既復雜又有規律。

      連續對稱性(如縮放)會將一個孤立的極小值點 “拉伸” 成一個連續、平坦的極小值流形。沿著這個流形移動,損失值保持不變。這意味著網絡的許多平坦方向并非來自更好的泛化,而是由結構對稱性決定的。因此,傳統用平坦度衡量泛化能力的指標需要謹慎解讀。

      另外,實踐中觀察到的 “模式連通性”—— 即獨立訓練得到的模型往往能通過低損耗路徑連接 —— 其背后也部分源于連續對稱性。對稱性天然地在參數空間中創造出連接功能等價參數的連續路徑,從而解釋了模型融合(model fusion)為何能有效。



      圖 3 連續對稱性與平坦極小值:不同的參數 θ,g1 ? θ,g2 ? θ 具有相同的損失值,構成一條由對稱變換生成的平坦軌跡。

      離散對稱性(如神經元置換)則會在參數空間的不同位置復制出大量功能完全相同的極小值 “副本”。這使損失地形更加復雜,其極小值的數量隨網絡寬度呈階乘級增長。

      從幾何到算法:利用對稱性的優化方法

      在對稱群的作用下,即使兩組參數具有相同的損失值,它們的梯度方向和大小也可能不同(圖 4 左)。這意味著,即使兩組參數在函數意義上等價,它們的訓練軌跡仍可能完全不同(圖 4 右)。



      圖 4 相同的損失值可能對應著不同的梯度和訓練軌跡

      這種 “等損失、不同梯度” 的現象為算法設計帶來了新的可能。部分優化方法嘗試在等價軌道中主動尋找梯度更優的點,以加快收斂或改善最終解的性質(圖 5 左);另一些方法則追求對稱不變性,讓優化結果對初始點的等價變換不敏感(圖 5 右)。



      圖 5 兩類應用對稱性的優化算法

      前者將對稱性視為可用的自由度,后者將其作為應被約簡的冗余。無論哪種思路,都表明對稱性是理解和改進優化算法的重要線索。

      從對稱到守恒:學習動力學的新理解

      連續對稱性往往對應著守恒量(conserved quantities)—— 類似物理中的諾特定理。

      在梯度流(gradient flow)中,對稱性使得某些量在訓練過程中保持恒定。例如,線性網絡中相鄰層的 Gram 矩陣差、ReLU 網絡中輸入輸出權重的范數差。

      這些守恒量揭示了訓練過程的穩定性,也幫助解釋優化的隱式偏置(implicit bias):

      不同的初始化對應不同的守恒量值,進而影響最終的收斂點和泛化性能。也就是說,參數空間的對稱結構決定了學習軌跡與結果的統計分布。



      圖 6 對稱性與守恒量的關系。(左)對稱方向與守恒量的梯度 ?Q 都與 ?L 正交,位于損失水平集的切平面上。(右)守恒量在訓練中保持不變,從而為梯度流軌跡與最終極小值提供了參數化坐標。

      跨空間的聯系:參數、表征與數據中的對稱

      參數空間中的對稱性并非孤立存在,而是與數據空間和內部表征空間的對稱緊密相連。

      當數據分布本身具有某種對稱性(如旋轉、平移或翻轉)時,訓練得到的模型參數往往會繼承并反映這些結構。

      此外,在 “權重空間學習”(Weight Space Learning)等新興方向中,神經網絡參數本身被作為輸入數據。此時,對稱性成為新的 “數據結構”,支持了等變元網絡(equivariant meta-network)在模型性質分析和生成中的廣泛應用。



      圖 7 對稱不變與對稱等變的元網絡:等變元網絡可直接在模型權重上進行學習,被用于在預測模型的泛化能力,學習優化中的權重更新,以及生成滿足特定特征的新模型等任務。

      展望:一個正在形成的研究領域

      參數空間中的對稱性廣泛存在,為深度學習提供了一種新的數學語言,將模型的復雜行為與群論和幾何中的成熟工具聯系起來。

      這一視角正在影響多個領域的實踐:從加速優化與改善泛化,到模型融合、量化和采樣,再到新興的權重空間學習與生成模型設計。對稱性正在從理論概念轉化為可操作的算法原則。

      當然,對稱性并非理解神經網絡的唯一路徑。但正如物理、神經科學等學科為機器學習帶來了新方法一樣,數學化的視角讓我們得以在這個完全人工的系統中尋找結構與規律,并由此開拓新的學習理論與算法思路。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      事實證明,“消失”多年的清華才女武亦姝,證實了董卿當年沒說錯

      事實證明,“消失”多年的清華才女武亦姝,證實了董卿當年沒說錯

      千言娛樂記
      2025-09-25 20:27:56
      放棄洋帥!足協做出重大決定,國足主帥四選一,一人手握兩大優勢

      放棄洋帥!足協做出重大決定,國足主帥四選一,一人手握兩大優勢

      籃球圈里的那些事
      2025-11-05 14:02:52
      阿森納激活 “世界最佳九號”!阿爾特塔再遭質疑

      阿森納激活 “世界最佳九號”!阿爾特塔再遭質疑

      奶蓋熊本熊
      2025-11-05 12:48:54
      為了防止客人穿過退,店家只能這樣干了:給衣服裝密碼鎖!

      為了防止客人穿過退,店家只能這樣干了:給衣服裝密碼鎖!

      夜深愛雜談
      2025-11-04 21:47:20
      國務院臺辦新任發言人、港澳局局長張晗亮相

      國務院臺辦新任發言人、港澳局局長張晗亮相

      政知新媒體
      2025-11-05 10:26:10
      王家衛劇組在陜西榆林組團Piao娼?

      王家衛劇組在陜西榆林組團Piao娼?

      華人星光
      2025-11-05 11:53:54
      央媒評動力電池路線單一將阻礙中國新能源發展,專家強調三元鋰與磷酸鐵鋰需并行研發

      央媒評動力電池路線單一將阻礙中國新能源發展,專家強調三元鋰與磷酸鐵鋰需并行研發

      澎湃新聞
      2025-11-05 14:22:10
      A股:不用等周四開盤,不出意外的話,明天或將這樣變化

      A股:不用等周四開盤,不出意外的話,明天或將這樣變化

      財經大拿
      2025-11-05 13:36:42
      司機在口袋里養鸚鵡半月,開車間隙逗玩,沒想到身體出事了!醫生提醒:潛伏期最長45天

      司機在口袋里養鸚鵡半月,開車間隙逗玩,沒想到身體出事了!醫生提醒:潛伏期最長45天

      FM93浙江交通之聲
      2025-11-04 20:09:22
      魔鬼賽程!阿森納后面將陸續迎戰桑德蘭、熱刺、拜仁、切爾西

      魔鬼賽程!阿森納后面將陸續迎戰桑德蘭、熱刺、拜仁、切爾西

      懂球帝
      2025-11-05 14:43:13
      毛主席視察天津時想見李銀橋,得知他已經入獄,偉人只說了2個字

      毛主席視察天津時想見李銀橋,得知他已經入獄,偉人只說了2個字

      南書房
      2025-09-28 23:01:03
      快船107-126雷霆 球員評價:3人優秀,2人及格,4人崩盤

      快船107-126雷霆 球員評價:3人優秀,2人及格,4人崩盤

      籃球資訊達人
      2025-11-05 15:04:24
      《雪中悍刀行2》騰訊預熱,張若昀大男主,原班人馬回歸意義不大

      《雪中悍刀行2》騰訊預熱,張若昀大男主,原班人馬回歸意義不大

      妙知
      2025-11-04 10:34:03
      暴跌,熔斷!剛剛,大跳水

      暴跌,熔斷!剛剛,大跳水

      新浪財經
      2025-11-05 10:31:00
      關于爸媽的瓜能有多炸裂?網友:這擱古代都是浸豬籠的大罪啊!

      關于爸媽的瓜能有多炸裂?網友:這擱古代都是浸豬籠的大罪啊!

      解讀熱點事件
      2025-11-02 14:48:17
      女性出軌率最高的幾大職業

      女性出軌率最高的幾大職業

      微微熱評
      2025-11-04 12:27:00
      許婧39歲生日美照曝光,外籍帥老公貼身相伴,這甜蜜度直接拉滿

      許婧39歲生日美照曝光,外籍帥老公貼身相伴,這甜蜜度直接拉滿

      鄭丁嘉話
      2025-11-04 10:41:50
      北京這一夜,秦海璐腫了,蔣欣瘦成皮包骨,卻被66歲的她驚艷了

      北京這一夜,秦海璐腫了,蔣欣瘦成皮包骨,卻被66歲的她驚艷了

      有范又有料
      2025-11-05 10:41:30
      蔣介石臨終前告訴蔣經國:我這一生只敬佩一人,畏懼兩人!

      蔣介石臨終前告訴蔣經國:我這一生只敬佩一人,畏懼兩人!

      浪子阿邴聊體育
      2025-11-01 10:57:22
      想的挺美——哈馬斯要求豁免躲藏在加沙隧道中的恐怖分子

      想的挺美——哈馬斯要求豁免躲藏在加沙隧道中的恐怖分子

      老王說正義
      2025-11-04 00:05:34
      2025-11-05 17:43:00
      機器之心Pro incentive-icons
      機器之心Pro
      專業的人工智能媒體
      11655文章數 142498關注度
      往期回顧 全部

      科技要聞

      大轉彎!特朗普再提名馬斯克盟友任NASA局長

      頭條要聞

      足球報:邵佳一出任國足新帥 將攜外籍助教上任

      頭條要聞

      足球報:邵佳一出任國足新帥 將攜外籍助教上任

      體育要聞

      贏下皇馬,會是利物浦的轉折點嗎?

      娛樂要聞

      港星林尚武突發心臟病去世

      財經要聞

      中方官宣!對美關稅,調整!

      汽車要聞

      智己LS9入局"9系"混戰 全尺寸SUV市場迎來新變量

      態度原創

      教育
      旅游
      手機
      公開課
      軍事航空

      教育要聞

      倪文尖教授:中學生該如何進行整本書閱讀?從《朝花夕拾》談整本書閱讀思維養成

      旅游要聞

      上海中心聯動浦江游覽推出聯程專線,水岸融合打造進博文旅新標桿

      手機要聞

      小米REDMI Turbo 5 Pro曝光:9000mAh大電池+超聲波指紋

      公開課

      李玫瑾:為什么性格比能力更重要?

      軍事要聞

      美國“福特”號航母駛往加勒比海

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 亚洲午夜无码久久久久小说| 亚洲av影院一区二区三区| 国产成人精品亚洲精品日日| 亚洲男人的天堂久久香蕉| 国产午精品午夜福利757视频播放| 蜜芽久久人人超碰爱香蕉| 亚洲日韩国产精品第一页一区| 国产精品伦人一久二久三久| 欧美喷潮最猛视频| 晋城| 国产精品天天看天天狠| 日日橹狠狠爱欧美视频| 深夜av免费在线观看| 中文字幕亚洲精品乱码| 二区中文字幕在线观看| 林口县| 天天做天天爱夜夜爽导航| 国产乱码日产乱码精品精| 久久99精品久久久久麻豆| 日韩国产欧美精品在线| 国产老妇伦国产熟女老妇高清| 最新亚洲人成网站在线影院| 人人妻人人澡人人爽人人精品电影| 精品视频国产狼友视频| 无码伊人久久大杳蕉中文无码| 色综合 图片区 小说区| 蜜桃无码一区二区三区| 精品无码国产污污污免费| 久久精品国产亚洲av麻| 无码内射中文字幕岛国片 | 久久婷婷大香萑太香蕉av人| 国产自在自线午夜精品| 丰宁| 国产片AV国语在线观看手机版| 亚洲AV成人片在线观看| 亚洲激情一区二区三区在线| 成av人电影在线观看| 久久精品人人做人人爽电影蜜月| 国产尤物精品自在拍视频首页| 免费人成在线观看网站| 久久精品国产精品亚洲|