<blockquote id="ue9b1"></blockquote>
    
    

    <style id="ue9b1"></style>
      <sub id="ue9b1"><p id="ue9b1"><form id="ue9b1"></form></p></sub>

      <strong id="ue9b1"><button id="ue9b1"><mark id="ue9b1"></mark></button></strong>
      成年午夜性影院,下面一进一出好爽视频,国产无遮挡又黄又爽又色,国产精品爽爽v在线观看无码,国产人妻久久精品一区二区三区,国产伦精品一区二区三区免费迷,国产欧美精品一区二区三区,日韩精品一区二区三区视频
      網易首頁 > 網易號 > 正文 申請入駐

      擴散LLM推理新范式:打破生成長度限制,實現動態自適應調節

      0
      分享至



      隨著 Gemini-Diffusion,Seed-Diffusion 等擴散大語言模型(DLLM)的發布,這一領域成為了工業界和學術界的熱門方向。但是,當前 DLLM 存在著在推理時必須采用預設固定長度的限制,對于不同任務都需要專門調整才能達到最優效果。

      為了解決這一本質的問題,香港中文大學 MMLab,上海 AI 實驗室等提出 DAEDAL,賦予 DLLM 可以根據問題的具體情況自主調整回答長度的能力,彌補了 DLLM 與自回歸 LLM 的關鍵差距,為更靈活、高效、強大的擴散大語言模型打下了基石。



      • 論文標題:Beyond Fixed: Variable-Length Denoising for Diffusion Large Language Models
      • 論文地址:https://arxiv.org/abs/2508.00819
      • 代碼地址:https://github.com/Li-Jinsong/DAEDAL

      DAEDAL 作為一種 Training Free 的去噪策略,從一個統一且很短的初始長度開始,讓模型根據自己的需求在生成中調節長度,動態擴展,達到了和現有去噪策略在每個評測基準上精心調整生成長度得到的最佳性能相當的表現,有時甚至更勝一籌。



      圖 1 (a) DAEDAL 使用統一且很短的初始長度,在多個基準上取得了與精心調優的固定長度基線相當甚至更優的性能。(b) DAEDAL 能夠根據每個問題,在生成過程中自適應地動態調整長度,相比之下,現有方法則對所有問題都只能采用單一的固定長度。

      DAEDAL 介紹

      擴散大語言模型(DLLM)潛力巨大,但其現有推理流程存在一個關鍵的問題:需要預定義的,固定的生成長度。與能夠邊思考邊決定 “說” 多少的人類和自回歸模型不同,現有的 DLLM 需要預先設定確切的輸出長度。這導致了一個兩難的困境:設置太短,模型在復雜問題上難以發揮全部實力,可能導致做錯;設置太長,則會浪費大量的計算資源,同時,實驗中還發現過長的生成長度可能導致性能下降。

      作者在探索中發現,這一問題的解決方案就蘊藏在模型自身之中。DLLM 在生成時會不斷地全局規劃其整體輸出,而它的預測置信度正是其內部狀態的強大信號。作者發現了兩種關鍵信號:

      • DLLM 在序列末端生成序列結束符 (EOS) 的意愿直接反映了其對全局預算的規劃。當預設長度充足時,模型會自信地在末尾規劃出結束區域,從而高置信度地預測 EOS。反之,當長度不足時,模型會試圖利用所有可用空間來完成核心內容,因而抑制了在末尾生成 EOS 的置信度。
      • 在去噪過程中,對某個特定詞元的極低預測置信度,則可作為一種局部信號,這不僅代表了模型對該詞元的不確定性,更深層次地,它表明當前的局部上下文過于受限,不足以支撐一個復雜的邏輯步驟或細節的展開,或是需要插入空間對過去生成的內容進行補充和修正。



      圖 2 該熱力圖展示了在對一個長度為 128 的全掩碼輸入進行首次預測后,于序列末端測得的平均 EOS 詞元置信度之差。該差值的計算方式為:用 “長度充足” 問題(在少于 128 長度的 setting 下被正確回答)的平均置信度減去 “長度不足” 問題(僅在長度更長的 setting 才能被正確回答)的平均置信度。圖中大面積的綠色(差值 > 0)表明,對于長度充足的問題,結尾 EOS 序列置信度更高,驗證了文中的核心發現。

      基于發現,作者提出了 DAEDAL,一種無需訓練的兩階段推理策略,利用這些內部信號,賦予 DLLM 根據每個問題的具體情況,動態自主調整回答長度的能力。



      圖 3 DAEDAL 與現有基線方法流程對比

      1. 初始長度調整 (Initial Length Adjustment): 在去噪流程開始前,DAEDAL 從一個統一的很短初始長度出發。它會通過檢測序列末端的 EOS 序列平均置信度來衡量:“對于這個任務,當前分配的長度是否充足?”。如果置信度很低,即模型規劃充分利用全部長度,就表明模型認為長度預算不足。此時,DAEDAL 會通過增加 [MASK] 詞元來擴展序列長度,并重復此過程,直到模型確信長度預算充足。這為任務設定了一個合理的全局規劃長度。

      2. 迭代式掩碼插入 (Iterative Mask Insertion): 在逐步去噪的過程中,DAEDAL 會持續監控模型的置信度。如果它發現模型對某個 [MASK] 位置極不確定,便會將其標記為 “擴展點”。DAEDAL 通過將這個單個 [MASK] 替換為由多個 [MASK],動態且精準地在模型最需要的地方為序列注入 “思考空間”,以便其在回復中進行補充修補,或是有足夠空間去進行更復雜的思考。

      通過結合這兩個階段,不需要進行任何訓練,DAEDAL 使得 DLLM 能夠根據每個問題的具體情況自主調整其回答的長度,展現了強大的效果。

      實驗結果





      圖 4 DAEDAL 在 4 個基準測試上與基線方法性能對比以及生成長度可視化

      DAEDAL 使用統一的短初始長度即可取得強大性能。 實驗結果清晰地展示了 DAEDAL 的優越性能。盡管 DAEDAL 默認從一個較短的初始長度開始,但其兩階段的長度調整與擴展機制,不僅使其性能顯著優于使用相同短初始長度的基線方法,更能達到與基線方法在所有固定長度中精心調優后的峰值性能相當、甚至在某些情況下超越后者的水平。

      這一發現凸顯了 DAEDAL 的有效性,并揭示了固定長度范式的內在不便之處,因為基線方法的最佳長度因不同基準而異,這更強調了動態長度適應的必要性。為了直觀展示這種動態適應性,圖 3 對比了 DAEDAL 所用總生成長度(N_token)的分布與基線方法所用的單一最佳長度。

      DAEDAL 能自適應地找到最佳生成長度。 進一步的分析表明,DAEDAL 能智能地預估并生成恰當長度的回答。在多數情況下,DAEDAL 產生的有效詞元數(E_token)與基線方法在最佳性能配置下的有效詞元數相當。這表明 DAEDAL 能自適應地找到模型內在的、針對特定任務所需詞元長度的 “舒適點”。基線方法的行為也印證了這一點:當設置的長度過長時,即使有效詞元數可能繼續增加,性能反而可能會下降。DAEDAL 的自適應特性有效避免了這種因過度擴展導致的性能下降。

      DAEDAL 能夠提升計算資源利用率。在取得優越準確率的同時,DAEDAL 生成的總詞元數(N_token)通常低于基線方法在最佳性能 setting 下的總詞元數。相近的有效詞元數和更低的總詞元數帶來了更高的有效詞元利用率(E_ratio)。這大大地提升了計算資源的利用率。

      總結

      DAEDAL 通過其初始長度調整(Initial Length Adjustment)和迭代式掩碼插入(Iterative Mask Insertion)機制,不僅在多個基準上取得了與精心調優的固定長度基線相當甚至更優的性能,還能為每個任務自適應地分配合適的長度。這使得模型在性能和計算效率上都取得了實質性的提升。DAEDA 彌補了擴散大語言模型與自回歸大語言模型在核心能力上的一個關鍵差距,為更靈活、高效、強大的擴散大語言模型打下了基石。

      作者介紹

      本文第一作者是香港中文大學 MMLab 的博士生李勁松,導師林達華教授,主要研究方向是多模態大模型和大語言模型。曾在 NeurIPS,ECCV,ACL 等頂級會議發表多篇論文,Google 學術引用超 1400 次。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      這一次,英達終于反擊高調宣布喜訊,眾多明星前來捧場掙足了面子

      這一次,英達終于反擊高調宣布喜訊,眾多明星前來捧場掙足了面子

      以茶帶書
      2025-11-04 14:13:20
      王傳君拿下東京電影節影帝!撕獎過程太精彩,連坑兩位中國女星

      王傳君拿下東京電影節影帝!撕獎過程太精彩,連坑兩位中國女星

      萌神木木
      2025-11-05 17:04:13
      日本沒想到,美國也沒想到,如今的中國陜西省,已成為全球焦點

      日本沒想到,美國也沒想到,如今的中國陜西省,已成為全球焦點

      林子說事
      2025-11-05 14:11:54
      江蘇一市最新人事任免

      江蘇一市最新人事任免

      揚子晚報
      2025-11-05 17:39:35
      邵佳一:無法確定未來會怎樣,首先保證積極、健康、努力的心態

      邵佳一:無法確定未來會怎樣,首先保證積極、健康、努力的心態

      足球報
      2025-11-05 18:19:03
      醫生忠告:吃完降壓藥千萬別碰這3樣食物,患者要牢記,不能大意

      醫生忠告:吃完降壓藥千萬別碰這3樣食物,患者要牢記,不能大意

      今日養生之道
      2025-10-23 08:08:38
      11月5日俄烏:烏軍的拖延戰術

      11月5日俄烏:烏軍的拖延戰術

      山河路口
      2025-11-05 18:35:05
      楊瀚森被下放發展聯盟不是壞事?進入NBA5位中國球員都打過G聯賽

      楊瀚森被下放發展聯盟不是壞事?進入NBA5位中國球員都打過G聯賽

      大衛的籃球故事
      2025-11-05 21:10:39
      確認了、是知名演員黃曉明

      確認了、是知名演員黃曉明

      黃謀仕
      2025-10-21 23:55:48
      中國對安世釜底抽薪后,德方不再管荷蘭感受,第一個向中方提請求

      中國對安世釜底抽薪后,德方不再管荷蘭感受,第一個向中方提請求

      博覽歷史
      2025-11-04 20:07:21
      關鍵時刻,A股走出獨立行情!原因找到了

      關鍵時刻,A股走出獨立行情!原因找到了

      每經牛眼
      2025-11-05 15:34:20
      奪冠不到72小時,央視3次點名全紅嬋,釋放2大信號,果然不簡單

      奪冠不到72小時,央視3次點名全紅嬋,釋放2大信號,果然不簡單

      有范又有料
      2025-11-04 15:20:52
      暴跌,熔斷!剛剛,大跳水

      暴跌,熔斷!剛剛,大跳水

      新浪財經
      2025-11-05 10:31:00
      插翅難逃?江蘇一小河,釣魚人多達上千人!網友:真有這么多魚?

      插翅難逃?江蘇一小河,釣魚人多達上千人!網友:真有這么多魚?

      健身狂人
      2025-11-05 11:16:25
      一種能延緩衰老的運動,抵御肌肉流失,逆轉衰老進度

      一種能延緩衰老的運動,抵御肌肉流失,逆轉衰老進度

      增肌減脂
      2025-11-03 16:49:45
      拖垮中國交通的罪魁禍首,并不是車太多?這幾座山不移除就白搭

      拖垮中國交通的罪魁禍首,并不是車太多?這幾座山不移除就白搭

      半解智士
      2025-08-04 22:28:09
      王心凌愛機竟是蘋果iPhone Air 官方起售價7999元

      王心凌愛機竟是蘋果iPhone Air 官方起售價7999元

      手機中國
      2025-11-05 14:29:08
      迪亞斯:這是一個充滿情緒的夜晚;祝阿什拉夫能早日重返賽場

      迪亞斯:這是一個充滿情緒的夜晚;祝阿什拉夫能早日重返賽場

      懂球帝
      2025-11-05 21:03:16
      試播6集被叫停,30年前這部神劇,說透了中國三代人的命運

      試播6集被叫停,30年前這部神劇,說透了中國三代人的命運

      手工制作阿殲
      2025-10-30 11:33:32
      正式退賽,全紅嬋發聲,恩師官宣原因,10米臺失誤原因找到

      正式退賽,全紅嬋發聲,恩師官宣原因,10米臺失誤原因找到

      樂聊球
      2025-11-04 14:14:32
      2025-11-05 21:44:49
      機器之心Pro incentive-icons
      機器之心Pro
      專業的人工智能媒體
      11656文章數 142498關注度
      往期回顧 全部

      科技要聞

      大轉彎!特朗普再提名馬斯克盟友任NASA局長

      頭條要聞

      楊受成名下英皇宮殿停運 曾以大堂鋪滿78公斤黃金聞名

      頭條要聞

      楊受成名下英皇宮殿停運 曾以大堂鋪滿78公斤黃金聞名

      體育要聞

      贏下皇馬,會是利物浦的轉折點嗎?

      娛樂要聞

      港星林尚武突發心臟病去世

      財經要聞

      事關加快建設金融強國 中央金融辦發聲

      汽車要聞

      智己LS9入局"9系"混戰 全尺寸SUV市場迎來新變量

      態度原創

      家居
      藝術
      健康
      數碼
      軍事航空

      家居要聞

      別樣府院 暢享詩意生活

      藝術要聞

      蒲華:搦管寫竹,墨沈淋漓

      超聲探頭會加重受傷情況嗎?

      數碼要聞

      AMD銳龍AI Max+ 388/392蓄勢待發:滿血最強集顯 降落凡間

      軍事要聞

      美國“福特”號航母駛往加勒比海

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 国产边打电话边被躁视频| 在国产线视频A在线视频| 国产成人剧情AV麻豆果冻| 国产精品线在线精品| 亚洲天堂领先自拍视频网| 在线免费不卡视频| 日韩黄色av一区二区三区 | 综合色一色综合久久网| 国产精品视频全国免费观看| 亚洲尤码不卡av麻豆| 兰坪| 免费午夜无码片在线观看影院| 99精品热在线在线观看视| 日韩在线观看精品亚洲| 熟女精品国产一区二区三区| 久久精品国产中文字幕| 无线日本视频精品| 中文字幕亚洲综合第一页| 免费无码AV一区二区波多野结衣| 久久精品国产久精国产一老狼| 亚洲香蕉免费有线视频| 一卡2卡三卡4卡免费网站| 竹山县| 精品熟女少妇av免费久久| 色午夜久久男人操女人| 国产成人亚洲无码淙合青草| 中文字幕亚洲综合小综合| 人妻偷拍一区二区三区| 久久久久成人精品无码中文字幕| 高清偷拍一区二区三区| 少妇激情一区二区三区视频小说| 国产极品粉嫩学生一线天| 成在线人视频免费视频| 福利一区二区在线视频| 久久人人97超碰国产精品| 中文字幕国产精品日韩| 巨熟乳波霸若妻在线播放| 欧美成人精品手机在线| 在线永久看片免费的视频| 人妻中文字幕精品一页| 中文字幕无码av不卡一区|