<blockquote id="ue9b1"></blockquote>
    
    

    <style id="ue9b1"></style>
      <sub id="ue9b1"><p id="ue9b1"><form id="ue9b1"></form></p></sub>

      <strong id="ue9b1"><button id="ue9b1"><mark id="ue9b1"></mark></button></strong>
      成年午夜性影院,下面一进一出好爽视频,国产无遮挡又黄又爽又色,国产精品爽爽v在线观看无码,国产人妻久久精品一区二区三区,国产伦精品一区二区三区免费迷,国产欧美精品一区二区三区,日韩精品一区二区三区视频
      網易首頁 > 網易號 > 正文 申請入駐

      NVIDIA港大MIT聯合推出Fast-dLLM v2:端到端吞吐量提升2.5倍

      0
      分享至



      自回歸(AR)大語言模型逐 token 順序解碼的范式限制了推理效率;擴散 LLM(dLLM)以并行生成見長,但過去難以穩定跑贏自回歸(AR)模型,尤其是在 KV Cache 復用、和 可變長度 支持上仍存挑戰。

      Fast-dLLM v2給出了一條務實路線:將預訓練 AR 模型適配為適配為能并行解碼的 Block-dLLM—— 且只需~1B tokens 量級的微調即可達到 “無損” 遷移,不必訓練數百 B tokens(如 Dream 需~580B tokens)。在 A100/H100 上,它在保持精度的同時,將端到端吞吐顯著拉高,最高可達 2.5×



      • 作者單位:HKU、NVIDIA、MIT。
      • 論文鏈接:https://arxiv.org/pdf/2509.26328
      • 項目網站鏈接:https://nvlabs.github.io/Fast-dLLM/v2/
      • 代碼鏈接:https://github.com/NVlabs/Fast-dLLM

      核心看點



      • 少量數據適配(~1B tokens):已有的 AR 模型(如 Qwen2.5-Instruct 1.5B/7B)用約 1B tokens 的微調就能適配成 Block Diffusion LLM,不必訓練數百 B tokens(如 Dream 需~580B tokens)。
      • 架構上 “AR 友好”: 設計上 塊內雙向、塊間因果;配合互補掩碼與 token-shift,讓模型既保留 AR 的語義組織與可變長度能力,又獲得塊內并行帶來的效率增益。遷移過程更自然、數據效率高。
      • 層級緩存 + 并行解碼:塊級 KV Cache + 子塊 DualCache,配合置信度閾值的并行解碼,端到端最高 2.5× 提速。
      • 大模型驗證:在 7B 規模上保持與 AR 相當的生成質量下,吞吐對比 Qwen2.5-7B-Instruct 提升 2.54×。

      原理與做法:從 AR 到 Block Diffusion



      1)塊式擴散與 AR - 友好注意力

      Fast-dLLM v2 按固定塊大小把序列切成若干塊:塊內雙向注意力以并行去噪,塊間保持左到右的因果關系,從而既能并行、又能沿用 AR 的語義組織、可變長度和 KV Cache;配合互補掩碼(complementary masking)與 token-shift,保證每個 token 都在 “可見 / 被遮” 兩種視角下學習,穩定恢復 AR 語義表征。

      2)層級緩存(Hierarchical Cache)

      • 塊級緩存:已解碼塊的 KV 直接復用,天然支持 KV Cache。
      • 子塊緩存(DualCache):在部分解碼的當前塊內部,同時緩存前綴與后綴的 KV 激活,減少迭代去噪揭示 / 復原時的重復計算,貼合并行細化流程。



      3)置信度感知的并行解碼

      延續 v1 的思路:當某位置的預測置信度超過閾值(如 0.9),即可并行確定多個 token,其余不確定位置保留待后續細化。在 GSM8K 上,閾值 0.9 時吞吐從 39.1→101.7 tokens/s,提速約 2.6×,精度影響可忽略。



      性能結果

      • 端到端加速:綜合實驗顯示,對標準 AR 解碼最高 2.5× 提速,同時維持生成質量。
      • 7B 規模吞吐與精度:在 A100 上,Fast-dLLM v2(7B)吞吐為 Qwen2.5-7B-Instruct 的 2.54×;同時對比 Fast-dLLM-LLaDA 還有 +5.2% 的準確率提升(GSM8K)。
      • Batch / 硬件可擴展性:在 A100/H100 上隨 batch 增大,擴散解碼的并行優勢更明顯;A100 上可達~1.5× 吞吐加速,H100 上最高可達~1.8× 加速。



      • Benchmark 綜合得分:
      • 1.5B:平均分45.0,超過 Qwen2.5-1.5B 與 Qwen2.5-1.5B-Nemo-FT(使用相同的 LLaMA-Nemotron 后訓練數據集上對 Qwen 做的標準 NTP 微調 baseline);在同量級(≈1B 規模)的擴散類與 NTP 訓練的 AR 類模型里,屬于新的 SOTA。
      • 7B:平均分60.3,超過 Qwen2.5-7B-Nemo-FT(59.6) 和 Dream(57.6);多數單項基準上持平或更好。評測覆蓋 HumanEval/MBPP、GSM8K/MATH、MMLU/GPQA、IFEval 等多項基準。



      訓練成本

      數據 / 算力成本:以~1B tokens 量級微調把 AR 模型適配為 Block Diffusion LLM(對比 Dream 的~500B tokens),門檻顯著降低;論文給出了 Qwen2.5-Instruct 1.5B/7B 在 64×A100 上的具體訓練步數與配置,只需要幾個小時即可完成訓練,可復現性強

      總結

      Fast-dLLM v2 提供了一條務實路線:用很少的數據(~1B tokens)把 AR 模型適配為 Block Diffusion LLM,相較等規模 AR 的端到端吞吐量約提升 2.5×,精度保持可比,并且關鍵開關(塊大小、閾值、緩存)都能工程化地按目標調優,這是一個成本與收益比較均衡的解法。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      華為Mate70 Air真機首曝!薄出新高度,剛買的iPhone Air不香了

      華為Mate70 Air真機首曝!薄出新高度,剛買的iPhone Air不香了

      雷科技
      2025-11-03 15:37:32
      肺癌一查就是晚期?其實雙腿早就給了暗示,只是很多人沒發現

      肺癌一查就是晚期?其實雙腿早就給了暗示,只是很多人沒發現

      蕭鮖記錄風土人情
      2025-11-03 22:52:29
      擠眉弄眼,油腔滑調,瘦的脫相,沒馬國明霸氣,佘詩曼也帶不動他

      擠眉弄眼,油腔滑調,瘦的脫相,沒馬國明霸氣,佘詩曼也帶不動他

      白面書誏
      2025-11-05 19:53:53
      歐冠誕生超級進球:爆趟5人 狂奔68米創紀錄!球迷起立致敬

      歐冠誕生超級進球:爆趟5人 狂奔68米創紀錄!球迷起立致敬

      葉青足球世界
      2025-11-05 21:20:56
      45歲依然拍三級片尋求刺激?從億萬富豪到爛片女王,她在追求什么

      45歲依然拍三級片尋求刺激?從億萬富豪到爛片女王,她在追求什么

      牛牛叨史
      2025-11-05 14:10:58
      金與正的婚姻決定震驚朝鮮內外:再也不會有第二個張成澤!

      金與正的婚姻決定震驚朝鮮內外:再也不會有第二個張成澤!

      阿校談史
      2025-07-23 16:33:19
      回顧探花大神:害人害己,多位女主被親戚認出當場“社死”

      回顧探花大神:害人害己,多位女主被親戚認出當場“社死”

      就一點
      2025-10-09 12:19:42
      中國空軍未來5年面臨很大的換裝壓力

      中國空軍未來5年面臨很大的換裝壓力

      流云青史
      2025-11-04 16:42:47
      王岳倫帶女出席活動,王詩齡1米7身高超何超蓮,少女感穿搭獲贊

      王岳倫帶女出席活動,王詩齡1米7身高超何超蓮,少女感穿搭獲贊

      述家娛記
      2025-11-02 22:35:31
      荷蘭真急了?阿斯麥表達搬離態度,俄媒:光刻機賣不賣中國成關鍵

      荷蘭真急了?阿斯麥表達搬離態度,俄媒:光刻機賣不賣中國成關鍵

      粵語音樂噴泉
      2025-11-05 14:31:59
      “別高估了睡一覺的關系?!?>
    </a>
        <h3>
      <a href=程一
      2025-11-03 21:49:18
      91年出生,紐約新市長馬姆達尼何許人也?

      91年出生,紐約新市長馬姆達尼何許人也?

      風陽生
      2025-11-05 10:50:09
      西媒:皇馬無緣格伊:頂級中衛爭奪戰,利物浦與拜仁領跑

      西媒:皇馬無緣格伊:頂級中衛爭奪戰,利物浦與拜仁領跑

      星耀國際足壇
      2025-11-05 23:10:18
      貪污上億、假慈善?被實名舉報的韓紅,如今連坐椅子都成了“錯”

      貪污上億、假慈善?被實名舉報的韓紅,如今連坐椅子都成了“錯”

      翰飛觀事
      2025-09-25 21:18:29
      劉嘉玲、梁朝偉夫婦為張叔平慶生,三人合照氣氛溫馨

      劉嘉玲、梁朝偉夫婦為張叔平慶生,三人合照氣氛溫馨

      瀟湘晨報
      2025-11-05 23:50:11
      瘦肚子的實用方法!只需要一招,把“大肚腩”變成平坦小腹!

      瘦肚子的實用方法!只需要一招,把“大肚腩”變成平坦小腹!

      增肌減脂
      2025-11-04 19:26:49
      政府關門35天終于釀成大禍?一架波音飛機撞向大樓,現場十分慘烈

      政府關門35天終于釀成大禍?一架波音飛機撞向大樓,現場十分慘烈

      文雅筆墨
      2025-11-05 12:06:55
      黃芪和它是“絕配”!連著喝了2天,氣血通了,渾身都是勁兒!

      黃芪和它是“絕配”!連著喝了2天,氣血通了,渾身都是勁兒!

      江江食研社
      2025-11-04 18:30:02
      老大求交易,老二提不滿!西部大黑馬被打崩,但你們的前途很光明

      老大求交易,老二提不滿!西部大黑馬被打崩,但你們的前途很光明

      毒舌NBA
      2025-11-05 22:06:28
      田樸珺與王石的愛巢曝光,是新裝修過的!兩人合影,像初戀情人!

      田樸珺與王石的愛巢曝光,是新裝修過的!兩人合影,像初戀情人!

      樂悠悠娛樂
      2025-11-05 10:02:44
      2025-11-06 00:32:49
      機器之心Pro incentive-icons
      機器之心Pro
      專業的人工智能媒體
      11656文章數 142498關注度
      往期回顧 全部

      科技要聞

      大轉彎!特朗普再提名馬斯克盟友任NASA局長

      頭條要聞

      丈夫突然病亡2天后妻子也離世留下一兒一女 妹妹發聲

      頭條要聞

      丈夫突然病亡2天后妻子也離世留下一兒一女 妹妹發聲

      體育要聞

      贏下皇馬,會是利物浦的轉折點嗎?

      娛樂要聞

      港星林尚武突發心臟病去世

      財經要聞

      事關加快建設金融強國 中央金融辦發聲

      汽車要聞

      智己LS9入局"9系"混戰 全尺寸SUV市場迎來新變量

      態度原創

      本地
      教育
      親子
      藝術
      公開課

      本地新聞

      這屆干飯人,已經把博物館吃成了食堂

      教育要聞

      最新:2026年南京中考體育考試內容及評分標準曝光!

      親子要聞

      溫暖守護小患者 上海這家醫院的眼科有個“兒童樂園”

      藝術要聞

      蒲華:搦管寫竹,墨沈淋漓

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 99久久国产福利自产拍| 亚洲精品无amm毛片| 国产片AV国语在线观看手机版| 久久国产精品99久久蜜臀| 亚洲国产精品视频一二区| 欧美精品国产综合久久| 国产强奷在线播放免费| 蜜臀久久精品亚洲一区| 欧美激情精品久久久久久| 冀州市| 18分钟处破好疼哭视频在线观看| 国产免费午夜福利在线播放| 国内精品无码一区二区三区| 国产片AV国语在线观看手机版| 精品国产午夜福利理论片| 国产日韩精品视频无码| 精品午夜福利在线视在亚洲| 国产精品午夜精品福利| www夜插内射视频网站| 色综合久久综合香蕉色老大| 不卡免费一区二区日韩av| 精品国产福利一区二区在线| 2020年最新国产精品正在播放 | 色偷偷天堂av狠狠狠在| 一区二区三区四区激情视频| 亚洲乱亚洲乱妇50p| 最新亚洲av日韩av二区| 国产欧美精品一区aⅴ影院| 亚洲精品亚洲人成人网 | √新版天堂资源在线资源| 久久88香港三级台湾三级播放| 宜章县| 临朐县| 久青草精品视频在线观看| 亚洲欧美人成人综合在线播放 | 国产精品有码在线观看| 国产无遮挡又黄又爽在线视频| 国产免费又黄又爽又色毛| 色婷婷综合久久久久中文字幕| 亚洲欧美高清在线精品一区二区| 激情六月丁香婷婷四房播|