<blockquote id="ue9b1"></blockquote>
    
    

    <style id="ue9b1"></style>
      <sub id="ue9b1"><p id="ue9b1"><form id="ue9b1"></form></p></sub>

      <strong id="ue9b1"><button id="ue9b1"><mark id="ue9b1"></mark></button></strong>
      成年午夜性影院,下面一进一出好爽视频,国产无遮挡又黄又爽又色,国产精品爽爽v在线观看无码,国产人妻久久精品一区二区三区,国产伦精品一区二区三区免费迷,国产欧美精品一区二区三区,日韩精品一区二区三区视频
      網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

      Lumina-mGPT 2.0:自回歸模型華麗復(fù)興,媲美頂尖擴(kuò)散模型

      0
      分享至



      上海人工智能實(shí)驗(yàn)室等團(tuán)隊(duì)提出Lumina-mGPT 2.0 —— 一款獨(dú)立的、僅使用解碼器的自回歸模型,統(tǒng)一了包括文生圖、圖像對(duì)生成、主體驅(qū)動(dòng)生成、多輪圖像編輯、可控生成和密集預(yù)測(cè)在內(nèi)的廣泛任務(wù)。

      本文第一作者辛毅為南京大學(xué) & 上海創(chuàng)智學(xué)院博士生,現(xiàn)于上海人工智能實(shí)驗(yàn)室實(shí)習(xí),研究方向?yàn)閳D像 / 視頻生成、多模態(tài)生成與理解統(tǒng)一等。通訊作者為上海人工智能實(shí)驗(yàn)室青年科學(xué)家 — 高鵬。本文其他作者來自上海人工智能實(shí)驗(yàn)室、香港中文大學(xué)、上海交通大學(xué)、上海創(chuàng)智學(xué)院、浙江工業(yè)大學(xué)等。



      • 論文標(biāo)題:Lumina-mGPT 2.0: Stand-Alone AutoRegressive Image Modeling
      • 論文鏈接:arxiv.org/pdf/2507.17801
      • GitHub 地址:Alpha-VLLM/Lumina-mGPT-2.0
      • 關(guān)鍵詞:圖像生成、自回歸模型、基座模型。

      核心技術(shù)與突破

      完全獨(dú)立的訓(xùn)練架構(gòu)

      不同于依賴預(yù)訓(xùn)練權(quán)重的傳統(tǒng)方案,Lumina-mGPT 2.0 采用純解碼器 Transformer 架構(gòu),從參數(shù)初始化開始完全獨(dú)立訓(xùn)練。這帶來三大優(yōu)勢(shì):架構(gòu)設(shè)計(jì)不受限制(提供了 20 億和 70 億參數(shù)兩個(gè)版本)、規(guī)避授權(quán)限制(如Chameleon的版權(quán)問題)、減少預(yù)訓(xùn)練模型帶來的固有偏差。



      圖像分詞器方面,通過對(duì)比 VQGAN、ViT-VQGAN 等多種方案,最終選擇在 MS-COCO 數(shù)據(jù)集上重建質(zhì)量最優(yōu)的 SBER-MoVQGAN,為高質(zhì)量生成奠定基礎(chǔ)。



      統(tǒng)一多任務(wù)處理框架

      創(chuàng)新地采用統(tǒng)一的圖像分詞方案,將圖生圖任務(wù)通過上下拼接視為一張圖像,并通過提示描述進(jìn)行控制,實(shí)現(xiàn)多任務(wù)訓(xùn)練與文生圖訓(xùn)練的一致性。使得單一模型能夠無縫支持以下任務(wù):

      • 文生圖
      • 主體驅(qū)動(dòng)生成
      • 圖像編輯
      • 可控生成(如基于輪廓 / 深度的生成)
      • 密集預(yù)測(cè)

      這種設(shè)計(jì)避免了傳統(tǒng)模型需切換不同框架的繁瑣,通過系統(tǒng)提示詞即可靈活控制任務(wù)類型。



      高效的推理策略

      為了解決自回歸模型生成速度慢的痛點(diǎn),團(tuán)隊(duì)引入兩種優(yōu)化:

      • 模型量化:將模型權(quán)重量化為 4 位整數(shù),同時(shí)保持激活張量為 bfloat16,通過 PyTorch 2.0 中的原生編譯工具和 torch.compile 的 reduce-overhead 模式實(shí)現(xiàn)無需改變模型架構(gòu)的優(yōu)化。

      • 推測(cè)式 Jacobi 采樣:通過靜態(tài) KV 緩存和靜態(tài)因果注意掩碼的方案,使 SJD 兼容于靜態(tài)編譯框架,從而實(shí)現(xiàn)加速采樣,同時(shí)避免動(dòng)態(tài)調(diào)整緩存。結(jié)合 4 位量化技術(shù),減少 60% GPU 顯存消耗,同時(shí)通過并行解碼加速生成。

      實(shí)驗(yàn)顯示,優(yōu)化后模型在保持質(zhì)量的前提下,生成效率顯著提升。



      實(shí)驗(yàn)結(jié)果

      文生圖實(shí)驗(yàn)結(jié)果

      在文本到圖像生成領(lǐng)域,Lumina-mGPT 2.0 在多個(gè)基準(zhǔn)測(cè)試中表現(xiàn)優(yōu)異,與 SANA 和Janus Pro等擴(kuò)散模型和自回歸模型相當(dāng)甚至超越,特別是在 “兩個(gè)物體” 和 “顏色屬性” 測(cè)試中表現(xiàn)卓越,以 0.80 的GenEval 分?jǐn)?shù)躋身頂級(jí)生成模型之列。



      此外,在實(shí)際生成效果上,Lumina-mGPT 2.0 在真實(shí)感、細(xì)節(jié)和連貫性方面優(yōu)于前代 Lumina-mGPT 和 Janus Pro,更具視覺吸引力和自然美感。



      多任務(wù)實(shí)驗(yàn)結(jié)果

      在 Graph200K 多任務(wù)基準(zhǔn)中(可控生成、物體驅(qū)動(dòng)生成),Lumina-mGPT 2.0 表現(xiàn)優(yōu)異,證明了純自回歸模型在單一框架下完成多模態(tài)生成任務(wù)的可能性。



      此外,團(tuán)隊(duì)與其他的多任務(wù)生成模型進(jìn)行了實(shí)際比較,Lumina-mGPT 2.0 在可控生成和主題驅(qū)動(dòng)生成任務(wù)中表現(xiàn)突出,與 Lumina-mGPT、OneDiffusion和 OmniGen 等模型相比,展示了卓越的生成能力和靈活性。



      未來方向

      Lumina-mGPT 2.0 在優(yōu)化推理后,仍面臨采樣時(shí)間長的問題,與其他基于自回歸的生成模型相似,這影響了用戶體驗(yàn),后續(xù)將進(jìn)一步優(yōu)化。當(dāng)前 Lumina-mGPT 2.0 的重點(diǎn)在多模態(tài)生成, 但計(jì)劃更新擴(kuò)展至多模態(tài)理解,以提高其整體功能和性能,這將使 Lumina-mGPT 2.0 在滿足用戶需求方面更加全面。

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      突發(fā)!神舟二十號(hào)飛船遭太空垃圾撞擊,將推遲返回!問題大不大?

      突發(fā)!神舟二十號(hào)飛船遭太空垃圾撞擊,將推遲返回!問題大不大?

      科普大世界
      2025-11-05 11:06:27
      震驚!長沙女子曬出生育津貼104412.75元,休了173天,每天603元

      震驚!長沙女子曬出生育津貼104412.75元,休了173天,每天603元

      火山詩話
      2025-11-04 18:38:12
      對(duì)話時(shí)空壺CTO石偉:我們要讓技術(shù)更有溫度,歡迎良性競(jìng)爭(zhēng)

      對(duì)話時(shí)空壺CTO石偉:我們要讓技術(shù)更有溫度,歡迎良性競(jìng)爭(zhēng)

      雷科技
      2025-11-04 21:12:17
      樂視創(chuàng)始人欠122億巨債跑美七年,400多名老員工讓樂視起死回生。

      樂視創(chuàng)始人欠122億巨債跑美七年,400多名老員工讓樂視起死回生。

      百態(tài)人間
      2025-11-05 05:35:03
      網(wǎng)傳相聲表演要備案?只聽正能量相聲,要守規(guī)矩笑,不能現(xiàn)掛?

      網(wǎng)傳相聲表演要備案?只聽正能量相聲,要守規(guī)矩笑,不能現(xiàn)掛?

      眼光很亮
      2025-11-05 09:46:00
      國足新主帥出爐!名記:邵佳一確認(rèn)當(dāng)選,執(zhí)教西海岸勝率36%

      國足新主帥出爐!名記:邵佳一確認(rèn)當(dāng)選,執(zhí)教西海岸勝率36%

      奧拜爾
      2025-11-05 17:03:23
      63歲演員吳鎮(zhèn)宇刷老年卡坐公交,被疑“冒用他人證件”險(xiǎn)被趕下車,當(dāng)場(chǎng)掏身份證自證清白

      63歲演員吳鎮(zhèn)宇刷老年卡坐公交,被疑“冒用他人證件”險(xiǎn)被趕下車,當(dāng)場(chǎng)掏身份證自證清白

      極目新聞
      2025-11-04 21:57:03
      開拓者官方:楊瀚森被下放至G聯(lián)賽,隨混音隊(duì)完成今日訓(xùn)練后將被召回

      開拓者官方:楊瀚森被下放至G聯(lián)賽,隨混音隊(duì)完成今日訓(xùn)練后將被召回

      懂球帝
      2025-11-05 08:10:07
      一位姓袁的歷史老師,為何能3次準(zhǔn)確預(yù)言俄烏戰(zhàn)爭(zhēng)走向?

      一位姓袁的歷史老師,為何能3次準(zhǔn)確預(yù)言俄烏戰(zhàn)爭(zhēng)走向?

      貓智深
      2025-11-04 20:10:12
      3名廳官被查,他上周剛被免職

      3名廳官被查,他上周剛被免職

      魯中晨報(bào)
      2025-11-05 15:59:05
      澤連斯基為何再次親赴一線?俄羅斯“戰(zhàn)神”敲響警鐘

      澤連斯基為何再次親赴一線?俄羅斯“戰(zhàn)神”敲響警鐘

      史政先鋒
      2025-11-05 15:43:21
      價(jià)格大跳水!廣東富豪最愛的“雷車”不香了?網(wǎng)友:老廣買不動(dòng)了

      價(jià)格大跳水!廣東富豪最愛的“雷車”不香了?網(wǎng)友:老廣買不動(dòng)了

      品牌觀察官
      2025-11-04 21:42:02
      石家莊警方:男子因工作糾紛持刀扎傷兩名同事,已被當(dāng)場(chǎng)控制

      石家莊警方:男子因工作糾紛持刀扎傷兩名同事,已被當(dāng)場(chǎng)控制

      界面新聞
      2025-11-05 13:44:22
      讓全世界開開眼!中國航天員空間站里吃燒烤,國際空間站要饞哭了

      讓全世界開開眼!中國航天員空間站里吃燒烤,國際空間站要饞哭了

      魚缸里的假山
      2025-11-04 21:57:29
      美參議院通過決議終止特朗普關(guān)稅政策,但眾議院預(yù)計(jì)無法通過

      美參議院通過決議終止特朗普關(guān)稅政策,但眾議院預(yù)計(jì)無法通過

      合贊歷史
      2025-11-05 15:27:21
      臺(tái)風(fēng)“海鷗”已進(jìn)入南海!今起,廣西天氣大反轉(zhuǎn)

      臺(tái)風(fēng)“海鷗”已進(jìn)入南海!今起,廣西天氣大反轉(zhuǎn)

      魯中晨報(bào)
      2025-11-05 15:23:04
      畫面曝光!美國發(fā)生墜機(jī)事故,現(xiàn)場(chǎng)十分慘烈,疑與政府關(guān)門有關(guān)

      畫面曝光!美國發(fā)生墜機(jī)事故,現(xiàn)場(chǎng)十分慘烈,疑與政府關(guān)門有關(guān)

      派大星紀(jì)錄片
      2025-11-05 15:37:17
      邵佳一掌舵國足!媒體人熱議:別把人家害太慘了,難度非常非常大

      邵佳一掌舵國足!媒體人熱議:別把人家害太慘了,難度非常非常大

      奧拜爾
      2025-11-05 17:26:48
      中國有了自己的租房“大模型”

      中國有了自己的租房“大模型”

      華商韜略
      2025-11-05 10:24:49
      商務(wù)部副部長李成鋼會(huì)見美國農(nóng)產(chǎn)品貿(mào)易代表團(tuán)

      商務(wù)部副部長李成鋼會(huì)見美國農(nóng)產(chǎn)品貿(mào)易代表團(tuán)

      界面新聞
      2025-11-05 17:24:55
      2025-11-05 19:08:49
      機(jī)器之心Pro incentive-icons
      機(jī)器之心Pro
      專業(yè)的人工智能媒體
      11656文章數(shù) 142498關(guān)注度
      往期回顧 全部

      科技要聞

      大轉(zhuǎn)彎!特朗普再提名馬斯克盟友任NASA局長

      頭條要聞

      楊受成名下英皇宮殿停運(yùn) 曾以大堂鋪滿78公斤黃金聞名

      頭條要聞

      楊受成名下英皇宮殿停運(yùn) 曾以大堂鋪滿78公斤黃金聞名

      體育要聞

      贏下皇馬,會(huì)是利物浦的轉(zhuǎn)折點(diǎn)嗎?

      娛樂要聞

      港星林尚武突發(fā)心臟病去世

      財(cái)經(jīng)要聞

      中方官宣!對(duì)美關(guān)稅,調(diào)整!

      汽車要聞

      智己LS9入局"9系"混戰(zhàn) 全尺寸SUV市場(chǎng)迎來新變量

      態(tài)度原創(chuàng)

      旅游
      手機(jī)
      健康
      家居
      數(shù)碼

      旅游要聞

      出發(fā)!用舞蹈的方式打開云南旅行

      手機(jī)要聞

      天璣9500需求遠(yuǎn)超預(yù)期!持續(xù)領(lǐng)跑高端市場(chǎng):OPPO、vivo旗艦賣爆了

      超聲探頭會(huì)加重受傷情況嗎?

      家居要聞

      別樣府院 暢享詩意生活

      數(shù)碼要聞

      雷克沙 TouchLock 移動(dòng) SSD 上市:NFC + ASE 雙加密,1TB 899 元

      無障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 国内精品综合九九久久精品| 亚洲乱女色熟一区二区三区| 文成县| 伊人激情av一区二区三区| 亚洲色大成网站WWW久久| 二区中文字幕在线观看| 久热这里只有精品12| 亚洲人成影院在线观看| 免费无码一区二区三区蜜桃| ww污污污网站在线看com| 亚洲色偷偷色噜噜狠狠99| 国产午夜三级一区二区三| 中文字幕网红自拍偷拍视频| 国产成人啪精品午夜网站| 奇米四色7777中文字幕| 国产播放91色在线观看| 亚洲产国偷v产偷v自拍色戒| 办公室强奷漂亮少妇视频| 人妻aⅴ无码一区二区三区 | h无码精品3d动漫在线观看| 国产一级r片内射免费视频| 日韩有码中文字幕国产| 奉节县| 精品国产女同疯狂摩擦2| 精品人妻伦九区久久69| 亚洲国模精品一区二区| 国产-第1页-浮力影院| 久久妇女高潮喷水多| 国产黑色丝袜在线播放| 日韩av综合免费在线| 亚洲国产综合性亚洲综合性| 三上悠亚在线精品二区| 亚洲精品揄拍自拍首页一| 亚洲精品中文字幕尤物综合| 欧美亚洲色综久久精品国产| 国产成熟妇女性视频电影| 五大连池市| 久久人妻国产精品| 亚洲国产精品高清久久久| 免费无码高H视频在线观看| 亚洲成在人线在线播放无码|