<blockquote id="ue9b1"></blockquote>
    
    

    <style id="ue9b1"></style>
      <sub id="ue9b1"><p id="ue9b1"><form id="ue9b1"></form></p></sub>

      <strong id="ue9b1"><button id="ue9b1"><mark id="ue9b1"></mark></button></strong>
      成年午夜性影院,下面一进一出好爽视频,国产无遮挡又黄又爽又色,国产精品爽爽v在线观看无码,国产人妻久久精品一区二区三区,国产伦精品一区二区三区免费迷,国产欧美精品一区二区三区,日韩精品一区二区三区视频
      網易首頁 > 網易號 > 正文 申請入駐

      比NanoBanana更擅長中文和細節控制!兔展&北大新模型刷新SOTA

      0
      分享至

      允中 發自 凹非寺
      量子位 | 公眾號 QbitAI

      比Nano Banana更擅長P細節的圖像編輯模型來了,還是更懂中文的那種。

      就像這樣,要求AI“把中間白色衣服戴口罩女生的手勢改成OK”,原圖如下:



      這個名為UniWorld-V2的模型能做到完美修改。



      而Nano Banana則未能成功get到提示詞的意圖。



      模型背后,是兔展智能&北京大學的UniWorld團隊的最新技術成果:

      他們提出了一種名為UniWorld-R1的創新型圖像編輯后期訓練框架,該框架首次將強化學習(RL)策略優化應用于統一架構的圖像編輯模型,是第一個視覺強化學習框架。基于此,他們推出了新一代模型UniWorld-V2。

      UniWorld-V2在GEdit-Bench和ImgEdit等行業權威基準測試中取得了SOTA成績,在綜合表現上超越了如OpenAI的GPT-Image-1等頂尖閉源模型。



      一起來看詳細技術報告。

      強大的中文字體掌握與精細化可控

      功能上,UniWorld-V2在實際應用中展現了SFT模型難以企及的精細化控制力。

      中文字體掌握

      在論文的“海報編輯”示例中,模型能精準理解指令,并渲染出“月滿中秋”和“月圓人圓事事圓”等筆畫復雜的藝術中文字體,效果清晰、語義準確。



      能做到想改啥字改啥字,只需一句Prompt。



      精細化空間可控

      在“紅框控制”任務中,用戶可以通過畫框(如紅色矩形框)來指定編輯區域,模型能夠嚴格遵守該空間限制,實現“將鳥移出紅框”等高難度精細操作。



      全局光影融合

      模型能深刻理解“給場景重新打光”等指令,使物體自然融入場景之中,讓畫面變得更統一和諧,并且光影融合度極高。



      核心創新:UniWorld-R1框架

      實現以上功能,研究團隊的核心創新是提出了UniWorld-R1框架。

      傳統的圖像編輯模型依賴監督微調(SFT),普遍存在對訓練數據過擬合、泛化能力差的問題。此外,還存在面對編輯指令和任務的多樣性,缺乏通用獎勵模型的瓶頸。

      UniWorld-R1框架的核心優勢在于:

      首個基于強化學習的統一架構:UniWorld-R1是業內首個基于策略優化(RL)的圖像編輯后期訓練框架。它采用了Diffusion Negative-aware Finetuning (擴散負向感知微調,DiffusionNFT)技術,這是一種無需似然估計的策略優化方法,訓練更高效,并且允許使用高階采樣器。

      MLLM作為免訓練獎勵模型:針對編輯任務多樣性導致缺乏通用獎勵模型的挑戰,UniWorld-R1開創性地使用多模態大語言模型(MLLM,如GPT-4V)作為統一的、免訓練的獎勵模型。通過利用MLLM的輸出logits(而非單一評分)來提供精細化的隱式反饋,極大地提升了模型對人類意圖的對齊能力。

      如下圖所示,UniWorld-R1的pipeline主要包括三個部分:采樣、MLLM評分和DiffusionNFT,這三個部分逐步將模型與最優策略對齊。



      全面超越SOTA,分數領跑

      實驗方面,研究團隊整理了一個包含27572個基于指令的編輯樣本的數據集。



      這些樣本來自LAION、LexArt和UniWorldV1。為了增強任務多樣性,加入了額外的文本編輯和紅框控制任務,共形成九種不同的任務類型。

      研究團隊訓練FLUX.1-Kontext [Dev]、Qwen-Image-Edit [2509]和UniWorld-V2作為基礎模型,并采用ImgEdit和GEdit-Bench作為測試基準。前者將多種專門任務統一為一個通用框架以進行全面模型比較,后者通過豐富的自然語言指令評估通用圖像編輯。

      在GEdit-Bench基準測試中,UniWorld-V2(基于UniWorld-R1訓練)獲得了7.83的驚人高分,顯著優于GPT-Image-1 [High](7.53分)和Gemini 2.0(6.32分)。在ImgEdit基準上,UniWorld-V2同樣以4.49分領跑,超越了所有已知的開源和閉源模型。

      更重要的是,UniWorld-R1框架具有極強的通用性。當該框架被應用于Qwen-Image-Edit和FLUX-Kontext等其他基礎模型時,同樣帶來了顯著的性能提升,充分證明了其作為通用后期訓練框架的巨大價值。



      該方法顯著增強了所有基礎模型在ImgEdit基準上的表現。對于FLUX.1-Kontext [Dev],整體分數顯著提高,從3.71上升到4.02,超過了較強的Pro版本(4.00)。同樣,在應用于Qwen-Image-Edit [2509]時,該方法將其分數從4.35提升到4.48,實現了開源模型中的最先進性能,并超越了頂級閉源模型如GPT-Image-1。

      除了總得分的提升之外,UniWorld-FLUX.1-Kontext在“調整”、“提取”和“移除”維度上表現出顯著的性能提升,而 UniWorld-Qwen-Image-Edit則在“提取”和“混合”維度上表現優異。此外,UniWorld-V2達到了最佳性能。這一現象表明,該方法能夠解鎖和顯著提高基礎模型中之前未開發的潛力。



      在域外GEdit-Bench上,UniWorld-R1為三種模型展示了強大的泛化性能。它使FLUX.1-Kontext [Dev] 模型的總分從6.00提升到6.74,表現超越了Pro版本(6.56)。對于Qwen-Image模型,其得分從7.54增加到7.76。同時,UniWorld-V2在這一基準測試中建立了新的最先進水平,超越了所有列出的模型,包括Qwen-Image-Edit(7.56)和GPT-Image-1(7.53)。這一結果確認該方法有效地保留和增強了在未見數據分布上的核心編輯能力,展示了強大的泛化能力。

      為了全面評估,研究人員還對FLUX.1和Qwen系列進行了人工偏好研究,參與者將本文的微調模型與其基礎模型和更強大的版本進行比較。他們被要求在兩個維度上選擇最佳結果:指令對齊和圖像質量。

      用戶在所有標準中更傾向于選擇UniWorld-FLUX.1-Kontext而不是FLUX.1-Kontext [Dev]。此外,它在編輯能力上表現出較強的優勢,尤其是在與更強大的官方版本FLUX.1-Kontext [Pro]的比較中。總體而言,UniWorld-FLUX.1-Kontext因其優越的指令遵循能力而獲得更多的喜歡,盡管官方模型在圖像質量上稍微勝出。這證實了該方法能夠有效地引導模型生成更符合人類偏好的輸出。



      此次發布的UniWorld-V2,是基于團隊早先的UniWorld-V1構建的。UniWorld-V1作為業內首個統一理解與生成的模型,其開源時間領先于谷歌Nano Banana等后續知名模型長達三個月,為多模態領域的統一架構探索奠定了重要基礎。

      另外,UniWorld-R1的論文、代碼和模型均已在GitHub和Hugging Face平臺公開發布,以支持后續研究。

      論文地址:
      https://arxiv.org/abs/2510.16888

      GitHub鏈接:
      https://github.com/PKU-YuanGroup/UniWorld

      — 完 —

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      這一次,英達終于反擊高調宣布喜訊,眾多明星前來捧場掙足了面子

      這一次,英達終于反擊高調宣布喜訊,眾多明星前來捧場掙足了面子

      以茶帶書
      2025-11-04 14:13:20
      趙露思送出5000演唱會門票,堪稱“活菩薩”

      趙露思送出5000演唱會門票,堪稱“活菩薩”

      仙味少女心
      2025-11-04 16:49:59
      商務部新聞發言人就調整出口管制管控名單措施答記者問

      商務部新聞發言人就調整出口管制管控名單措施答記者問

      界面新聞
      2025-11-05 17:01:53
      美國民主黨人馬姆達尼得票率50.3%當選紐約市長,世界金融中心迎來新掌舵!共和黨候選人柯蒂斯·斯利瓦獲得7.2%的選票

      美國民主黨人馬姆達尼得票率50.3%當選紐約市長,世界金融中心迎來新掌舵!共和黨候選人柯蒂斯·斯利瓦獲得7.2%的選票

      和訊網
      2025-11-05 12:42:07
      看了郭汝瑰蔣緯國回憶錄才知:三大潛伏中將,為何唯獨吳石暴露

      看了郭汝瑰蔣緯國回憶錄才知:三大潛伏中將,為何唯獨吳石暴露

      宅家伍菇涼
      2025-11-04 16:03:06
      女孩稱洗澡時被父親偷看,相關部門:系口角矛盾產生誤會,父親回應:只是遞牙刷,無不妥舉動

      女孩稱洗澡時被父親偷看,相關部門:系口角矛盾產生誤會,父親回應:只是遞牙刷,無不妥舉動

      極目新聞
      2025-11-04 19:30:08
      突發!這個板塊,大面積漲停!重磅消息傳來!

      突發!這個板塊,大面積漲停!重磅消息傳來!

      證券時報
      2025-11-05 16:10:45
      449平方米,1.17億元!馬來西亞首富之子郭孔華,買下上海大平層,該樓盤曾3小時售出158套房

      449平方米,1.17億元!馬來西亞首富之子郭孔華,買下上海大平層,該樓盤曾3小時售出158套房

      每日經濟新聞
      2025-11-02 23:32:08
      物業半夜打電話叫我挪車,我:買的車位挪什么車!隔天警察找上門

      物業半夜打電話叫我挪車,我:買的車位挪什么車!隔天警察找上門

      百曉史
      2025-11-05 16:32:54
      千億巨頭官宣:裁員!

      千億巨頭官宣:裁員!

      中國基金報
      2025-11-05 19:40:02
      定了!武漢將試點

      定了!武漢將試點

      極目新聞
      2025-11-04 21:03:09
      91年出生,紐約新市長馬姆達尼何許人也?

      91年出生,紐約新市長馬姆達尼何許人也?

      風陽生
      2025-11-05 10:50:09
      歐冠封神之戰!22歲小將鎖死皇馬巨星:6萬人鼓掌 官方MVP

      歐冠封神之戰!22歲小將鎖死皇馬巨星:6萬人鼓掌 官方MVP

      葉青足球世界
      2025-11-05 09:02:58
      張文宏院士:糖尿病可以吃的食物排名,不知道的糖友太虧了

      張文宏院士:糖尿病可以吃的食物排名,不知道的糖友太虧了

      荷蘭豆愛健康
      2025-11-02 07:55:38
      64歲的劉德華終于開始大大方方的公開自己和老婆朱麗倩的照片

      64歲的劉德華終于開始大大方方的公開自己和老婆朱麗倩的照片

      鄉野小珥
      2025-10-27 11:08:35
      納指狂瀉!川普兒子做空震驚市場,還有大空頭10億美金做空

      納指狂瀉!川普兒子做空震驚市場,還有大空頭10億美金做空

      金石隨筆
      2025-11-05 09:07:59
      迷你羅助葡萄牙U16奪冠,喬治娜和C羅母親現場見證

      迷你羅助葡萄牙U16奪冠,喬治娜和C羅母親現場見證

      懂球帝
      2025-11-05 03:05:14
      曝足協上報3名洋帥!總局否決+拍板邵佳一 盼1年半打造國足郭士強

      曝足協上報3名洋帥!總局否決+拍板邵佳一 盼1年半打造國足郭士強

      我愛英超
      2025-11-05 18:00:52
      不用“翻墻”VPN!時隔11年KakaoTalk突解封?

      不用“翻墻”VPN!時隔11年KakaoTalk突解封?

      湊近看世界
      2025-11-05 11:01:58
      恭喜!全紅嬋新搭檔奪第二金:22歲破繭成蝶,擊敗陳芋汐新搭檔

      恭喜!全紅嬋新搭檔奪第二金:22歲破繭成蝶,擊敗陳芋汐新搭檔

      李喜林籃球絕殺
      2025-11-04 23:03:26
      2025-11-05 20:12:49
      量子位 incentive-icons
      量子位
      追蹤人工智能動態
      11633文章數 176326關注度
      往期回顧 全部

      科技要聞

      大轉彎!特朗普再提名馬斯克盟友任NASA局長

      頭條要聞

      國足換帥 邵佳一曾被贊是在德國踢球最成功的中國球員

      頭條要聞

      國足換帥 邵佳一曾被贊是在德國踢球最成功的中國球員

      體育要聞

      贏下皇馬,會是利物浦的轉折點嗎?

      娛樂要聞

      港星林尚武突發心臟病去世

      財經要聞

      中方官宣!對美關稅,調整!

      汽車要聞

      智己LS9入局"9系"混戰 全尺寸SUV市場迎來新變量

      態度原創

      游戲
      房產
      親子
      旅游
      公開課

      《GTA6》或將迎來重磅角色!前作諸葛亮級大佬回歸

      房產要聞

      最新!海南樓市10月熱銷榜單出爐!

      親子要聞

      泰國媳婦第一次吃番薯烤的薯片,一口下去眼都亮了

      旅游要聞

      組圖丨泰山秋景隱藏款!彩石溪更新絢麗“皮膚”

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 欧美日韩v| 深夜av免费在线观看| 国产老肥熟一区二区三区| 性做久久久久久久久| 97精品人妻系列无码人妻| 亚洲精品喷潮一区二区三区 | 国产精品色呦呦在线观看| 中国女人高潮hd| 国产精品无码a∨麻豆| 亚洲精品久久久久国色天香| 最近2019免费中文字幕8| 老司机亚洲精品一区二区 | 国产丝袜肉丝视频在线| 无码熟妇αⅴ人妻又粗又大| 九九久久人妻精品一区色| 亚洲成人av综合一区| 精品中文人妻中文字幕| 最新精品露脸国产在线| 亚洲婷婷六月的婷婷| 久久夜色噜噜噜亚洲av| 国产免费高清69式视频在线观看| 欧美精欧美乱码一二三四区| 浦县| 国产一国产精品免费播放| 亚洲精品一区二区麻豆| 久久精品国产国产精品四凭| 无码av人片在线观看天堂| 四虎成人精品无码| 国产亚洲综合另类色专区| 成人午夜激情在线观看| 巨爆乳中文字幕爆乳区| 中文字幕无码免费不卡视频 | 97se亚洲国产综合自在线观看 | 久久亚洲av成人一二三区| 久久亚洲精品11p| AV最新高清无码专区| 国产精品视频午夜福利| 久久亚洲人成网站| 亚洲综合色一区二区三区| 午夜通通国产精品福利| 亚洲国产精品久久久天堂麻豆宅男|