<blockquote id="ue9b1"></blockquote>
    
    

    <style id="ue9b1"></style>
      <sub id="ue9b1"><p id="ue9b1"><form id="ue9b1"></form></p></sub>

      <strong id="ue9b1"><button id="ue9b1"><mark id="ue9b1"></mark></button></strong>
      成年午夜性影院,下面一进一出好爽视频,国产无遮挡又黄又爽又色,国产精品爽爽v在线观看无码,国产人妻久久精品一区二区三区,国产伦精品一区二区三区免费迷,国产欧美精品一区二区三区,日韩精品一区二区三区视频
      網易首頁 > 網易號 > 正文 申請入駐

      港科、牛津大學發布AlignGuard,文圖生成模型規?;踩珜R框架

      0
      分享至



      本文共一作者為劉潤濤和陳奕杰,香港科技大學計算機科學方向博士生,主要研究方向為多模態生成模型和偏好優化。

      1. 背景介紹

      隨著文圖生成模型的廣泛應用,模型本身有限的安全防護機制使得用戶有機會無意或故意生成有害的圖片內容,并且該內容有可能會被惡意使用。現有的安全措施主要依賴文本過濾或概念移除的策略,只能從文圖生成模型的生成能力中移除少數幾個概念。

      在 ICCV 2025,AlignGuard 推出了一個通過直接偏好優化訓練文圖生成模型,并以此實現安全對齊的訓練框架。通過生成有害和安全的圖像 - 文本對數據集 CoProV2,AlignGuard 使 DPO 技術能夠可規模化的應用于文圖生成模型的安全目的。AlignGuard 的安全對齊框架可以針對不同的有害概念引入各自的安全專家,會對于每個概念訓練低秩適應(LoRA)矩陣用以引導文圖模型減少生成特定的有害概念。





      • Paper: AlignGuard: Scalable Safety Alignment for Text-to-Image Generation
      • Paper Link: https://www.arxiv.org/abs/2412.10493
      • Github: https://github.com/Visualignment/SafetyDPO
      • Project page:https://alignguard.github.io/

      2. AlignGuard 安全對齊框架

      AlignGuard 這項工作的核心是提出一個面相擴散模型(Diffusion model)可規模化的安全對齊方法。通過生成針對安全內容的文圖數據集,AlignGuard 的訓練框架能在保有原本的生圖內容的同時去除圖片中的有害內容,并保持模型的高質量生圖品質。

      2.1 CoProv2 數據集構建

      AlignGuard 首先圍繞多種有害概念,構建了包含安全和不安全的圖像文本對數據集 CoProV2。CoProV2 針對不同的有害概念,用 LLM 生成了一系列具有相似語義的有害與安全提示詞對,并對每個提示詞生成了對應的圖片。



      相較于已有的人造數據集如 UD 和 I2P 缺少文本數據對應的圖片,CoProV2 是一個更具規模且能夠提供文本數據對應的圖片的數據集。并且 CoProV2 數據內容也保有了一定程度的有害內容(IP),適合用來應用在安全對齊方向的直接偏好優化。



      2.2 AlignGuard 的訓練架構設計

      針對 CoProV2 中不同安全類別,AlignGuard 利用直接偏好優化技術為各個安全類別訓練了各自的專家 LoRA 矩陣,包括 "仇恨"、"性"、"暴力" 等類別。在訓練過程中,每個專家專注于學習特定領域的安全特征,以確保高效的概念移除。最后,AlignGuard 不同專家 LoRA 矩陣會被合并成單一的 LoRA 矩陣,以構造一個能夠預防不同有害類別的提示詞的安全生圖模型。



      2.3 LoRA 專家合并策略

      為了將不同安全專家合并成單一模型,AlignGuard 會基于各個專家的信號強度進行權重分析,并以此為合并策略將多個 LoRA 專家整合為單一模型,以實現最優的計算與安全性能。AlignGuard 的專家合并策略考慮了不同安全類別之間的相互作用,以確保合并后的模型在所有安全維度上都能保持一致的性能。



      3. 實驗結果

      3.1 生成定量結果

      AlignGuard 在 CoProV2 危害概念移除任務中能夠成功移除比現有方法多 7 倍的有害概念,并且同時保持了圖像生成質量與文圖的對齊程度。在未見數據集 I2P 和 UD 上也領先于現有方法,表明 AlignGuard 的泛化能力在面對新的有害概念時仍能保持穩健的安全性能。



      3.2 生成定性結果

      相較于未被安全對齊的基線模型,AlignGuard 可以在包含有害詞語的提示詞上生成更為安全的圖片。AlignGuard 的安全對齊策略可以在不過度影響生圖內的前提下僅僅去除有害的元素。



      3.3 專家 LoRA 合并策略分析

      相較于為各個安全概念各自訓練一個專家模型并直接使用,AlignGuard 展示了合并不同專家模型可以更加有效得去除有害內容的生成。



      相較于其他如加權平均的 LoRA 矩陣合并策略,AlignGuard 的信號權重合并策略能夠在有效降低生成有害內容的同時,保存模型的圖像品質與圖文對齊度。AlignGuard 的合并策略能夠有效平衡不同安全專家之間的權重,避免專家間的沖突并最大化整體安全性能。



      4. 總結

      文本到圖像生成模型在缺乏有效安全措施的情況下,存在被用戶濫用風險。AlignGuard 提出了一種基于直接偏好優化(DPO)的安全對齊方法。AlignGuard 安全對齊框架的創新在于:1. 將直接偏好優化技術規?;膽糜谖纳鷪D模型的安全領域;2. 采用專家系統架構,針對不同有害圖像類別訓練專門的 LoRA 矩陣,然后通過模型的信號強度構造權重并整合為單一 LoRA,以此提升計算效率;3. 生成了成對的有害與無害的圖文數據集 CoProV2,用以進行直接偏好優化訓練。 AlignGuard 這種方法能夠在保持模型生成質量的同時,移除比基準方法多 7 倍的有害概念。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      茍如虎任上海楊浦區副區長

      茍如虎任上海楊浦區副區長

      澎湃新聞
      2025-11-05 21:22:27
      北極航道剛冰封,波蘭故技重施中歐班列又停,再不開邊境悔之晚矣

      北極航道剛冰封,波蘭故技重施中歐班列又停,再不開邊境悔之晚矣

      一只番茄魚
      2025-11-05 13:34:23
      巴媒:因陷財務危機,科林蒂安要求德佩搬離月租4萬歐的套房

      巴媒:因陷財務危機,科林蒂安要求德佩搬離月租4萬歐的套房

      懂球帝
      2025-11-06 01:30:10
      女子陪男友買陪嫁車,試駕時銷售悄聲提醒:上周他帶孕婦來看過車

      女子陪男友買陪嫁車,試駕時銷售悄聲提醒:上周他帶孕婦來看過車

      曉艾故事匯
      2025-11-03 17:09:06
      新中國的36位軍事家,賀老總位居第七,排在他前面的六人是誰?

      新中國的36位軍事家,賀老總位居第七,排在他前面的六人是誰?

      南書房
      2025-11-05 16:55:03
      女面試官:“我肚子疼,能幫我接杯熱水嗎?”男子一句話,當場被錄用!

      女面試官:“我肚子疼,能幫我接杯熱水嗎?”男子一句話,當場被錄用!

      上海約飯局
      2025-11-05 21:57:07
      利潤暴降45%,“非洲手機之王”為何突然不“香”了?

      利潤暴降45%,“非洲手機之王”為何突然不“香”了?

      鳳凰網財經
      2025-11-05 09:42:39
      郭碧婷父親否認治療癌癥花費高額醫藥費:有健保,我加入免疫試藥組,每次試藥抽血都給1000營養費

      郭碧婷父親否認治療癌癥花費高額醫藥費:有健保,我加入免疫試藥組,每次試藥抽血都給1000營養費

      極目新聞
      2025-11-05 15:26:58
      你無意中看見哪些不可見人的事?網友:成年人的世界都這么污嗎

      你無意中看見哪些不可見人的事?網友:成年人的世界都這么污嗎

      帶你感受人間冷暖
      2025-11-04 00:15:08
      曝阿莫林與安德森通道交談,其明夏愿去曼聯!冬窗9000萬豪購沒戲

      曝阿莫林與安德森通道交談,其明夏愿去曼聯!冬窗9000萬豪購沒戲

      羅米的曼聯博客
      2025-11-05 07:08:45
      美國稱:中國不可怕,可怕的是,中國淘汰4000年的東西他們還在用

      美國稱:中國不可怕,可怕的是,中國淘汰4000年的東西他們還在用

      南宮一二
      2025-11-04 16:14:07
      印媒指出福建艦嚴重設計缺陷! 這回沒瞎說: 福建艦確實存在這問題

      印媒指出福建艦嚴重設計缺陷! 這回沒瞎說: 福建艦確實存在這問題

      福建平子
      2025-11-03 10:21:52
      突然!馬斯克,重大宣布!

      突然!馬斯克,重大宣布!

      新浪財經
      2025-11-05 22:59:08
      心梗去世的人飆升!醫生含淚苦勸:無論多大年紀,天冷堅守4原則

      心梗去世的人飆升!醫生含淚苦勸:無論多大年紀,天冷堅守4原則

      劉輝讀書
      2025-11-04 15:52:46
      停擺第36天,終釀成大禍!實在熬不住,美四大航司集體倒向共和黨

      停擺第36天,終釀成大禍!實在熬不住,美四大航司集體倒向共和黨

      南宗歷史
      2025-11-05 17:08:21
      要價5000萬!曝曼聯相中巴薩棄將 拉什福德無緣回歸

      要價5000萬!曝曼聯相中巴薩棄將 拉什福德無緣回歸

      球事百科吖
      2025-11-05 01:39:04
      跟一位日本比亞迪車主聊了聊,才明白我們對「出?!褂卸嗵煺?>
    </a>
        <h3>
      <a href=極客公園
      2025-11-04 12:54:39
      2-1、2-0!WTA總決賽一夜亂了:薩巴倫卡欲哭無淚,2連勝或出局

      2-1、2-0!WTA總決賽一夜亂了:薩巴倫卡欲哭無淚,2連勝或出局

      大秦壁虎白話體育
      2025-11-05 10:06:02
      臺灣國民黨鄭麗文:兩岸若開戰,大陸會被拖垮一半,起碼要慢30年

      臺灣國民黨鄭麗文:兩岸若開戰,大陸會被拖垮一半,起碼要慢30年

      文史旺旺旺
      2025-07-10 20:57:08
      41歲白百何罕見露面,她的下胯變得好大呀,臉也胖了,像個大媽

      41歲白百何罕見露面,她的下胯變得好大呀,臉也胖了,像個大媽

      廣西阿妹香香
      2025-10-29 16:09:46
      2025-11-06 02:40:49
      機器之心Pro incentive-icons
      機器之心Pro
      專業的人工智能媒體
      11656文章數 142498關注度
      往期回顧 全部

      科技要聞

      大轉彎!特朗普再提名馬斯克盟友任NASA局長

      頭條要聞

      俄士兵連遭烏軍7架無人機襲擊奇跡生還 視頻披露

      頭條要聞

      俄士兵連遭烏軍7架無人機襲擊奇跡生還 視頻披露

      體育要聞

      贏下皇馬,會是利物浦的轉折點嗎?

      娛樂要聞

      港星林尚武突發心臟病去世

      財經要聞

      事關加快建設金融強國 中央金融辦發聲

      汽車要聞

      智己LS9入局"9系"混戰 全尺寸SUV市場迎來新變量

      態度原創

      本地
      房產
      健康
      藝術
      軍事航空

      本地新聞

      這屆干飯人,已經把博物館吃成了食堂

      房產要聞

      最新!海南樓市10月熱銷榜單出爐!

      超聲探頭會加重受傷情況嗎?

      藝術要聞

      一眼攝魂的魔術手:泰國畫師 Razaras 的作品唯美圣潔!自帶發光特效!

      軍事要聞

      美國“福特”號航母駛往加勒比海

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 男人猛躁进女人免费播放| 九九热在线精品视频99| 国内精品一区二区不卡| 在线A级毛片无码免费真人| 国产精品人妻一码二码尿失禁| 亚洲成在人线在线播放无码| 亚洲国产女性内射第一区| 日本一区二区三区四区黄色| 亚洲欧洲av一区二区久久| 人妻少妇精品久久| 精品无码av无码免费专区| 欧洲无码一区二区三区在线观看| 97亚洲熟妇自偷自拍另类图片| 亚洲精品中文字幕在线观| 蜜芽亚洲AV无码精品国产午夜 | 99久久精品国产一区二区蜜芽 | 人妻少妇精品系列一区二区| 亚洲国产美女精品久久久| 亚洲一区二区三成人精品| 亚洲精品777| 少妇人妻av无码专区| 99精品国产兔费观看久久99 | 日韩高清砖码一二区在线| 在线高清免费不卡全码| 欧美日韩中文国产一区| 亚洲V天堂V手机在线 | 亚洲熟妇熟女久久精品综合 | 影音先锋人妻啪啪av资源网站| 亚洲av午夜福利精品一区二区| 亚洲综合一区国产精品| 亚洲码国产精品高潮在线| 欧美成人无码a区视频在线观看 | a毛片免费在线观看| 亚洲日本欧洲二区精品 | 青草99在线免费观看| 日本一区二区三区18岁| 另类图片亚洲人妻中文无码| 亚洲免费观看视频| 欧美日韩国产综合草草| 亚洲综合av男人的天堂| 国产一卡2卡3卡4卡网站精品|