<blockquote id="ue9b1"></blockquote>
    
    

    <style id="ue9b1"></style>
      <sub id="ue9b1"><p id="ue9b1"><form id="ue9b1"></form></p></sub>

      <strong id="ue9b1"><button id="ue9b1"><mark id="ue9b1"></mark></button></strong>
      成年午夜性影院,下面一进一出好爽视频,国产无遮挡又黄又爽又色,国产精品爽爽v在线观看无码,国产人妻久久精品一区二区三区,国产伦精品一区二区三区免费迷,国产欧美精品一区二区三区,日韩精品一区二区三区视频
      網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

      VaseVQA:考古領(lǐng)域?qū)崿F(xiàn)專家級(jí),診斷+補(bǔ)弱RL框架

      0
      分享至


      新智元報(bào)道

      編輯:LRST

      【新智元導(dǎo)讀】在文化遺產(chǎn)與人工智能的交叉處,有一類問題既美也難:如何讓機(jī)器「看懂」古希臘的陶器——不僅能識(shí)別它的形狀或圖案,還能推斷年代、產(chǎn)地、工坊甚至藝術(shù)歸屬?有研究人員給出了一條實(shí)用且富有啟發(fā)性的答案:把大型多模態(tài)模型(MLLM)放在「診斷—補(bǔ)弱—精細(xì)化評(píng)估」的閉環(huán)中訓(xùn)練,并配套一個(gè)結(jié)構(gòu)化的評(píng)測基準(zhǔn),從而讓模型在高度專業(yè)化的文化遺產(chǎn)領(lǐng)域表現(xiàn)得更接近專家級(jí)能力。

      古希臘陶器是考古學(xué)和藝術(shù)史的重要實(shí)物證據(jù)。

      研究者需要從單件陶器中提取多層信息:材質(zhì)與工藝、形制類別、裝飾主題、出土地與時(shí)間、甚至可能的作坊或畫師。

      不過傳統(tǒng)計(jì)算機(jī)視覺和通用多模態(tài)模型在這類高度專業(yè)化任務(wù)上常陷入兩類困境:

      一是缺乏領(lǐng)域知識(shí)(模型在通用語料里幾乎沒接觸過「雅典黑釉杯」或「紅繪風(fēng)格」這樣的概念);

      二是僅靠監(jiān)督微調(diào)(SFT)容易學(xué)到「表層捷徑」,在遇到組合性、推理性或少樣本問題時(shí)就失效。

      基于此,AI Geeks、澳大利亞人工智能研究所等機(jī)構(gòu)的研究人員提出:既要有專門的數(shù)據(jù)與任務(wù)劃分,也要有針對(duì)性的訓(xùn)練策略來補(bǔ)弱提升。


      論文鏈接: https://doi.org/10.48550/arXiv.2509.17191

      項(xiàng)目地址:https://github.com/AIGeeksGroup/VaseVQA

      論文的技術(shù)主線可以用一句話概括:先把模型訓(xùn)練到有基礎(chǔ)能力(SFT),再通過診斷找出各類問題的薄弱環(huán)節(jié),用類型條件化的強(qiáng)化學(xué)習(xí)(RL)和精細(xì)化獎(jiǎng)勵(lì)去有針對(duì)性地補(bǔ)弱。

      圖1:現(xiàn)有視覺語言模型在古希臘陶瓶理解上的局限性與所提出的VaseVL框架

      關(guān)鍵步驟如下:

      • 任務(wù)分層與問題類型化:作者把陶器理解任務(wù)劃分為若干類(例如材質(zhì)、工藝、形制、產(chǎn)地/歸屬、年代、裝飾描述等),為后續(xù)診斷與差異化訓(xùn)練提供維度。

      • 診斷評(píng)估:對(duì)SFT后的模型在每一類問題上分別評(píng)測,識(shí)別哪些類型表現(xiàn)弱(例如歸屬推理與裝飾描述通常比簡單事實(shí)類問題更難)。

      • 類型條件化強(qiáng)化學(xué)習(xí):針對(duì)弱項(xiàng)設(shè)計(jì)加權(quán)獎(jiǎng)勵(lì),獎(jiǎng)勵(lì)由「關(guān)鍵詞命中率 + 語義相似度」組成;同時(shí)采用帶KL正則的策略更新手段避免模型過度偏離原有SFT行為。作者還引入一種穩(wěn)定化的策略優(yōu)化方法(論文提出的變體)來保證訓(xùn)練穩(wěn)定。

      • 按類型細(xì)化評(píng)估指標(biāo):不同問題類型采用更合適的評(píng)價(jià)方式(比如對(duì)描述類用生成質(zhì)量指標(biāo),對(duì)事實(shí)類用字符/關(guān)鍵詞相似度),避免單一指標(biāo)一刀切。


      圖2:VaseVL的整體框架。該方法將有監(jiān)督微調(diào)(SFT)與基于組相對(duì)策略優(yōu)化(GRPO)的強(qiáng)化學(xué)習(xí)相結(jié)合。給定陶瓶圖像x、問題q 和參考答案a^*,模型通過在詞匯獎(jiǎng)勵(lì)與語義獎(jiǎng)勵(lì)之間取得平衡,并限制策略偏離參考策略 ,從而提升其推理能力。

      數(shù)據(jù)與基準(zhǔn)(VaseVQA)

      讓評(píng)測更具信服力

      為了能系統(tǒng)評(píng)估上述方法,研究人員同時(shí)構(gòu)建了一個(gè)面向古希臘陶器的多模態(tài)問答基準(zhǔn)(VaseVQA)。

      該基準(zhǔn)覆蓋大量陶器圖片與多類型問答對(duì),且在標(biāo)注上引入專家審校,力求兼顧規(guī)模與專業(yè)性。更重要的是,基準(zhǔn)把任務(wù)按問題類型拆分,使得模型的薄弱處能被明確定位并針對(duì)性優(yōu)化。


      表1:VaseVQA基準(zhǔn)測試上的性能比較。RL代表推理注入。

      關(guān)鍵發(fā)現(xiàn)與實(shí)證價(jià)值

      論文的實(shí)驗(yàn)顯示:

      僅做SFT能顯著提升模型的基礎(chǔ)識(shí)別能力,但在歸屬推理和復(fù)雜描述上仍有限;

      在診斷基礎(chǔ)上做類型條件化RL優(yōu)化后,模型在那些先前薄弱的類型上有可觀提升——這說明「補(bǔ)弱導(dǎo)向」的訓(xùn)練策略在專業(yè)垂直任務(wù)上很有效;

      細(xì)粒度的評(píng)價(jià)(按問題類型)對(duì)于判斷模型真實(shí)能力與設(shè)計(jì)針對(duì)性改進(jìn)尤為重要。


      表2:消融實(shí)驗(yàn)結(jié)果說明。RI表示Reasoning Injection(推理注入)Qwen2.5-VL-SFT表示前述模型經(jīng)過有監(jiān)督微調(diào)(SFT)的版本,而最后一行展示的是提出的VaseVL 模型的性能表現(xiàn)。

      意義、局限與可推廣方向

      這項(xiàng)工作最有價(jià)值的,不只是把一個(gè)模型調(diào)好,而是提出了一套「如何讓通用多模態(tài)模型在高度專業(yè)領(lǐng)域變得可靠」的方法論:任務(wù)分層 → 定位薄弱 → 有針對(duì)性地微調(diào)與評(píng)估。

      它對(duì)文化遺產(chǎn)、醫(yī)學(xué)影像、材料科學(xué)等其他垂直領(lǐng)域都有啟發(fā)意義。

      但需謹(jǐn)慎的一點(diǎn)是:強(qiáng)化學(xué)習(xí)階段高度依賴獎(jiǎng)勵(lì)設(shè)計(jì),若獎(jiǎng)勵(lì)不當(dāng)或數(shù)據(jù)偏倚,模型可能學(xué)習(xí)到新的偏差。

      此外,許多考古歸屬問題本身具有主觀性與學(xué)術(shù)爭議,模型輸出仍需專家把關(guān)作為輔助工具而非最終裁決。

      VaseVQA展示了把「領(lǐng)域診斷」嵌入多模態(tài)訓(xùn)練流程的可行路徑。

      文化遺產(chǎn)與AI的結(jié)合,不應(yīng)僅止于表層識(shí)別,而應(yīng)追求「可解釋、可校驗(yàn)、有專家協(xié)同」的工具化落地。

      未來,當(dāng)這類方法被更廣泛采納,不同學(xué)科的專家與工程師協(xié)作,就能把AI打造成真正有助于保護(hù)與理解人類文化記憶的可靠伙伴。

      參考資料:

      https://doi.org/10.48550/arXiv.2509.17191

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      弘一法師:人生粗茶淡飯不要緊,朋友散場沒關(guān)系

      弘一法師:人生粗茶淡飯不要緊,朋友散場沒關(guān)系

      杏花煙雨江南的碧園
      2025-11-06 10:05:03
      曝妻兒3人被發(fā)小殺害真相,飯桌聊黃金遭惦記,百日祭現(xiàn)反常一幕

      曝妻兒3人被發(fā)小殺害真相,飯桌聊黃金遭惦記,百日祭現(xiàn)反常一幕

      壹月情感
      2025-11-05 21:24:33
      為什么說“烏粉”往往值得深交?

      為什么說“烏粉”往往值得深交?

      史政先鋒
      2025-11-06 13:02:01
      李云迪再陷桃色風(fēng)波,女主照片被扒疑似有兩人視頻流出

      李云迪再陷桃色風(fēng)波,女主照片被扒疑似有兩人視頻流出

      挪威森林
      2025-11-02 12:56:16
      小鵬機(jī)器人走貓步被疑 “真人假扮”,何小鵬回應(yīng):感謝認(rèn)可。

      小鵬機(jī)器人走貓步被疑 “真人假扮”,何小鵬回應(yīng):感謝認(rèn)可。

      小南看車
      2025-11-06 10:27:46
      賣掉油車換電車,第一次上高速1100km,終于知道網(wǎng)上說的都是真的

      賣掉油車換電車,第一次上高速1100km,終于知道網(wǎng)上說的都是真的

      小李子體育
      2025-10-22 12:52:50
      國民黨主席位置坐穩(wěn),鄭麗文攤牌了:兩岸不回歸和平,其他是侈談

      國民黨主席位置坐穩(wěn),鄭麗文攤牌了:兩岸不回歸和平,其他是侈談

      原來仙女不講理
      2025-11-06 12:00:28
      羅氏蝦、基圍蝦都是“激素”泡大的?其實(shí)這3種蝦才是“問題蝦”

      羅氏蝦、基圍蝦都是“激素”泡大的?其實(shí)這3種蝦才是“問題蝦”

      健身狂人
      2025-11-02 07:59:00
      課本為何沒有田忌賽馬后續(xù)?愚蠢的勝利,讓他幾年后付出慘痛代價(jià)

      課本為何沒有田忌賽馬后續(xù)?愚蠢的勝利,讓他幾年后付出慘痛代價(jià)

      黃麗搞笑小能手
      2025-10-29 11:24:08
      中方沉默4天后發(fā)聲:特朗普警告,若對(duì)委內(nèi)瑞拉動(dòng)手,美國后果堪憂

      中方沉默4天后發(fā)聲:特朗普警告,若對(duì)委內(nèi)瑞拉動(dòng)手,美國后果堪憂

      今日美食分享
      2025-11-06 10:52:05
      黃仁勛“最直白表態(tài)”:中國這么做,將贏了美國

      黃仁勛“最直白表態(tài)”:中國這么做,將贏了美國

      觀察者網(wǎng)
      2025-11-06 08:23:17
      37歲景甜在安徽小鎮(zhèn)被偶遇,她打扮樸素,皮膚白皙 嬌俏可愛,好美

      37歲景甜在安徽小鎮(zhèn)被偶遇,她打扮樸素,皮膚白皙 嬌俏可愛,好美

      草莓解說體育
      2025-11-05 09:38:12
      凈利潤暴跌超70%!安徽前首富的百億夢碎,網(wǎng)友:老字號(hào)嗑不動(dòng)了

      凈利潤暴跌超70%!安徽前首富的百億夢碎,網(wǎng)友:老字號(hào)嗑不動(dòng)了

      品牌觀察官
      2025-11-05 19:33:12
      2100億,上海拆遷下一個(gè)目標(biāo),盯上城中村

      2100億,上海拆遷下一個(gè)目標(biāo),盯上城中村

      石辰搞笑日常
      2025-11-06 07:50:57
      被傳分手7個(gè)月,鹿晗演唱會(huì)后高調(diào)官宣,真相原來早有預(yù)兆

      被傳分手7個(gè)月,鹿晗演唱會(huì)后高調(diào)官宣,真相原來早有預(yù)兆

      麥芽是個(gè)小趴菜
      2025-11-06 08:26:56
      特斯拉一位大股東站出來了:給馬斯克1萬億美元薪酬,我們不同意

      特斯拉一位大股東站出來了:給馬斯克1萬億美元薪酬,我們不同意

      藍(lán)色海邊
      2025-11-05 14:34:20
      俄副外長:目前不具備組織俄美元首會(huì)晤的條件!澤連斯基喊話歐爾班:別阻撓烏克蘭“入歐”

      俄副外長:目前不具備組織俄美元首會(huì)晤的條件!澤連斯基喊話歐爾班:別阻撓烏克蘭“入歐”

      每日經(jīng)濟(jì)新聞
      2025-11-05 20:28:10
      被謝賢養(yǎng)了12年,用青春換來2000萬的Coco,已經(jīng)走上了另一條道路

      被謝賢養(yǎng)了12年,用青春換來2000萬的Coco,已經(jīng)走上了另一條道路

      小小李?yuàn)?/span>
      2025-11-06 11:37:37
      何炅替謝娜求情復(fù)出!

      何炅替謝娜求情復(fù)出!

      八卦瘋叔
      2025-11-06 10:08:01
      英超前10輪與上賽季同期積分對(duì)比:阿森納、利物浦積分互換

      英超前10輪與上賽季同期積分對(duì)比:阿森納、利物浦積分互換

      懂球帝
      2025-11-06 00:05:53
      2025-11-06 13:39:00
      新智元 incentive-icons
      新智元
      AI產(chǎn)業(yè)主平臺(tái)領(lǐng)航智能+時(shí)代
      13799文章數(shù) 66238關(guān)注度
      往期回顧 全部

      科技要聞

      蘋果“認(rèn)輸”!曝每年10億美元租用谷歌AI

      頭條要聞

      女星安吉麗娜朱莉訪烏 隨身保鏢被烏軍征兵處抓走服役

      頭條要聞

      女星安吉麗娜朱莉訪烏 隨身保鏢被烏軍征兵處抓走服役

      體育要聞

      送走兩位全明星,公牛成了東部第一

      娛樂要聞

      白百何好友揭露爭獎(jiǎng)細(xì)節(jié)

      財(cái)經(jīng)要聞

      特朗普關(guān)稅遭美國高院大法官輪番質(zhì)疑

      汽車要聞

      方向盤?不存在的 特斯拉 Cybercab亞太首秀

      態(tài)度原創(chuàng)

      健康
      旅游
      親子
      教育
      游戲

      超聲探頭會(huì)加重受傷情況嗎?

      旅游要聞

      安徽黃山:峰林盡染秋意濃

      親子要聞

      怎么有愛好這么互補(bǔ)的父女啊?

      教育要聞

      爸媽變“同桌”!南京一中課堂迎來最特別的“插班生”!

      《足球經(jīng)理26》Steam國區(qū)好評(píng)率5%:幾千小時(shí)老兵無語

      無障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 日韩中文字幕综合第二页| 日本三级香港三级三级人!妇久| 亚洲AV无码秘?蜜桃蘑菇| 熟女精品国产一区二区三区| 亚洲国产精品高清久久久| 亚洲一区在线成人av| 日韩精品中文字幕第二页| 亚洲欧美人成人让影院| 国产精品无码不卡在线播放| 一区二区三区精品自拍视频| AV毛片无码中文字幕不卡| 日韩成人无码影院| 九九热久久只有精品2| 99久久精品久久久久久清纯| 欧美牲交a欧美牲交aⅴ图片| 91老熟女老人国产老太| 欧洲美熟女乱又伦免费视频| 亚洲一区二区三区18禁| 国产成人精品亚洲精品密奴| 中文字幕乱码在线人视频| 国产av黄色一区二区三区| 成人福利国产午夜AV免费不卡在线 | 亚洲aⅴ天堂av天堂无码麻豆| 国产精品粉嫩嫩在线观看| 宣武区| 国产偷窥熟女高潮精品视频| 亚洲国产欧美在线人成| 国产精品亚洲А∨天堂免下载| 色综合久久久久综合体桃花网| 国产免费丝袜调教视频| 久久夜色精品国产亚av| 中文字幕无码免费久久| 玩弄少妇人妻| 久久国产精品老人性| 毛片内射久久久一区| 亚洲成年av天堂动漫网站| 国产对白老熟女正在播放| 宜兰市| 亚洲偷偷自拍码高清视频| 丁香五月婷激情综合第九色| www久久只有这里有精品|