<blockquote id="ue9b1"></blockquote>
    
    

    <style id="ue9b1"></style>
      <sub id="ue9b1"><p id="ue9b1"><form id="ue9b1"></form></p></sub>

      <strong id="ue9b1"><button id="ue9b1"><mark id="ue9b1"></mark></button></strong>
      成年午夜性影院,下面一进一出好爽视频,国产无遮挡又黄又爽又色,国产精品爽爽v在线观看无码,国产人妻久久精品一区二区三区,国产伦精品一区二区三区免费迷,国产欧美精品一区二区三区,日韩精品一区二区三区视频
      網易首頁 > 網易號 > 正文 申請入駐

      大模型時代,通用視覺模型將何去何從?

      0
      分享至



      過去幾年,通用視覺模型(Vision Generalist Model,簡稱 VGM)曾是計算機視覺領域的研究熱點。它們試圖構建統一的架構,能夠處理圖像、點云、視頻等多種視覺模態輸入,以及分類、檢測、分割等多樣的下游任務,向著「視覺模型大一統」的目標邁進。

      然而,隨著大語言模型 LLM 的迅猛發展,研究熱點已經悄然發生轉移。如今,多模態大模型興起,視覺被看作是語言模型眾多輸入模態中的一種,視覺模態數據被離散化為 Token,與文本一起被統一建模,視覺的「獨立性」正在被重新定義。

      在這種趨勢下,傳統意義上以視覺任務為核心、以視覺范式為驅動的通用視覺模型研究,似乎正在逐漸被邊緣化。然而,我們認為視覺領域仍應保有自己的特色和研究重點。與語言數據相比,視覺數據具有結構化強、空間信息豐富等天然優勢,但也存在視覺模態間差異大、難替代的挑戰。例如:如何統一處理 2D 圖像、3D 點云和視頻流等異質輸入?如何設計統一的輸出表示來同時支持像素級分割和目標檢測等不同任務?這些問題在當前的多模態范式中并未被充分解決。

      正因如此,在這個多模態模型席卷科研與工業的新時代,回顧并總結純視覺范式下的通用視覺模型研究仍然是一件十分有意義的事情。清華大學自動化系魯繼文團隊最近發表于 IJCV 的綜述論文系統梳理了該方向的研究進展,涵蓋輸入統一方法、任務通用策略、模型框架設計、模型評測應用等內容,希望能為未來視覺模型的發展提供參考與啟發。



      • 論文標題:Vision Generalist Model: A Survey
      • 論文鏈接:
      • https://arxiv.org/abs/2506.09954



      VGM 到底解決了什么問題?

      通用視覺模型是一種能夠處理多種視覺任務和模態輸入的模型框架。類似于大語言模型在自然語言處理中的成功,VGM 旨在通過構建一個統一的架構來解決各種計算機視覺任務。傳統的視覺模型通常針對特定任務(如圖像分類、目標檢測、語義分割等)設計,而 VGM 通過廣泛的預訓練和共享表示,能夠在不同的視覺任務之間實現零樣本(Zero-shot)遷移,從而無需為每個任務進行專門的調整。

      VGM 的關鍵能力之一是其多模態輸入的統一處理能力。不同于傳統模型只處理單一類型的視覺數據,VGM 能夠同時處理來自多個模態的數據,如圖像、點云、視頻等,并通過統一的表示方法將它們映射到共享的特征空間。

      此外,VGM 還具備強大的多任務學習能力,能夠在同一個模型中處理多個視覺任務,從圖像識別到視頻分析,所有任務都可以在一個通用框架下并行處理。

      綜述涵蓋了哪些核心內容?

      數據 + 任務 + 評測:為通用建模打基礎

      VGM 通常使用大規模、多樣化的數據集進行訓練和評估。為了支持多模態學習,VGM 使用的訓練數據集涵蓋了圖像、視頻、點云等多種類型,本綜述列舉并介紹了一些常見的多模態數據集。

      任務方面,本綜述將視覺任務分為四類:圖像任務、幾何任務、時間序列任務以及其他視覺相關任務。評測方面,主要通過多個綜合基準來衡量其在多種任務和數據集上的表現。與傳統的單一任務評測不同,現代評測方法更注重模型的跨任務泛化和多模態處理能力。本綜述也對現有通用視覺模型的評測基準做了充分的調研與總結。

      模型設計范式與技術補充



      現有通用視覺模型的設計范式主要集中在如何統一處理不同視覺模態輸入和多樣化任務輸出,大致可以分為兩種類型:編碼式框架和序列到序列框架。

      編碼式框架(Encoding-based Framework)旨在通過構建一個共享的特征空間來統一不同的輸入模態,并使用 Transformer 等模型進行編碼。這類框架通常包括領域特定的編碼器來處理不同類型的數據,如圖像、文本和音頻,然后通過共享的 Transformer 結構進行進一步處理,最終生成統一的輸出。

      而序列到序列框架(Sequence-to-Sequence Framework)則借鑒了自然語言處理中的序列建模方法,將輸入數據轉換為固定長度的表示,然后通過解碼器生成相應的輸出。這些框架特別適合處理具有可變長度輸入輸出的任務,如圖像生成和視頻分析。

      盡管有一些工作并不能被定義為通用視覺模型,但它們在聯合多模態數據輸入、模型架構設計、協同處理多任務輸出等方面做出了卓越的技術貢獻。本綜述也對這些技術進行了詳盡的討論分析。一些相關領域的內容,如多任務學習、視覺-語言學習、開放詞匯,也被用來擴充通用視覺模型領域的知識邊界。

      此外,作為一個 case study,本綜述對比了收錄了多個主流 VGM 模型在 22 個基準數據集上的評測結果:



      VGM 的未來在哪里?

      最后,本綜述總結了 VGM 的當前研究進展和面臨的挑戰,還強調了其在實際應用中的潛力和未來發展方向。

      現有 VGM 在多個任務和多模態輸入的統一處理方面已經取得了顯著的進展,但仍面臨著如何優化統一框架設計、提高訓練效率和應對大規模數據等挑戰。數據獲取和標注仍然是 VGM 發展的瓶頸。

      為了解決這一問題,自動化標注技術以及大規模無監督學習方法的研究將成為未來的研究重點。然而,隨著模型規模的擴大,VGM 也面臨著倫理問題和偏見的挑戰。大量未標注的數據中可能包含潛在的偏見,如何確保模型的公平性、透明性和安全性,仍是未來研究中的重要課題。

      盡管如此,現有的 VGM 在實際應用中展示了廣泛的潛力。它不僅可以用于傳統的視覺任務,如圖像分類、目標檢測和語義分割,還能擴展到更復雜的多模態任務,如視覺問答、圖像-文本檢索、視頻理解等。這些應用涵蓋了智能監控、自動駕駛、機器人等多個領域,推動了 VGM 在實際場景中的廣泛部署。

      希望這篇文章能給研究中的你一些啟發。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      返回時間已定!神舟二十號快速返回:比神舟十二縮短15小時

      返回時間已定!神舟二十號快速返回:比神舟十二縮短15小時

      火星一號
      2025-11-04 21:46:57
      有一個拎不清的親戚是啥體驗?網友:看得我肺都要氣炸了

      有一個拎不清的親戚是啥體驗?網友:看得我肺都要氣炸了

      解讀熱點事件
      2025-10-25 00:10:08
      湖南省人民醫院院長肖亞洲的人生歷程

      湖南省人民醫院院長肖亞洲的人生歷程

      筆墨V
      2025-11-06 08:59:58
      董路:不知邵佳一是否正直,他和李鐵曾是哥們,但不會犯同樣錯誤

      董路:不知邵佳一是否正直,他和李鐵曾是哥們,但不會犯同樣錯誤

      風過鄉
      2025-11-06 10:55:20
      趙少康“大罷免”亮票2次,遭臺北地檢署起訴:從重量刑

      趙少康“大罷免”亮票2次,遭臺北地檢署起訴:從重量刑

      海峽導報社
      2025-11-06 11:55:13
      中國空軍未來5年面臨很大的換裝壓力

      中國空軍未來5年面臨很大的換裝壓力

      流云青史
      2025-11-04 16:42:47
      山姆被罵上熱搜!800萬會員抵制阿里高管,集體喊退卡

      山姆被罵上熱搜!800萬會員抵制阿里高管,集體喊退卡

      吃瓜局
      2025-11-05 15:22:55
      不是玄學!明日立冬,最旺自己的5件事,別忘了告訴家人

      不是玄學!明日立冬,最旺自己的5件事,別忘了告訴家人

      白宸侃片
      2025-11-06 09:06:11
      曝妻兒3人被發小殺害真相,飯桌聊黃金遭惦記,百日祭現反常一幕

      曝妻兒3人被發小殺害真相,飯桌聊黃金遭惦記,百日祭現反常一幕

      壹月情感
      2025-11-05 21:24:33
      兩家冷卻液供應商回應理想MEGA召回事件

      兩家冷卻液供應商回應理想MEGA召回事件

      中國能源網
      2025-11-04 12:54:07
      國家重拳整治!四類退休人員成重點,一個逃不掉

      國家重拳整治!四類退休人員成重點,一個逃不掉

      慧眼看世界哈哈
      2025-11-06 05:46:35
      來得真快,越南偷建21座人工島,中方要逮四條大魚,南海混戰開始

      來得真快,越南偷建21座人工島,中方要逮四條大魚,南海混戰開始

      花花娛界
      2025-11-06 11:09:42
      中俄談妥了,米舒斯京離開人民大會堂,臨走前簽字,美國怕啥來啥

      中俄談妥了,米舒斯京離開人民大會堂,臨走前簽字,美國怕啥來啥

      臨云史策
      2025-11-06 13:10:24
      如果在家突發心梗,黃金5分鐘自救法,快了解,關鍵時刻可自救

      如果在家突發心梗,黃金5分鐘自救法,快了解,關鍵時刻可自救

      風信子的花
      2025-10-24 23:59:39
      喝酒四巨頭:不到兩年全沒,有的去世當天喝4瓶白酒,最小的才26

      喝酒四巨頭:不到兩年全沒,有的去世當天喝4瓶白酒,最小的才26

      墨印齋
      2025-09-22 10:00:58
      突然刷屏:“退卡、差評!”山姆深夜回應

      突然刷屏:“退卡、差評!”山姆深夜回應

      每日經濟新聞
      2025-11-04 14:01:07
      社評:別讓安世事件成為歐洲市場經濟的污點

      社評:別讓安世事件成為歐洲市場經濟的污點

      環球網資訊
      2025-11-04 23:33:02
      荷蘭急瘋了自捅一刀!全面禁止對中國DUV設備出口后,ASML一夜蒸發8%

      荷蘭急瘋了自捅一刀!全面禁止對中國DUV設備出口后,ASML一夜蒸發8%

      億通電子游戲
      2025-11-06 12:53:50
      11月6日全紅嬋收官戰,預賽不敵陳芋汐組合!晚間決戰,CCTV5直播

      11月6日全紅嬋收官戰,預賽不敵陳芋汐組合!晚間決戰,CCTV5直播

      鄉野小珥
      2025-11-06 13:30:12
      鄰居藏獒偷肉他不管,我每天喂它血肉,出差半月后警察:你鄰居死了

      鄰居藏獒偷肉他不管,我每天喂它血肉,出差半月后警察:你鄰居死了

      懸案解密檔案
      2025-10-13 10:40:42
      2025-11-06 14:11:00
      機器之心Pro incentive-icons
      機器之心Pro
      專業的人工智能媒體
      11658文章數 142499關注度
      往期回顧 全部

      科技要聞

      蘋果“認輸”!曝每年10億美元租用谷歌AI

      頭條要聞

      女星安吉麗娜朱莉訪烏 隨身保鏢被烏軍征兵處抓走服役

      頭條要聞

      女星安吉麗娜朱莉訪烏 隨身保鏢被烏軍征兵處抓走服役

      體育要聞

      送走兩位全明星,公牛成了東部第一

      娛樂要聞

      白百何好友揭露爭獎細節

      財經要聞

      特朗普關稅遭美國高院大法官輪番質疑

      汽車要聞

      方向盤?不存在的 特斯拉 Cybercab亞太首秀

      態度原創

      親子
      本地
      房產
      旅游
      健康

      親子要聞

      怎么有愛好這么互補的父女啊?

      本地新聞

      這屆干飯人,已經把博物館吃成了食堂

      房產要聞

      中旅·三亞藍灣,以一座城市會客廳回應世界的濱海想象

      旅游要聞

      安徽黃山:峰林盡染秋意濃

      超聲探頭會加重受傷情況嗎?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 国产成人不卡一区二区| 国产成人亚洲欧美二区综合| 伊人久久大香线蕉AV网| 在线天堂最新版资源| 极品白嫩少妇无套内谢| 干老熟女干老穴干老女人| 亚洲中文字幕国产综合| 国产中文字幕精品免费| 精品蜜臀国产av一区二区| 日本熟妇XXXX潮喷视频| 日韩av在线不卡一区二区三区 | 绍兴县| 亚洲中文字幕精品第三区| 免费a级黄毛片| 99re热这里只有精品视频| 熟女人妻aⅴ一区二区三区电影| 国产黄色精品一区二区三区| 熟妇人妻av中文字幕老熟妇 | 综合色在线| 国产成人久久精品流白浆| 三都| 亚洲国产午夜精品福利| 一区二区不卡国产精品| 亚洲 欧美 综合 另类 中字| 国产精品一区二区三区色| 2019国产精品青青草原| 亚洲一区二区三区 无码| 91精品午夜福利在线观看| 国产第一页浮力影院入口| 色欲av亚洲一区无码少妇| 国产一精品一av一免费| 99久久精品午夜一区二区| 国产最新AV在线播放不卡| 国产精品无码免费播放| 亚洲欧洲日韩国内精品| 五月丁香六月综合缴情在线 | 色偷偷久久一区二区三区| 日韩亚洲精品中文字幕| 拍真实国产伦偷精品| 精品视频在线观看免费观看| 国产999久久高清免费观看|