<blockquote id="ue9b1"></blockquote>
    
    

    <style id="ue9b1"></style>
      <sub id="ue9b1"><p id="ue9b1"><form id="ue9b1"></form></p></sub>

      <strong id="ue9b1"><button id="ue9b1"><mark id="ue9b1"></mark></button></strong>
      成年午夜性影院,下面一进一出好爽视频,国产无遮挡又黄又爽又色,国产精品爽爽v在线观看无码,国产人妻久久精品一区二区三区,国产伦精品一区二区三区免费迷,国产欧美精品一区二区三区,日韩精品一区二区三区视频
      網易首頁 > 網易號 > 正文 申請入駐

      AI能否「圣地巡禮」?多模態大模型全新評估基準VIR-Bench來了

      0
      分享至



      大家或許都有過這樣的體驗:

      看完一部喜歡的動漫,總會心血來潮地想去 “圣地巡禮”;刷到別人剪輯精美的旅行 vlog,也會忍不住收藏起來,想著哪天親自走一遍同樣的路線。旅行與影像的結合,總是能勾起人們的探索欲望。那么,如果 AI 能自動看懂這些旅行視頻,幫你解析出 “去了哪些地方”“順序是怎樣的”,甚至還能一鍵生成屬于你的旅行計劃,會不會很有趣?這不僅僅是阿宅的想象,更是多模態大模型在真實世界應用中的一個重要場景。



      正是在這樣的啟發下,來自日本早稻田大學,CyberAgent 和奈良先端科學技術大學院大學的團隊提出了一個全新的多模態大模型評估基準 VIR-Bench ,旨在評測 AI 是否真的能理解旅行視頻中的地理位置與時間順序,從而支撐更復雜、更實用的應用。用一句話來概括,這項研究就是在追問:“我從哪里來?我要到哪里去?”



      • 論文地址:https://www.arxiv.org/abs/2509.19002
      • GitHub:https://github.com/nlp-waseda/VIR-Bench

      VIR-Bench 是什么?任務設計與數據集構建

      任務目標:行程還原(Itinerary Reconstruction)

      在 VIR-Bench 中,給定一個旅行 vlog(在日本拍攝),模型要輸出訪問順序圖(visiting order graph),也就是 “我去了哪些地點、按什么順序、地點之間有哪些包含關系” 的結構化表示。

      更具體地,這個訪問順序圖是一個有向圖,其中:

      • 節點表示被訪問的地點,按層次分為 Prefecture,City,和 POI(Point of Interest)三層級。
      • 包含邊(Inclusion edge) 表示層次上的 “大地理單元包含小地理單元” 關系(例如某 POI 在某個 City 里,某個 City 在某個 Prefecture 里)。
      • 轉移邊(Transition edge) 表示時間順序上的移動:從一個節點移動到下一個節點(同層級)表示旅行順序。



      這意味著模型不僅要識別出 “我去過的地點”,還要判斷這些地點之間的時間順序,地理空間關系,進而構建出整個旅行路徑的結構。此外,由于旅行視頻往往是自拍視角 / 行進視角 / 風光視角等交錯出現,模型需要在多樣視角、非連續畫面中“拼圖式” 理解,這進一步提升了任務難度。

      為便于模型訓練與評測,作者將這一復雜任務拆解為兩個子任務:

      1. 節點預測:給定視頻,模型列出所有被訪問的 Prefecture、City、POI。

      2. 邊緣預測:給定視頻 + 節點集合(節點標簽順序被打亂),模型要判斷哪些節點之間存在包含邊,哪些節點之間存在轉移邊。即預測邊的集合。

      通過這種分解方式,我們可以分別評估模型的地理識別能力與時序推理能力,以及它們在實際組合時的協同性。

      數據集構建:200 個旅行視頻 + 訪問順序圖

      為了支撐上述任務,作者構建了一個規模適中的專用數據集:

      • 視頻數量:200 個旅行 vlog(都在日本拍攝) 。
      • 地點覆蓋:共標注出 3,689 個 POI,分布在日本 43 個都道府縣(幾乎覆蓋全日本) 。
      • 標注方式:每個視頻由人工注釋者識別每個 POI 的起止時間、Google Maps 鏈接,并通過雙人校驗后自動構建最終的訪問順序圖。

      作者在論文中還附上了詳細注釋指南、數據分布統計等信息(可見 Appendix 部分)。

      實驗結果與洞察:當前模型面臨的挑戰



      在實驗中,作者發現開源模型整體上仍然落后于商用模型,尤其是在 POI 節點識別 和 轉移邊預測 這兩個子任務上差距尤為明顯。進一步的分析顯示,轉移邊預測幾乎是所有模型的 “最難關”:不少模型要么直接誤解了任務要求,要么忽視了層級結構的約束(只有同層級節點之間可以有轉移邊),結果往往接近隨機水平。

      另一方面,模型規模的擴展對性能提升具有顯著作用,尤其體現在邊緣預測上;而是否具備地理相關的預訓練,則成為 POI 節點預測精度差異的關鍵因素。值得注意的是,思維鏈推理(Chain-of-Thought) 的效果在不同子任務中差別很大:在節點預測中提升有限,但在邊緣預測中卻能帶來顯著的改善。如果再進一步結合音頻信息(例如 Gemini-2.5-Pro 的多模態輸入),效果提升尤為突出。

      Ablation 實驗也為我們揭示了模型性能提升的幾個關鍵方向:增加輸入幀數可以讓模型捕捉更完整的旅行線索,更長的推理過程能幫助模型逐步還原旅行順序,而音頻的利用則能提供額外的語義提示。三者結合,共同推動了模型在復雜時空理解任務上的進步。

      然而,即便有這些改進,整體性能仍遠未達到可用水平。即使是當前得分最高的 Gemini-2.5-Pro,在預測結果中依然存在大量錯誤,這進一步凸顯了多模態大模型在長程地理與時間理解上的巨大挑戰。



      表1: 節點預測的評估結果



      表2: 邊緣預測的評估結果

      總而言之,VIR-Bench 不僅是一個新的評測基準,更是為未來諸多應用打開了一扇窗口。通過在旅行視頻中重建行程順序,它逼迫模型同時理解 “地理位置 + 時間順序”,這與機器人如何理解世界、規劃路徑,以及自動駕駛系統如何在動態環境中進行決策高度契合。

      這一研究讓我們看清:當前的大模型在長程推理和時空理解上仍有明顯不足,但也指明了進化的方向 —— 更強的地理空間感知、更可靠的時間推理,以及多模態信息的深度融合。當這些能力逐漸成熟,AI 將不再只是 “看視頻”,而是真正具備 “在世界中行動” 的潛力。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      3-1,25歲曼城舊將阿爾瓦雷斯無敵凌空斬,馬競拒絕歐冠2連敗

      3-1,25歲曼城舊將阿爾瓦雷斯無敵凌空斬,馬競拒絕歐冠2連敗

      側身凌空斬
      2025-11-05 05:59:35
      美國對委內瑞拉動手方案曝光!三種方案,特朗普怕失敗還未決定

      美國對委內瑞拉動手方案曝光!三種方案,特朗普怕失敗還未決定

      趙昉是個熱血青年
      2025-11-05 19:11:58
      正式退賽,全紅嬋發聲,恩師官宣原因,10米臺失誤原因找到

      正式退賽,全紅嬋發聲,恩師官宣原因,10米臺失誤原因找到

      樂聊球
      2025-11-04 14:14:32
      石榴立大功!新發現:石榴竟能在36小時清除50%的腸道垃圾

      石榴立大功!新發現:石榴竟能在36小時清除50%的腸道垃圾

      原來仙女不講理
      2025-11-03 22:41:50
      刁難周迅,對馬伊琍放狠話,9次試管失敗,59歲的她憑什么那么火

      刁難周迅,對馬伊琍放狠話,9次試管失敗,59歲的她憑什么那么火

      人間頌
      2025-11-05 12:08:04
      剛剛,深圳地鐵致歉!

      剛剛,深圳地鐵致歉!

      南方都市報
      2025-11-05 09:57:10
      主動投案!濟南市長清區委常委、副區長趙魯被查

      主動投案!濟南市長清區委常委、副區長趙魯被查

      極目新聞
      2025-11-05 10:34:12
      對岸統一的風向:賴清德由獨轉統,或能成就統一功績~

      對岸統一的風向:賴清德由獨轉統,或能成就統一功績~

      蛙斯基娛樂中
      2025-11-05 05:53:03
      年薪300萬,卻從替補打成球隊老大!被低估的超巨,你不該被拋棄

      年薪300萬,卻從替補打成球隊老大!被低估的超巨,你不該被拋棄

      籃球掃地僧
      2025-11-05 17:03:05
      演員王祖藍,受聘為高校教授

      演員王祖藍,受聘為高校教授

      極目新聞
      2025-11-05 09:50:06
      80萬開零食店,3個月血虧關門!這門穩賺生意,原來專割創業者!

      80萬開零食店,3個月血虧關門!這門穩賺生意,原來專割創業者!

      青眼財經
      2025-10-24 09:45:37
      沒想到!剛種草于和偉羽絨外套,居然漲了300塊!于和偉都傻眼了

      沒想到!剛種草于和偉羽絨外套,居然漲了300塊!于和偉都傻眼了

      樂悠悠娛樂
      2025-11-05 13:22:19
      荷蘭專家:ASML深入研究中國企業后發現,實際情況比他們想的糟糕

      荷蘭專家:ASML深入研究中國企業后發現,實際情況比他們想的糟糕

      朔方瞭望
      2025-11-05 18:10:57
      謝霆鋒怎么也沒想到,離婚不過是虛晃一招,張柏芝比他想象得厲害

      謝霆鋒怎么也沒想到,離婚不過是虛晃一招,張柏芝比他想象得厲害

      喜歡歷史的阿繁
      2025-11-05 01:38:40
      死傷慘重!俄軍導彈從天而降,北約“大魚”被炸,烏克蘭新兵被炸

      死傷慘重!俄軍導彈從天而降,北約“大魚”被炸,烏克蘭新兵被炸

      荷蘭豆愛健康
      2025-11-05 08:00:37
      賽力斯公布方向盤折疊專利

      賽力斯公布方向盤折疊專利

      界面新聞
      2025-11-04 15:13:11
      僅一周就有6位明星去世!都是觀眾老熟人,有壽終正寢有突發意外

      僅一周就有6位明星去世!都是觀眾老熟人,有壽終正寢有突發意外

      小海娛計
      2025-11-05 19:16:47
      重要比賽!11月5日中央電視臺CCTV5、CCTV5+直播節目表

      重要比賽!11月5日中央電視臺CCTV5、CCTV5+直播節目表

      皮皮觀天下
      2025-11-05 05:27:49
      疑似上海抓小三的原配回應已離婚,返還男方工資后再給20萬和離

      疑似上海抓小三的原配回應已離婚,返還男方工資后再給20萬和離

      阿纂看事
      2025-11-03 08:04:26
      重磅:中國剛宣布對日本免簽再延長一年!背后藏著的竟是這本“生意經”……

      重磅:中國剛宣布對日本免簽再延長一年!背后藏著的竟是這本“生意經”……

      掘金日本房產
      2025-11-05 18:59:35
      2025-11-05 20:24:49
      機器之心Pro incentive-icons
      機器之心Pro
      專業的人工智能媒體
      11656文章數 142498關注度
      往期回顧 全部

      科技要聞

      大轉彎!特朗普再提名馬斯克盟友任NASA局長

      頭條要聞

      國足換帥 邵佳一曾被贊是在德國踢球最成功的中國球員

      頭條要聞

      國足換帥 邵佳一曾被贊是在德國踢球最成功的中國球員

      體育要聞

      贏下皇馬,會是利物浦的轉折點嗎?

      娛樂要聞

      港星林尚武突發心臟病去世

      財經要聞

      中方官宣!對美關稅,調整!

      汽車要聞

      智己LS9入局"9系"混戰 全尺寸SUV市場迎來新變量

      態度原創

      家居
      健康
      本地
      游戲
      房產

      家居要聞

      別樣府院 暢享詩意生活

      超聲探頭會加重受傷情況嗎?

      本地新聞

      這屆干飯人,已經把博物館吃成了食堂

      《GTA6》或將迎來重磅角色!前作諸葛亮級大佬回歸

      房產要聞

      最新!海南樓市10月熱銷榜單出爐!

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 色综合久久一区二区三区| 91青青草视频在线观看| 亚洲国产aⅴ成人精品无吗| 成人精品自拍视频免费看| 国模肉肉视频一区二区三区| 成人3d动漫一区二区三区| 亚洲成人av综合一区| 亚洲第一无码专区天堂| 亚洲精品人成网线在播放VA| 十八禁在线观看视频播放免费 | 国产草草影院ccyycom| 国产偷自视频区视频| 日韩国产精品无码一区二区三区| 精品免费国产一区二区三区四区介绍 | 浴室人妻的情欲hd三级国产| 精品中文人妻中文字幕| 欧美videosdesexo吹潮| 国产亚洲精品aaaa片app| 日韩精品国产中文字幕| 少妇大叫太大太爽受不了| 国产极品粉嫩学生一线天| 国产又色又爽又黄的视频在线| 中文国产成人精品久久一| 丝袜欧美视频首页在线| 江永县| 大香伊蕉在人线国产最新2005| 国产成人一区二区三区免费| 亚洲一区二区美女av| 污污污污污污WWW网站免费| 亚洲精品美女一区二区| 国产乱弄免费视频观看| 四虎在线播放亚洲成人| 日韩免费美熟女中文av| 亚洲精品欧美综合二区| 中国性欧美videofree精品| 日本一区二区三区小视频| 国产精品午夜福利视频234区 | 一区二区中文字幕av| 中文字幕在线无码一区二区三区| 国产日韩一区二区天美麻豆 | 先锋影音男人av资源|