<blockquote id="ue9b1"></blockquote>
    
    

    <style id="ue9b1"></style>
      <sub id="ue9b1"><p id="ue9b1"><form id="ue9b1"></form></p></sub>

      <strong id="ue9b1"><button id="ue9b1"><mark id="ue9b1"></mark></button></strong>
      成年午夜性影院,下面一进一出好爽视频,国产无遮挡又黄又爽又色,国产精品爽爽v在线观看无码,国产人妻久久精品一区二区三区,国产伦精品一区二区三区免费迷,国产欧美精品一区二区三区,日韩精品一区二区三区视频
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      中科院團隊打造AI專屬交互界面,任務成功率提升67%

      0
      分享至

      在日常使用電腦時,看著屏幕、點擊鼠標是再自然不過的基本操作。但這種對人類明明很容易的操作方式,卻成為 AI 的巨大挑戰(zhàn):它們視力差、動作慢、不擅長看也不擅長點。

      幾十年來,操作系統(tǒng)的圖形用戶界面(GUI)一直都是為人類使用而設計,從未考慮有一天,大語言模型(LLM)會成為操作系統(tǒng)新的使用者。

      要知道,GUI 智能體與人類在能力上存在巨大的差異,完美適配人類能力特征的 GUI,反而非常不適合 LLM 使用。

      LLM 擅長語義規(guī)劃、定目標、決策要“做什么”,而 GUI 逼著使用者給出具體“怎么做”的詳細步驟。但是,LLM 恰恰非常不擅長這種低層次、繁瑣的機制性操作,因此很容易出錯。

      近期,中國科學院軟件研究所基礎軟件與系統(tǒng)重點實驗室團隊提出了一種新的思路,他們?yōu)椴僮飨到y(tǒng)引入了新的抽象,為大模型量身定制了目標導向接口(GOI)。通過將 GUI 操作轉化為聲明式(Declarative)原語,顯著提高了 LLM 在自動化計算機任務中的表現(xiàn)。

      中國科學院軟件研究所陳海波教授對 DeepTech 表示,GOI 的設計理念有望為領域帶來新的思考——系統(tǒng)或程序本身在設計時即假設用戶可能是 LLM,并提供 LLM 使用的接口,而非強迫 LLM 模仿人類,去使用那些為人類設計的接口。

      簡單來理解,GOI 讓 LLM 更像是“指揮官”而非“操作員”。傳統(tǒng)微調或重訓練的方法,就像要求大模型模仿人類,學習掌握處理機制性操作的能力;而聲明式的 GOI 就像一位專業(yè)的“執(zhí)行助理”,接管了 LLM 不擅長的機制操作。指揮官(大模型)專注于發(fā)揮本就擅長的能力,下達“想要什么結果”(策略),GOI 這個“助理”會自動處理所有底層的導航和交互(機制)。

      GOI 與傳統(tǒng)接口最實質的不同在于:傳統(tǒng)接口通常默認接口的使用者為人類,而 GOI 是讓接口更適合 LLM 使用,對 LLM 更友好。研究人員在 Windows 上的微軟 Office 套件(Word、PowerPoint、Excel)上評估了 GOI 的有效性。

      結果顯示,與領先的基于 GUI 的代理基線相比,GOI 將任務成功率提升了 67%,步驟減少了 43.5%。值得注意的是,GOI 在 61% 以上的成功任務中,僅用一次 LLM 調用即完成了相關任務。


      圖丨從左至右依次為:李明煜、陳海波和王遠(來源:陳海波)

      GOI 當前基于 Windows 系統(tǒng)的 UIA 可訪問性機制實現(xiàn),其設計理念同時具有跨平臺通用性,類似的可訪問機制接口在 macOS、Linux(例如 Ubuntu)、Android 等系統(tǒng)中均可提供。據(jù)介紹,GOI 在這些系統(tǒng)上落地,更多的是一種工程上的開發(fā)適配。

      對于游戲和部分媒體應用來說,這類應用程序為達到更高的性能,采取了自繪和自定義的方法,并沒有全部使用操作系統(tǒng)通用的可訪問性類型和模式。因此,GOI 在這類應用上的實現(xiàn)需要開發(fā)者進行配合。

      相關論文以《一種提高計算機使用代理效率的聲明式大語言模型友好界面的案例研究》(A Case for Declarative LLM-friendly Interfaces for Improved Efficiency of Computer-Use Agents)為題發(fā)表在預印本網(wǎng)站 arXiv[1]。論文作者包括中國科學院軟件研究所基礎軟件與系統(tǒng)重點實驗室陳海波教授、李明煜副研究員和王遠博士研究生。


      圖丨相關論文(來源:arXiv)

      研究團隊首先從接口設計的角度分析問題。具體而言,為人使用設計的 GUI,對用戶能力做了四個關鍵假設:用戶視力好、操作快,但短期記憶空間小且不擅長寫代碼。

      這些假設對 LLM 并不成立。LLM 視力差、推理慢,但是上下文空間巨大,且擅長結構化輸出。這種錯配使得 LLM 使用 GUI 時遇到了很多挑戰(zhàn)。例如,在使用 GUI 時,功能不能被直接調用,而是需要輸出長動作鏈進行“導航”和“交互”。

      陳海波舉例說道,這就好比 LLM 去打車,命令式的 GUI 需要告訴司機“前方直行 100 米,第一個紅綠燈路口右轉,靠右前方行駛 50 米”,而不能直接聲明“目的地”。處理這些細粒度且繁瑣的步驟,恰恰是 LLM 不擅長的。

      該團隊的一個很自然的思考是:是否可以將 GUI 使用中 LLM 不擅長的部分交給操作系統(tǒng),而非由 LLM 負責一切呢?


      圖丨 GOI 抽象層概述(來源:arXiv)

      基于此,他們發(fā)現(xiàn) APP 的使用可以分為策略(policy)機制(mechanism)兩部分。簡單來理解,策略就是“做什么”:分析完成用戶任務需要用到什么功能;機制則是“怎么做”:如何通過一步步的 UI 導航和交互,觸發(fā)這些功能。


      圖丨GUI 使用中的策略-機制耦合(來源:arXiv)

      另一方面,研究人員將 GUI 的導航和交互抽象為訪問(access)、狀態(tài)(state)、觀測(observation)三類聲明式原語。這樣,LLM 不再需要輸出具體、繁瑣且易錯的導航和交互步驟,而是直接通過聲明式原語聲明期望的結果。

      “正是這三類聲明式原語將策略和機制解耦,允許 LLM 專注于策略的處理,規(guī)避了大量來自機制層面的失敗和交互開銷,因此帶來了準確率和效率的大幅提升。”陳海波表示。


      (來源:arXiv)

      以幻燈片為例,用戶的需求是“將 PPT 背景全部設置為藍色”。在這一任務中,策略(功能編排)指的是使用“藍色”和“應用到全部”這兩個功能,而機制(導航和交互)是點擊“設計”“設置背景格式”“純色填充”“顏色”“藍色”和“應用到全部”,以觸發(fā)實際的功能。


      (來源:資料圖)

      另一個例子是,用戶要求將“滾動條移動到靠近結尾的位置”。在這一任務中,策略指的是確定一個最終位置,比如 80%,而機制(交互)指的是選中滾動條、保持按住不釋放,多次拖拽和移動并觀察最終狀態(tài)是否符合預期,直到移動到目標位置。


      (來源:資料圖)

      GUI 的設計耦合了策略與機制,應用功能的使用前置依賴于導航和交互,無法被直接訪問。當使用 GUI 時,LLM 不僅面臨著冗長的動作鏈條,過多的調用次數(shù),還經(jīng)常在導航和交互中犯錯,導致任務失敗。

      “雖然 LLM 不擅長處理機制,但我們發(fā)現(xiàn),導航和交互兩個部分存在很強的確定性,這部分工作可以由算法確定性完成,不必 LLM 參與。”陳海波表示。

      具體來說,應用控件間的轉換關系是確定的,可以被建模為有限狀態(tài)機;同時,在可訪問性下,控件可被歸類為有限數(shù)量的 41 種控件類型和 34 種控制模式。這為策略與機制的解耦提供了機會。

      解耦后的結果,正是“聲明式”的交互范式。在這種范式下,LLM 直接指定期望的結果,而不是輸出完成結果的具體動作。例如,LLM 可以直接聲明visit(“藍色”“應用到全部”),而非輸出具體的導航路徑。

      LLM 可以直接調用set_scrollbar_pos(80%)以設置最終位置,而非通過迭代交互以完成這一結果。這種聲明式接口,允許 LLM 專注于語義推理,而非自身不擅長的細粒度的底層操作。


      表丨命令式 GUI 與聲明式 GOI 的案例對比(來源:arXiv)

      研究中的一個挑戰(zhàn)是,接口的設計必須考慮 LLM 的獨特能力特點,尤其是 LLM 不完美的指令遵從(instruction-following)。比如,雖然研究人員在 prompt 中要求 LLM 直接指定期望訪問的控件,而非輸出訪問這個控件所需要的具體導航步驟,LLM 仍有可能在回答中輸出具體的導航路徑,這會帶來更多錯誤的可能性。

      為解決該問題,他們對非葉子節(jié)點進行了整體過濾,接口會自動忽略這些導航節(jié)點,只保留 LLM 輸出中的葉子節(jié)點,以確保 GOI 完全接管控件的導航過程。

      總結來說,“聲明式”協(xié)作范式的初衷,是通過重構接口設計以簡化 LLM 的計算機使用難度,允許 LLM 充分發(fā)揮自身所長,規(guī)避自身能力短板,最終實現(xiàn)生產力的實質提升。

      在這一范式下,人類可以簡潔地用自然語言表達自己的需求,而 LLM 和系統(tǒng)則能力互補。其中,LLM 專注于無法被確定性處理的語義推理任務,系統(tǒng)則負責處理可以被確定性解決的機制性任務。

      研究團隊認為,LLM 時代下,操作系統(tǒng)正在加速演進。在未來,操作系統(tǒng)可能會原生支持這種聲明式接口,支撐一種模型原生的操作系統(tǒng)設計 [2]。例如,在官方提供的應用開發(fā)框架中,集成自動構建導航拓撲的能力,而不是將應用程序視為“黑盒”進行外部探索以完成建模。最終,這種聲明式接口可能內化于操作系統(tǒng)的構建中,從而為“LLM 智能體”這一全新的計算機用戶提供原生支持。

      參考資料:

      1. A Case for Declarative LLM-friendly Interfaces for Improved Efficiency of Computer-Use Agents. Yuan Wang, Mingyu Li, Haibo Chen . https://arxiv.org/abs/2510.04607.

      2. 模型原生操作系統(tǒng):機遇、挑戰(zhàn)與展望. 陳海波、夏虞斌、陳榕、王肇國、糜澤羽、古金宇. 中國計算機學會通訊. 2025 年第 2 期

      運營/排版:何晨龍

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      不論男女,如果肛門經(jīng)常出現(xiàn)5個問題,或許暗示體內有癌

      不論男女,如果肛門經(jīng)常出現(xiàn)5個問題,或許暗示體內有癌

      風信子的花
      2025-11-05 12:17:08
      倒反天罡,烏克蘭人紛紛慶祝烏軍最精銳的第155旅被俄軍包圍。

      倒反天罡,烏克蘭人紛紛慶祝烏軍最精銳的第155旅被俄軍包圍。

      徐云流浪中國
      2025-11-05 16:49:14
      超60人報名競選國足主帥,半數(shù)來自西班牙,10人進面試僅3名中方教練

      超60人報名競選國足主帥,半數(shù)來自西班牙,10人進面試僅3名中方教練

      齊魯壹點
      2025-11-05 21:03:18
      又見“家長抱著嬰兒在學校門口站崗”:學校阻止了,她說她可以!

      又見“家長抱著嬰兒在學校門口站崗”:學校阻止了,她說她可以!

      走讀新生
      2025-11-05 18:19:25
      被紀委帶走15天音訊全無,到底有多嚴重?這3種結局普通人根本想不到!

      被紀委帶走15天音訊全無,到底有多嚴重?這3種結局普通人根本想不到!

      微法官
      2025-11-06 00:04:26
      觀看量第一!《白雪公主》主演瑞秋·齊格勒回應影片票房口碑撲街

      觀看量第一!《白雪公主》主演瑞秋·齊格勒回應影片票房口碑撲街

      仙味少女心
      2025-11-05 03:09:37
      別找年齡借口 43歲陳自瑤靠自律拿下豐胸代言 這才是“姐感”天花板

      別找年齡借口 43歲陳自瑤靠自律拿下豐胸代言 這才是“姐感”天花板

      阿廢冷眼觀察所
      2025-10-17 12:20:16
      馬上停止5類運動,很可能加速血栓形成!等血管“堵死”就遲了

      馬上停止5類運動,很可能加速血栓形成!等血管“堵死”就遲了

      39健康網(wǎng)
      2025-11-03 20:11:36
      蒯紀聞梅開二度!U20上海隊晉級

      蒯紀聞梅開二度!U20上海隊晉級

      魯中晨報
      2025-11-05 18:27:02
      哈登情緒失控!因倫納德“陰陽合同”怒砸更衣室,或交易回火箭

      哈登情緒失控!因倫納德“陰陽合同”怒砸更衣室,或交易回火箭

      體壇黑馬
      2025-11-04 18:23:05
      預計我國將進入拉尼娜狀態(tài)!今年冬季,廣西或出現(xiàn)極端低溫

      預計我國將進入拉尼娜狀態(tài)!今年冬季,廣西或出現(xiàn)極端低溫

      南國今報
      2025-11-05 12:47:03
      善惡到頭終有報!57歲央視女主持王小丫,已走上另一條大路

      善惡到頭終有報!57歲央視女主持王小丫,已走上另一條大路

      草莓解說體育
      2025-11-04 03:55:31
      許律師發(fā)朋友圈云淡風輕,王空姐未刪多年合照,網(wǎng)友:細思極恐!

      許律師發(fā)朋友圈云淡風輕,王空姐未刪多年合照,網(wǎng)友:細思極恐!

      一只番茄魚
      2025-11-04 10:24:48
      魏德爾雙喜臨門,默茨陷入兩難,還有余力拒絕選擇黨的橄欖枝嗎?

      魏德爾雙喜臨門,默茨陷入兩難,還有余力拒絕選擇黨的橄欖枝嗎?

      牛鍋巴小釩
      2025-11-06 00:55:34
      馬卡:C羅認為世界杯代表不了什么,但那是他簡歷上最大缺憾

      馬卡:C羅認為世界杯代表不了什么,但那是他簡歷上最大缺憾

      懂球帝
      2025-11-05 08:13:26
      龔正會見格魯吉亞總理科巴希澤

      龔正會見格魯吉亞總理科巴希澤

      澎湃新聞
      2025-11-05 21:42:28
      這個狀元怎么了?才25歲啊,得分生涯最低,命中率生涯最低

      這個狀元怎么了?才25歲啊,得分生涯最低,命中率生涯最低

      球毛鬼胎
      2025-11-04 18:23:43
      哈馬斯:以色列向地道灌混凝土困我們的戰(zhàn)士,嚴重違反協(xié)議

      哈馬斯:以色列向地道灌混凝土困我們的戰(zhàn)士,嚴重違反協(xié)議

      桂系007
      2025-11-04 22:41:12
      10歲患兒被切除6個器官迎來反轉!輿論從網(wǎng)暴醫(yī)生,轉為網(wǎng)暴父母

      10歲患兒被切除6個器官迎來反轉!輿論從網(wǎng)暴醫(yī)生,轉為網(wǎng)暴父母

      垛垛糖
      2025-11-03 14:51:45
      突發(fā)!香港演員林尚武因心臟病去世享年75歲,生前患癌31年

      突發(fā)!香港演員林尚武因心臟病去世享年75歲,生前患癌31年

      開開森森
      2025-11-05 11:27:09
      2025-11-06 02:51:00
      DeepTech深科技 incentive-icons
      DeepTech深科技
      麻省理工科技評論獨家合作
      15823文章數(shù) 514266關注度
      往期回顧 全部

      科技要聞

      大轉彎!特朗普再提名馬斯克盟友任NASA局長

      頭條要聞

      俄士兵連遭烏軍7架無人機襲擊奇跡生還 視頻披露

      頭條要聞

      俄士兵連遭烏軍7架無人機襲擊奇跡生還 視頻披露

      體育要聞

      贏下皇馬,會是利物浦的轉折點嗎?

      娛樂要聞

      港星林尚武突發(fā)心臟病去世

      財經(jīng)要聞

      事關加快建設金融強國 中央金融辦發(fā)聲

      汽車要聞

      智己LS9入局"9系"混戰(zhàn) 全尺寸SUV市場迎來新變量

      態(tài)度原創(chuàng)

      教育
      本地
      手機
      藝術
      公開課

      教育要聞

      最新:2026年南京中考體育考試內容及評分標準曝光!

      本地新聞

      這屆干飯人,已經(jīng)把博物館吃成了食堂

      手機要聞

      蘋果Shazam更新26.0版:液態(tài)玻璃界面煥新登場

      藝術要聞

      一眼攝魂的魔術手:泰國畫師 Razaras 的作品唯美圣潔!自帶發(fā)光特效!

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 精品自拍偷拍一区二区三区| 国产亚洲tv在线观看| 国产乱码1卡二卡3卡四卡5| 狠狠色丁香婷婷亚洲综合| 国产日韩av二区三区| 年日韩激情国产自偷亚洲| 九九热视频在线观看视频| 动漫AV纯肉无码AV电影网| 亚洲av无码片在线播放| 中文字幕日韩区二区三区| 亚洲国产高清第一第二区| 免费 黄 色 人成 视频 在 线 | 国产专区一线二线三线码| 九九热免费精品在线视频| 久久综合给合久久狠狠狠| 四虎影视永久无码精品| 国产成AV人片久青草影院| 欧美性xxxxx极品| 亚洲成在人线AV品善网好看| 久久精产国品一二三产品| 成人免费无码大片A毛片抽搐色欲| 亚洲国产精品特色大片观看完整版| 暖暖 免费 高清 日本 在线观看5| 免费观看全黄做爰大片| 无码AV无码免费一区二区| 中文字幕精品无码一区二区三区| 九九热在线视频观看最新| 中文字幕人妻精品在线| 麻豆精品在线| 人妻少妇久久久久久97人妻| 看免费的无码区特aa毛片| 亚洲综合小说另类图片五月天| 午夜福利视频| 色道久久综合亚洲精品蜜桃 | 精品一区二区三区在线播放视频 | 蜜桃精品成人影片| 国产尤物精品自在拍视频首页 | 欧美老少配性行为| 安溪县| 成人无码午夜在线观看| 国产AV福利第一精品|