<blockquote id="ue9b1"></blockquote>
    
    

    <style id="ue9b1"></style>
      <sub id="ue9b1"><p id="ue9b1"><form id="ue9b1"></form></p></sub>

      <strong id="ue9b1"><button id="ue9b1"><mark id="ue9b1"></mark></button></strong>
      成年午夜性影院,下面一进一出好爽视频,国产无遮挡又黄又爽又色,国产精品爽爽v在线观看无码,国产人妻久久精品一区二区三区,国产伦精品一区二区三区免费迷,国产欧美精品一区二区三区,日韩精品一区二区三区视频
      網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

      29所頂尖研究機(jī)構(gòu)首次建立量化評(píng)估通用人工智能的完整框架

      0
      分享至

      論文編號(hào):arXiv:2510.18212】

      2025年10月21日,斯坦福大學(xué)、MIT、加州大學(xué)伯克利分校等全球29所頂尖研究機(jī)構(gòu)的學(xué)者,首次建立量化評(píng)估通用人工智能(AGI)的完整框架,為判斷AI是否達(dá)到人類認(rèn)知水平提供了客觀標(biāo)準(zhǔn),打破了此前AGI定義模糊的困境。



      一、AGI 評(píng)估框架的構(gòu)建:以人類智能為參照

      1. AGI的核心定義

      AGI即通用人工智能,指AI能像受過良好教育的成年人一樣,應(yīng)對(duì)各類認(rèn)知任務(wù),而非僅擅長(zhǎng)單一領(lǐng)域(如下棋、寫文章),類似“全科醫(yī)生”,可應(yīng)對(duì)多數(shù)場(chǎng)景的認(rèn)知需求。此前,“聰明”的標(biāo)準(zhǔn)因人而異,有人認(rèn)為會(huì)下圍棋是聰明,有人覺得會(huì)寫詩(shī)才算,這種模糊性讓AGI研究難以衡量進(jìn)展,而新框架徹底改變了這一現(xiàn)狀。

      2. 框架設(shè)計(jì)的理論基礎(chǔ)

      研究團(tuán)隊(duì)借鑒心理學(xué)權(quán)威的CHC理論(Cattell-Horn-Carroll 理論)—— 該理論經(jīng)百年實(shí)驗(yàn)與數(shù)據(jù)分析驗(yàn)證,拆解人類智能為可測(cè)量部分,是當(dāng)前主流智力測(cè)試的核心框架。基于此,團(tuán)隊(duì)將AGI拆解為10個(gè)認(rèn)知領(lǐng)域,每個(gè)領(lǐng)域占10分,總分 100 分代表完全達(dá)到人類認(rèn)知水平,這套評(píng)分系統(tǒng)被命名為 “AGI分?jǐn)?shù)”。

      二、AI“體檢報(bào)告”:驚人的“鋸齒狀”能力分布

      當(dāng)用該框架測(cè)試GPT-4與GPT-5時(shí),結(jié)果超出預(yù)期:GPT-4總分僅27分,GPT-5 為58分,且分?jǐn)?shù)分布極不均衡,呈現(xiàn) “鋸齒狀”—— 部分領(lǐng)域接近滿分,部分領(lǐng)域卻得零分,如同嚴(yán)重偏科的學(xué)生。

      1. 突出的“強(qiáng)項(xiàng)”

      GPT-5在知識(shí)儲(chǔ)備(測(cè)常識(shí)、科學(xué)、社會(huì)、歷史知識(shí),如 “月球?yàn)楹问冀K同一面朝向地球”)、讀寫能力(讀懂復(fù)雜文本、寫邏輯嚴(yán)密文章,如解析產(chǎn)品說明書、撰寫 “遠(yuǎn)程工作利弊”文)、數(shù)學(xué)能力(覆蓋算術(shù)到微積分,如計(jì)算公司三個(gè)月工資支出)上表現(xiàn)優(yōu)異,均接近或達(dá)到10分(滿分),堪稱“學(xué)霸”級(jí)別。

      2. 致命的“弱項(xiàng)”

      長(zhǎng)期記憶存儲(chǔ)是最大短板,GPT-4與GPT-5均得0分:就像人聊完天后轉(zhuǎn)身就忘,次日見面需重新介紹,無法積累經(jīng)驗(yàn);記憶檢索雖在速度上得4分,但“幻覺”問題嚴(yán)重(如編造 “拿破侖南非戰(zhàn)役戰(zhàn)略”),避免幻覺得零分;GPT-4的視覺、聽覺處理能力為零,GPT-5雖有突破(視覺4分、聽覺6分),但仍遠(yuǎn)未完善;即時(shí)推理、工作記憶、多模態(tài)處理速度等領(lǐng)域,兩者得分也普遍偏低。

      3. 弱項(xiàng)的“補(bǔ)償策略”:能力扭曲

      當(dāng)前AI靠“能力扭曲”彌補(bǔ)缺陷,比如用超大“工作記憶”(類似隨身帶筆記本)替代長(zhǎng)期記憶,或依賴外部搜索工具解決“幻覺”問題。但這種策略低效且脆弱——筆記本丟了、搜索受限,系統(tǒng)就會(huì)崩潰,無法應(yīng)對(duì)需要持續(xù)學(xué)習(xí)的場(chǎng)景。

      三、十項(xiàng)認(rèn)知領(lǐng)域測(cè)試:全方位掃描AI“大腦”

      研究團(tuán)隊(duì)如同打造 “AI體檢中心”,對(duì)10個(gè)認(rèn)知領(lǐng)域逐一檢測(cè),全面暴露AI能力短板:

      1. 知識(shí)儲(chǔ)備:GPT-4得8分,GPT-5得9分,“知識(shí)面廣”;
      2. 讀寫能力:GPT-4得6分,GPT-5得10分,“理解與生成文字達(dá)人類水平”;
      3. 數(shù)學(xué)能力:GPT-4得4分,GPT-5得10分,“新一代AI實(shí)現(xiàn)質(zhì)的飛躍”;
      4. 即時(shí)推理:GPT-4得0分,GPT-5得7分,“需臨場(chǎng)分析,仍不完美”;
      5. 工作記憶:GPT-4得2分,GPT-5得4分,“臨時(shí)存儲(chǔ)信息能力弱”;
      6. 長(zhǎng)期記憶存儲(chǔ):均得0分,“無法長(zhǎng)久保存新信息”;
      7. 長(zhǎng)期記憶檢索:速度得4分,避免幻覺得0分,“常編造錯(cuò)誤信息”;
      8. 視覺處理:GPT-4得0分,GPT-5得4分,“有基礎(chǔ)能力但不完善”;
      9. 聽覺處理:GPT-4得0分,GPT-5得6分,“優(yōu)于視覺但仍需提升”;
      10. 速度:讀寫、簡(jiǎn)單計(jì)算得3分,多模態(tài)處理速度差,“GPT-5因‘思考’慢拖后腿”。



      四、透過結(jié)果看本質(zhì):AI“智能”的特殊性

      當(dāng)前AI的“聰明”是“碎片化”的,而非“通用”的:擅長(zhǎng)處理已有海量數(shù)據(jù)(因此知識(shí)、讀寫、數(shù)學(xué)強(qiáng)),但弱于學(xué)習(xí)新事物、靈活應(yīng)用(長(zhǎng)期記憶、推理等弱)。比如教 AI 新工作流程,人類示范幾次就能記住并舉一反三,而AI要么記不住,要么需反復(fù)輸入流程,還無法判斷應(yīng)用場(chǎng)景。

      研究團(tuán)隊(duì)用 “發(fā)動(dòng)機(jī)” 類比揭示關(guān)鍵:AI像有超強(qiáng)渦輪增壓器(知識(shí)儲(chǔ)備)、高效變速箱(語(yǔ)言處理)的發(fā)動(dòng)機(jī),但冷卻系統(tǒng)(長(zhǎng)期記憶)、潤(rùn)滑系統(tǒng)(記憶檢索)幾乎失效。且智能各部分高度依賴 —— 數(shù)學(xué)再?gòu)?qiáng),推理弱也解不了復(fù)雜應(yīng)用題;理解電影需視覺、聽覺、記憶、推理協(xié)同,缺一環(huán)就會(huì)卡頓。因此,GPT-5的58分雖看似 “及格”,卻因關(guān)鍵部件缺失,遠(yuǎn)非真正的 “通用智能”。

      五、研究的實(shí)際意義:為AGI發(fā)展指路

      這項(xiàng)研究不僅是“AI能力測(cè)評(píng)”,更給普通人、研究者、開發(fā)者帶來重要啟示:

      1. 建立理性預(yù)期:AI離AGI仍有長(zhǎng)路,雖部分領(lǐng)域驚艷,但基礎(chǔ)能力缺陷大,無需恐慌也別盲目樂觀;
      2. 指明研究方向:?jiǎn)渭償U(kuò)大模型規(guī)模、增加數(shù)據(jù)量不夠,需突破長(zhǎng)期記憶等架構(gòu)問題(如動(dòng)態(tài)調(diào)整模型參數(shù),讓AI“成長(zhǎng)”),如同建摩天大樓需先固地基;
      3. 指導(dǎo) AI 應(yīng)用:設(shè)計(jì)產(chǎn)品時(shí)要規(guī)避AI短板——不能指望AI助手次日主動(dòng)推進(jìn)項(xiàng)目,需每次補(bǔ)充背景信息,優(yōu)化人機(jī)協(xié)作流程;
      4. 警惕 “幻覺” 風(fēng)險(xiǎn):AI輸出信息時(shí),需獨(dú)立驗(yàn)證,尤其做重要決策時(shí),不能完全依賴;
      5. 理解智能多樣性:智能含多維度,不能簡(jiǎn)單用 “聰明 / 笨” 評(píng)判,無論人類還是 AI,都需全面發(fā)展。

      這項(xiàng)研究的最大貢獻(xiàn),是給了AI領(lǐng)域一把“客觀尺子”——讓人們跳出炒作與恐慌,清晰認(rèn)知 “AI當(dāng)前在哪”,進(jìn)而規(guī)劃 “未來去哪、怎么去”,為AGI的穩(wěn)健發(fā)展奠定了基礎(chǔ)。

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      馬斯克漲完工資一高興,把FSD對(duì)華開放時(shí)間自曝了

      馬斯克漲完工資一高興,把FSD對(duì)華開放時(shí)間自曝了

      智能車參考
      2025-11-07 18:51:56
      一年蒸發(fā)了10億元,從網(wǎng)紅白酒到狗都不喝,究竟發(fā)生了什么?

      一年蒸發(fā)了10億元,從網(wǎng)紅白酒到狗都不喝,究竟發(fā)生了什么?

      法老不說教
      2025-11-06 20:45:28
      清朝“大辮子”到底多臟?滿頭油光,虱子滿頭,十步之內(nèi)不能站人

      清朝“大辮子”到底多臟?滿頭油光,虱子滿頭,十步之內(nèi)不能站人

      小豫講故事
      2025-11-05 06:00:03
      炸鍋了炸鍋了!港圈突然爆出大新聞:謝霆鋒居然通過法律協(xié)議

      炸鍋了炸鍋了!港圈突然爆出大新聞:謝霆鋒居然通過法律協(xié)議

      小光侃娛樂
      2025-11-05 10:55:03
      軍事專家:福建艦讓一些國(guó)外決策者變冷靜了

      軍事專家:福建艦讓一些國(guó)外決策者變冷靜了

      環(huán)球網(wǎng)資訊
      2025-11-07 15:47:09
      菲律賓進(jìn)入災(zāi)難狀態(tài),在菲華人:當(dāng)?shù)胤孔佣紱]了,只剩泥巴

      菲律賓進(jìn)入災(zāi)難狀態(tài),在菲華人:當(dāng)?shù)胤孔佣紱]了,只剩泥巴

      新京報(bào)
      2025-11-06 22:11:17
      全運(yùn)會(huì)開門紅!朱婷27分全場(chǎng)最高,河南女排3-0完勝天津隊(duì)

      全運(yùn)會(huì)開門紅!朱婷27分全場(chǎng)最高,河南女排3-0完勝天津隊(duì)

      全景體育V
      2025-11-07 20:26:25
      巴總統(tǒng):已正式通知中國(guó),退出一帶一路計(jì)劃,我方回應(yīng)4個(gè)字

      巴總統(tǒng):已正式通知中國(guó),退出一帶一路計(jì)劃,我方回應(yīng)4個(gè)字

      花花娛界
      2025-11-07 20:53:23
      我在部隊(duì)當(dāng)了5年通訊兵,退伍發(fā)現(xiàn)村后頭的信號(hào)塔每晚都準(zhǔn)時(shí)閃3下

      我在部隊(duì)當(dāng)了5年通訊兵,退伍發(fā)現(xiàn)村后頭的信號(hào)塔每晚都準(zhǔn)時(shí)閃3下

      五元講堂
      2025-11-05 10:35:02
      長(zhǎng)沙醫(yī)生不雅事件再升級(jí)!網(wǎng)傳祖某某妻子為護(hù)士長(zhǎng),已經(jīng)申請(qǐng)調(diào)崗

      長(zhǎng)沙醫(yī)生不雅事件再升級(jí)!網(wǎng)傳祖某某妻子為護(hù)士長(zhǎng),已經(jīng)申請(qǐng)調(diào)崗

      火山詩(shī)話
      2025-11-07 20:55:08
      多年的付出毀于一“蛋”,滿屏都曾醫(yī)生,網(wǎng)友透露更多細(xì)節(jié)

      多年的付出毀于一“蛋”,滿屏都曾醫(yī)生,網(wǎng)友透露更多細(xì)節(jié)

      魔都姐姐雜談
      2025-11-07 10:22:54
      廣東一保安和AI聊天近6個(gè)月,打印出50萬字聊天記錄要討說法:我以為它說的話、發(fā)來的簽約協(xié)議都是真的……

      廣東一保安和AI聊天近6個(gè)月,打印出50萬字聊天記錄要討說法:我以為它說的話、發(fā)來的簽約協(xié)議都是真的……

      觀威海
      2025-11-07 18:22:03
      “最強(qiáng)地級(jí)市”56歲副市長(zhǎng)官宣落馬,政府官網(wǎng)緊急刪除個(gè)人信息

      “最強(qiáng)地級(jí)市”56歲副市長(zhǎng)官宣落馬,政府官網(wǎng)緊急刪除個(gè)人信息

      魯中晨報(bào)
      2025-11-07 13:39:03
      巴西可能沒救了

      巴西可能沒救了

      虛聲
      2025-11-06 20:45:05
      40歲女醫(yī)生曾琦的日常工作被披露!一天“精準(zhǔn)卡點(diǎn)”的戰(zhàn)斗模式…

      40歲女醫(yī)生曾琦的日常工作被披露!一天“精準(zhǔn)卡點(diǎn)”的戰(zhàn)斗模式…

      火山詩(shī)話
      2025-11-07 11:46:47
      網(wǎng)傳:太子集團(tuán)高管交完保釋金后離開法院,面帶笑容,輕松淡定!

      網(wǎng)傳:太子集團(tuán)高管交完保釋金后離開法院,面帶笑容,輕松淡定!

      眼光很亮
      2025-11-07 17:17:57
      特朗普稱已與中俄領(lǐng)導(dǎo)人討論無核化,外交部:中國(guó)核力量與美俄完全不在一個(gè)量級(jí)

      特朗普稱已與中俄領(lǐng)導(dǎo)人討論無核化,外交部:中國(guó)核力量與美俄完全不在一個(gè)量級(jí)

      澎湃新聞
      2025-11-07 15:18:37
      為啥大家不提中國(guó)空間站了?因?yàn)闆]臉提,跟國(guó)際空間站差距太大!

      為啥大家不提中國(guó)空間站了?因?yàn)闆]臉提,跟國(guó)際空間站差距太大!

      百態(tài)人間
      2025-11-07 05:00:03
      西貝“閉店潮”大反轉(zhuǎn),賈國(guó)龍真急了!

      西貝“閉店潮”大反轉(zhuǎn),賈國(guó)龍真急了!

      李東陽(yáng)朋友圈
      2025-11-07 14:08:10
      武漢大學(xué)原校長(zhǎng)劉道玉逝世,享年92歲

      武漢大學(xué)原校長(zhǎng)劉道玉逝世,享年92歲

      界面新聞
      2025-11-07 19:56:14
      2025-11-08 00:24:49
      DATAVIEW
      DATAVIEW
      時(shí)刻討論和分析世界、行業(yè)、AI等熱門話題,只提取高價(jià)值信息
      33文章數(shù) 2關(guān)注度
      往期回顧 全部

      科技要聞

      75%贊成!特斯拉股東同意馬斯克天價(jià)薪酬

      頭條要聞

      家長(zhǎng)稱男嬰被兩個(gè)不滿12周歲女孩害死:拿她們沒辦法

      頭條要聞

      家長(zhǎng)稱男嬰被兩個(gè)不滿12周歲女孩害死:拿她們沒辦法

      體育要聞

      是天才更是強(qiáng)者,18歲的全紅嬋邁過三道坎

      娛樂要聞

      王家衛(wèi)的“看人下菜碟”?

      財(cái)經(jīng)要聞

      荷蘭政府:安世中國(guó)將很快恢復(fù)芯片供應(yīng)

      汽車要聞

      美式豪華就是舒適省心 林肯航海家場(chǎng)地試駕

      態(tài)度原創(chuàng)

      旅游
      手機(jī)
      藝術(shù)
      教育
      公開課

      旅游要聞

      四川這座村落為何吸引全球目光?探訪“最佳旅游鄉(xiāng)村”

      手機(jī)要聞

      小米17 Ultra:潛望鏡頭已清晰!小米17系列:銷量已突破200萬!

      藝術(shù)要聞

      Donna Young:美國(guó)當(dāng)代藝術(shù)家

      教育要聞

      廣東石油化工學(xué)院升學(xué)就業(yè)“潛規(guī)則”?3屆學(xué)長(zhǎng)數(shù)據(jù)透漏這些真相!

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 亚洲精品一区二区口爆| 国产麻豆精品一区一区三区| 国产亚洲精品黑人粗大精选| 国产精品日韩中文字幕熟女 | 黄页网址大全免费观看| 翁牛特旗| 亚洲五月天一区二区三区| 国产精品一区久久人人爽| 国产精品福利自产拍久久| 亚洲鸥美日韩精品久久| 国产欧美另类精品久久久 | 国产不卡精品视频男人的天堂| 成人无码潮喷在线观看| 美女一区二区三区亚洲麻豆| 精品一区二区成人码动漫| 亚洲激情一区二区三区在线| 黄网站色视频免费观看| 日韩精品一二区在线观看| 国产极品丝尤物在线观看| 无码av不卡免费播放| 欧美性猛交xxxx乱大交丰满| 午夜福利日本一区二区无码| 久久国产免费观看精品3| 99热久久这里只有精品| 国产mv在线天堂mv免费观看| 国产乱码精品一区二三区| 丁香五月亚洲综合在线国内自拍| 久久久综合九色合综| 秋霞电影院午夜无码免费视频| 亚洲伊人久久综合成人| 欧美一本大道香蕉综合视频| 香格里拉县| 少妇熟女天堂网av| 日韩高清国产中文字幕| 国产精品三级在线观看无码| 亚洲一精品一区二区三区| 起碰免费公开97在线视频| 亚洲熟妇自偷自拍另欧美| 亚洲av影院一区二区三区| 婷婷六月天在线| 姐姐6电视剧在线观看|