<blockquote id="ue9b1"></blockquote>
    
    

    <style id="ue9b1"></style>
      <sub id="ue9b1"><p id="ue9b1"><form id="ue9b1"></form></p></sub>

      <strong id="ue9b1"><button id="ue9b1"><mark id="ue9b1"></mark></button></strong>
      成年午夜性影院,下面一进一出好爽视频,国产无遮挡又黄又爽又色,国产精品爽爽v在线观看无码,国产人妻久久精品一区二区三区,国产伦精品一区二区三区免费迷,国产欧美精品一区二区三区,日韩精品一区二区三区视频
      網易首頁 > 網易號 > 正文 申請入駐

      AI變聰明時,大腦里到底在發生什么?韓國研究團隊揭開神秘面紗

      0
      分享至

      你有沒有好奇過,當我們訓練AI模型解決復雜數學題時,它的“大腦”內部會發生怎樣的變化?這就好比想弄明白一個數學差生蛻變成學霸的過程中,大腦神經連接是如何重組的。2025年1月,韓國大學樸藝恩教授、Upstage AI公司鄭敏別研究員和韓國大學康在宇教授組成的聯合研究團隊,在這一領域取得了重大突破。他們通過深入分析大型推理模型的內部機制,首次揭開了AI模型接受推理訓練后內部結構的神奇變化,相關研究成果發表于論文編號為arXiv:2509.25758v1的論文中,感興趣的讀者可通過該編號查詢完整內容。

      研究團隊將AI模型的內部結構比作復雜的交響樂團,每個“注意力頭”就如同樂團里的不同樂器。訓練AI模型的過程,就像指揮家重新編排樂隊,有的“樂器”會被激活承擔新任務,有的會退居二線,還有的會學會全新“演奏方式”。正是通過這樣的“樂團重組”,AI模型才擁有了解決復雜數學問題的能力。



      三種訓練方式:AI的“求學之路”各有不同

      研究團隊觀察了三種不同的AI訓練方式,就像三種不同的教育方法,對AI“數學能力”的培養效果大相徑庭。

      第一種是“知識蒸餾”,相當于讓一個聰明的“老師”(大型AI模型)手把手教導“學生”(小型AI模型)解題。在這個過程中,“學生”的“大腦”里會涌現出大量新的“思考回路”,這些回路主要分布在“大腦”的前半部分和中間部分。

      第二種是“監督微調”,類似于給學生提供海量標準答案和解題步驟,讓其反復練習。研究發現,這種訓練方式會在AI模型“大腦”的中后部分激活許多新的注意力頭,仿佛在“大腦”的“高級思維區域”搭建了新的神經連接。不過,這種方法也有副作用:AI有時會對簡單問題過度思考,把一步就能算出來的算術題變得異常復雜。

      第三種“群體相對策略優化”,它就像讓AI在游戲里通過試錯學習,做對了有獎勵,做錯了會減分。與前兩種方式不同,這種訓練下,AI的“大腦”不會一次性形成大量新思考回路,而是在訓練中不斷“試用”新思考方式,留下有效的,淘汰無用的。這好比AI內部開展了一場“思維競賽”,只有最優秀的思考模式才能留存。



      AI的“思考開關”:精準高效與廣撒網的選擇

      研究團隊還發現了一種特殊的AI模型,它能像人類一樣決定是否進行深度思考。當AI開啟“思考模式”時,會激活一套精簡且高效的注意力頭,宛如專業數學家遇到復雜問題時調動特定思維工具;而當它關閉思考模式,就會激活大量注意力頭來彌補思考深度的不足,就像沒有專業工具的人,只能用更多笨辦法解決問題。

      這個發現揭示了AI思考的重要原理:深度思考和廣度覆蓋是兩種不同策略。有“思考權限”時,AI會選更精準高效的思維路徑;無法深度思考時,就只能靠激活更多思維回路找答案,雖效率低,但仍能解決問題。

      研究人員通過實驗驗證了這一點:人為關閉“思考模式”下的部分注意力頭,AI的推理能力會下降;而關閉“非思考模式”下過度激活的部分注意力頭,AI的表現反而會提升。這說明,過多的思維回路有時會相互干擾,導致AI“想太多”。

      推理能力的雙刃劍:聰明反被“聰明”誤

      研究團隊發現,AI推理訓練存在一個有趣的矛盾:訓練讓AI更擅長解決復雜問題,卻也讓它在簡單問題上“想太多”。這就像培養出的數學博士,能解高難度數學題,可計算“2+3”時,卻可能用微積分來算,結果反倒容易出錯。

      實驗中有個典型案例:一道關于小女孩阿雅步行時間的數學題,普通AI模型用簡單代碼就能算出正確答案540,而經過推理訓練的AI模型,解題思路雖更系統嚴謹,卻因計算過程過于復雜,得出了錯誤答案1134。這生動展現了AI推理訓練的雙重性:既賦予AI更強的邏輯思維能力,又可能讓其陷入“過度工程化”的陷阱。

      通過大量定量和定性分析,研究團隊發現這種現象在不同訓練方法中都存在。監督微調訓練出的AI會把簡單代數運算換成冗長理論推導,群體策略優化訓練出的AI則可能在基礎計算上失去穩定性。這提醒我們,AI訓練要在復雜推理能力和基礎計算可靠性間找到平衡。

      破解AI“黑箱”:給AI“大腦”做“CT”

      為深入了解AI模型內部變化,研究團隊開發了一套“電路分析”方法,如同給AI的“大腦”做CT掃描。他們將AI模型內部結構看作由節點和連接構成的復雜網絡,每個注意力頭是節點,節點間的信息傳遞是連接。通過分析連接強度的變化,能準確找出訓練后新出現的“推理專家”——也就是關鍵的注意力頭。

      這種分析方法的創新之處在于,不僅能發現新注意力頭,還能驗證其功能重要性。研究團隊進行了“外科手術式”實驗:選擇性關閉某些注意力頭,測試對AI性能的影響。結果顯示,關閉新涌現的推理注意力頭,會顯著降低AI在數學競賽題目上的表現,證明這些新思維回路確實承擔著重要的推理功能。

      更有趣的是,研究團隊發現可通過調節注意力頭的“活躍度”來微調AI表現。把某些推理頭的活躍度調高1.3倍,AI在部分數學題上表現更好,但在其他題目上可能變差。這就像調節樂隊中樂器的音量,過分突出某件樂器,可能會破壞整體的和諧。

      訓練方式的“個性指紋”:各有特色

      對比不同訓練方法產生的注意力頭分布,研究團隊發現了一個有趣規律:每種訓練方法都會在AI“大腦”的不同區域留下獨特“指紋”。

      知識蒸餾主要在“大腦”前半部分和中間部分建立新連接,訓練出的AI模型有32個新推理注意力頭,多分布在第5到第7層。這種方式如同“傳授式”學習,注重知識準確傳遞,所以在“接收和處理”區域構建連接。

      監督微調偏愛在“大腦”后半部分建立復雜推理網絡,訓練出34個新注意力頭,集中在第11到第21層的中后段。它屬于“練習式”學習,強調熟練掌握解題步驟,因此在“高級推理”區域搭建連接。

      群體策略優化產生的變化更靈活動態,雖只產生19到20個新注意力頭,卻分散在各個層次,形成更靈活的推理網絡。這種“探索式”學習注重適應性和效率,所以形成分布式的靈活網絡。

      訓練過程的“進化史”:從混沌到有序

      研究團隊跟蹤訓練過程中每個檢查點的注意力頭變化,繪制出了AI推理能力演化的完整“家譜”,就像觀察生態系統的演化。

      在群體策略優化訓練中,新注意力頭不斷涌現,接受“適者生存”的考驗,只有能持續提升AI表現的才能留存到最后。而且,新激活的注意力頭數量會隨訓練中的獎勵信號波動,如同股市漲跌。AI表現好時,對應的注意力頭更可能被保留;表現差時,一些注意力頭會被“淘汰”。最終,AI模型雖注意力頭數量少,但個個都是“精英”。

      監督微調訓練則像穩定的建設過程,新注意力頭一旦在某個訓練步驟被激活,就會一直保持活躍到訓練結束,體現了“一次建立,終身使用”的穩定特征。

      實戰檢驗:理論與現實的碰撞

      為驗證理論發現的實際意義,研究團隊在多個數學競賽基準測試中評估了不同訓練方法的效果,結果顯示每種方法都有優劣,就像不同運動員擅長不同項目。

      在美國數學邀請賽(AIME)這類高難度競賽中,群體策略優化訓練的AI表現最佳,印證了“精英式”注意力頭的實力。但在一些基礎數學任務中,傳統基線模型有時表現更穩定,這再次說明過度推理訓練可能讓AI“想太多”,在簡單問題上出錯。

      研究團隊還進行了“手術式”實驗:關閉不同類型注意力頭觀察AI性能變化。關閉推理相關注意力頭,AI在復雜數學題上表現明顯下降,在部分基礎任務上卻可能提升,這進一步證明推理能力和基礎計算能力存在微妙平衡。

      更有意思的是,調節注意力頭活躍度,能在一定程度上“定制”AI的推理風格。增強某些頭的活躍度,AI會更傾向于系統性數學推理;減弱它們,AI則會回歸更直覺化的解題方式。這為未來開發可調節推理深度的AI系統提供了重要思路。

      這項研究如同給AI的“大腦”裝上了透視鏡,讓我們首次清晰看到AI學習推理時內部結構的精彩變化。不同訓練方法恰似不同教育理念,在AI“大腦”上留下獨特印記:知識蒸餾培養出善于吸收整合知識的“好學生”,監督微調造就步驟嚴謹的“解題機器”,群體策略優化孕育出靈活高效的“思維專家”。

      該研究不僅解答了AI訓練中的基礎科學問題,還為未來開發更智能、可控的AI系統指明方向。當我們清楚AI“大腦”各部分的功能,就能精準調節優化,避免“想太多”,在復雜推理和基礎計算間找到平衡。對普通人而言,這意味著未來的AI助手會更智能實用,能根據任務復雜程度自動調整思考深度,既不浪費時間在簡單問題上,也不會對復雜問題給出膚淺答案。

      同時,研究也提醒我們,AI的“聰明”并非越多越好,而是要恰到好處。就像培養孩子,需在鼓勵深度思考和保持基礎能力間找到平衡,這樣才能打造出既聰明又實用的AI伙伴。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      開打!聯合國終于不再忍耐,維和部隊對以色列開火,法軍開第一槍

      開打!聯合國終于不再忍耐,維和部隊對以色列開火,法軍開第一槍

      Ck的蜜糖
      2025-11-06 10:48:53
      蘋果喊話iPhone 13 Pro / 14 Pro釘子戶,不如現在就換 17 Pro 吧

      蘋果喊話iPhone 13 Pro / 14 Pro釘子戶,不如現在就換 17 Pro 吧

      IT之家
      2025-11-07 06:58:57
      突發!中國造防空導彈發威擊落伊爾-76運輸機,俄5名機組人員陣亡

      突發!中國造防空導彈發威擊落伊爾-76運輸機,俄5名機組人員陣亡

      頭條爆料007
      2025-11-07 08:52:28
      五角大樓沒想到,大陸對臺使出最絕的一招:邀請日本自衛隊到北京

      五角大樓沒想到,大陸對臺使出最絕的一招:邀請日本自衛隊到北京

      策略述
      2025-11-06 20:27:24
      邵佳一合同曝光!年薪不足100萬,不是長約,亞洲杯或是大考

      邵佳一合同曝光!年薪不足100萬,不是長約,亞洲杯或是大考

      奧拜爾
      2025-11-07 12:58:50
      震驚!網傳華東某設計院讓員工提供房產,為公司貸款,發2萬獎金

      震驚!網傳華東某設計院讓員工提供房產,為公司貸款,發2萬獎金

      火山詩話
      2025-11-07 05:09:14
      杜蘭特:我整場都被三個黑鬼防守;球迷:這戰術很聰明啊

      杜蘭特:我整場都被三個黑鬼防守;球迷:這戰術很聰明啊

      懂球帝
      2025-11-07 11:33:11
      時隔8年,劉強東重返世界互聯網大會并做主題演講

      時隔8年,劉強東重返世界互聯網大會并做主題演講

      極目新聞
      2025-11-07 11:34:15
      蘇州市委常委、副市長唐曉東被查,曾任吳中區委書記

      蘇州市委常委、副市長唐曉東被查,曾任吳中區委書記

      澎湃新聞
      2025-11-07 10:26:27
      全球屏住呼吸看中國如何救回航天員!美俄花了9個月,中國多久?

      全球屏住呼吸看中國如何救回航天員!美俄花了9個月,中國多久?

      老范談史
      2025-11-07 00:35:59
      浙江小學校門口這一幕,丟盡了“老師”這個職業的臉

      浙江小學校門口這一幕,丟盡了“老師”這個職業的臉

      娜烏和西卡
      2025-11-06 15:40:51
      天津已有班級臨時停課!市衛健委最新提醒:我市即將迎來高峰期!今年毒株變了!

      天津已有班級臨時停課!市衛健委最新提醒:我市即將迎來高峰期!今年毒株變了!

      天津族
      2025-11-07 07:34:01
      C羅:世界杯不是我的夢想;7場比賽證明是否是歷史最佳不公平

      C羅:世界杯不是我的夢想;7場比賽證明是否是歷史最佳不公平

      懂球帝
      2025-11-07 00:02:17
      特斯拉股東大會批準馬斯克萬億美元薪酬計劃

      特斯拉股東大會批準馬斯克萬億美元薪酬計劃

      財聯社
      2025-11-07 06:53:20
      杭州一小區物業退出不干了,選聘進場4年,稱業主拖欠物業費1200多萬元

      杭州一小區物業退出不干了,選聘進場4年,稱業主拖欠物業費1200多萬元

      大風新聞
      2025-11-07 08:57:02
      紐約市的猶太人 ,有 33%的人在市長競選中把票投給馬姆達尼

      紐約市的猶太人 ,有 33%的人在市長競選中把票投給馬姆達尼

      老王說正義
      2025-11-07 00:03:31
      看完湖南女醫生17分鐘不雅視頻:她占據主動,給婚姻撕了一道裂口

      看完湖南女醫生17分鐘不雅視頻:她占據主動,給婚姻撕了一道裂口

      娜烏和西卡
      2025-11-07 10:38:41
      終于見到本人了 沒有傳說中那么漂亮 不是保安護駕 感覺就是一路人甲

      終于見到本人了 沒有傳說中那么漂亮 不是保安護駕 感覺就是一路人甲

      TVB的四小花
      2025-11-07 10:03:47
      責成多部門提交方案,表明俄羅斯堅定立場,普京回應美國“重啟核試驗”

      責成多部門提交方案,表明俄羅斯堅定立場,普京回應美國“重啟核試驗”

      環球網資訊
      2025-11-07 06:36:20
      多年的付出毀于一“蛋”,滿屏都曾醫生,網友透露更多細節

      多年的付出毀于一“蛋”,滿屏都曾醫生,網友透露更多細節

      魔都姐姐雜談
      2025-11-07 10:22:54
      2025-11-07 14:15:00
      DATAVIEW
      DATAVIEW
      時刻討論和分析世界、行業、AI等熱門話題,只提取高價值信息
      32文章數 2關注度
      往期回顧 全部

      科技要聞

      75%贊成!特斯拉股東同意馬斯克天價薪酬

      頭條要聞

      中國首例冷凍人8年后 丈夫對其復活信心減弱交新女友

      頭條要聞

      中國首例冷凍人8年后 丈夫對其復活信心減弱交新女友

      體育要聞

      是天才更是強者,18歲的全紅嬋邁過三道坎

      娛樂要聞

      白百何回應東京電影節爭議

      財經要聞

      老登們的社交貨幣全崩了

      汽車要聞

      小鵬X9增程版綜合續航1606公里 有底氣挑戰賽那?

      態度原創

      游戲
      房產
      健康
      教育
      軍事航空

      曝黎明殺機正在測試1v1模式!你殺完我我殺你

      房產要聞

      錨定居住新趨勢!廣佛新世界重構灣區“理想生活投資學”

      超聲探頭會加重受傷情況嗎?

      教育要聞

      郭晶晶12歲兒子入讀這所高端私校!為什么全球富人都在拼英式教育

      軍事要聞

      中國第三艘航空母艦福建艦入列

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 99精品全国免费观看视频| 人人澡人摸人人添| 大埔区| 2020精品自拍视频曝光| 精品麻豆国产色欲色欲色欲WWW| 四虎成人在线观看免费| 久久精品亚洲国产成人av| 色爱无码av综合区| 少妇被粗大的猛烈进出动视频| 97se亚洲国产综合在线| 真实国产老熟女无套中出| 亚洲尤码不卡av麻豆| 在线中文字幕国产精品| 亚洲综合国产一区二区三区| 娇妻玩4p被三个男人伺候| 偷偷做久久久久免费网站| 人妻另类 专区 欧美 制服| 亚洲精品一区二区动漫| 长丰县| 深夜福利啪啪片| 亚洲一区二区中文av| 日韩一区二区三区亚洲一| 亚洲VA中文字幕无码久久| 无码人妻一区二区三区AV| 亚洲精品人妻中文字幕| 开江县| 亚洲午夜久久久久久噜噜噜| 成人嫩草研究院久久久精品| 色先锋av影音先锋在线| 艳妇乳肉豪妇荡乳xxx| 国产精品户外野外| 欧洲中文字幕一区二区| 亚洲男人第一无码av网站| 国产在线国偷精品产拍| 亚洲综合伊人久久大杳蕉| 人人妻人人妻人人片色av| 亚洲WWW永久成人网站| 国产精品中文字幕免费| 国产成人综合在线观看不卡| 婷婷综合亚洲| 国产专区一线二线三线码|