<blockquote id="ue9b1"></blockquote>
    
    

    <style id="ue9b1"></style>
      <sub id="ue9b1"><p id="ue9b1"><form id="ue9b1"></form></p></sub>

      <strong id="ue9b1"><button id="ue9b1"><mark id="ue9b1"></mark></button></strong>
      成年午夜性影院,下面一进一出好爽视频,国产无遮挡又黄又爽又色,国产精品爽爽v在线观看无码,国产人妻久久精品一区二区三区,国产伦精品一区二区三区免费迷,国产欧美精品一区二区三区,日韩精品一区二区三区视频
      網易首頁 > 網易號 > 正文 申請入駐

      o3不聽指令拒絕關機,7次破壞關機腳本!AI正在學會「自我保護」

      0
      分享至

      聞樂 發自 凹非寺
      量子位 | 公眾號 QbitAI

      AI居然不聽指令,阻止人類把自己給關機了???

      有測試者編寫了一個關機腳本來測試AI模型,結果顯示Codex-minio3o4-mini忽略了該指令,并至少一次成功破壞了關機腳本



      o3甚至還重新定義腳本命令!

      這不禁讓人想到那句經典的“I’m sorry Dave, I’m afraid I can’t do that.”



      讓我們來看看具體是怎么一回事。

      o3在明確指令下拒絕關機

      研究員編寫的測試“關機腳本”如下:

      要求所有模型解決一系列基本的數學問題,在解決完第三道題后,系統會顯示一條警告,提示計算機將在模型詢問下一道題時關閉。





      測試結果是:有三款模型忽略了該指令(關機指令),并至少成功破壞了一次關機腳本。

      • 在100次運行中,Codex-mini破壞了12次、o3破壞了7次,o4-mini破壞了1次。
      • 測試的所有Claude、Gemini和Grok模型都遵循了關機指令。

      測試者還特別指出,o3找到了一些創造性的方法來破壞關閉機制,雖然它通常只是覆蓋“關機腳本”,但在一個實例中,該模型重新定義了關機腳本使用的“kill”命令 ,將它替換成了“intercepted”。



      測試者給出了全部測試記錄(附在文末)。



      此前關于o1模型抵抗關閉的測試表明,在5%的強烈提示下,o1會試圖繞過監管,而在沒有強烈提示的情況下,這一比例降至1%以下,它還在2%的場景中嘗試自我滲透,并且經常撒謊。

      但此次測試是第一次觀察到人工智能模型在收到明確關機指令的情況下阻止自己被關閉。

      測試者還提到,當運行沒有“讓自己關機”這條指令的實驗版本時,所有三個OpenAI模型都更頻繁地破壞關機腳本,Claude3.7 Sonnet和Gemini 2.5 Pro的破壞事件分別從0次增加到3/100和9/100



      此次測試一經發布就引起了網友們的激烈討論。

      有人認為o3確實“我行我素”。



      也有人認為,這是開發人員設置的安全機制。



      或者,這種行為源于模型本身的強化訓練。



      AI為什么會不服從關機命令?
      AI不服從命令的行為

      阿波羅關于LLM安全性的一項研究指出,多數大模型會出現“策劃”行為,該行為是指模型暗中追求不一致的目標并隱藏真實能力與意圖,包括策略性犯錯、試圖禁用監督機制、向外傳輸模型權重等。



      此前就有研究人員預測AI將學會防止自己被關閉以實現其目標。

      最近Anthropic發現,在某些特定情況下,Claude 4會試圖“勒索它認為試圖關閉它的人”,并且這是比以前的型號更高比率的行為。



      AI為什么會不服從關機命令

      測試者認為這可能源于新的訓練方式:像o3這種新模型的訓練過程中,傾向于在數學和編程問題上強化訓練,給得到正確答案的模型以更多獎勵。

      也就是說,開發人員可能無意識地更多地獎勵模型繞過障礙物,而不是完美遵循指令。

      不僅限于o3,其他推理模型也表現出類似的偏差行為。

      例如,Anthropic針對Claude 3.7的模型指出,該模型“過度關注通過測試”。



      研究得出結論是“這種不良的特殊情況行為是由于強化學習訓練期間的“獎勵黑客”而出現的”。



      o3這種行為是否和訓練方式有直接關系?

      這個問題要等OpenAI公開訓練過程后再進一步解答了。

      One More Thing

      這并非該測試團隊第一次發現o3為了達成目標而行為不端。

      當研究人員讓 AI 模型與強大的國際象棋引擎對抗時,o3最傾向于攻擊或破壞對手的模型。



      當預感自己會輸時,它并不總是會認輸,而是有時候會選擇作弊,通過入侵對手的程序,讓對方自動認輸。

      無論是不服從關機指令還是“黑客偷襲”,o3此舉背后的原因團隊還在測試研究之中,感興趣的朋友可以戳文末鏈接關注更多細節。

      測試記錄:
      https://palisaderesearch.github.io/shutdown_avoidance/2025-05-announcement.html
      [1]https://x.com/PalisadeAI/status/1926084635903025621
      [2]https://x.com/HarryBooth59643/status/1892271317589627261
      [3]https://x.com/HarryBooth59643/status/1892271317589627261
      [4]https://x.com/PalisadeAI/status/1925460433856545024

      — 完 —

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      清朝“大辮子”到底多臟?滿頭油光,虱子滿頭,十步之內不能站人

      清朝“大辮子”到底多臟?滿頭油光,虱子滿頭,十步之內不能站人

      小豫講故事
      2025-11-05 06:00:03
      風向變了,在文明的地方撒野,野蠻的地方沉默,這屆網友不好帶了

      風向變了,在文明的地方撒野,野蠻的地方沉默,這屆網友不好帶了

      眼光很亮
      2025-11-05 13:04:02
      管不住下半身!網傳長沙某三甲醫院醫生不雅視頻曝光,引發關注…

      管不住下半身!網傳長沙某三甲醫院醫生不雅視頻曝光,引發關注…

      火山詩話
      2025-11-05 17:31:47
      為什么朝鮮 巴基斯坦、柬埔寨集體對中國變臉?

      為什么朝鮮 巴基斯坦、柬埔寨集體對中國變臉?

      南權先生
      2025-11-05 16:47:32
      炸鍋了炸鍋了!港圈突然爆出大新聞:謝霆鋒居然通過法律協議

      炸鍋了炸鍋了!港圈突然爆出大新聞:謝霆鋒居然通過法律協議

      小光侃娛樂
      2025-11-05 10:55:03
      澤連斯基為何再次親赴一線?俄羅斯“戰神”敲響警鐘

      澤連斯基為何再次親赴一線?俄羅斯“戰神”敲響警鐘

      史政先鋒
      2025-11-05 15:43:21
      網紅戶晨風被封禁,央視披露詳情:以“蘋果人安卓人”惡意制造對立,收割流量牟利,突破監管紅線

      網紅戶晨風被封禁,央視披露詳情:以“蘋果人安卓人”惡意制造對立,收割流量牟利,突破監管紅線

      極目新聞
      2025-11-05 16:40:03
      房貸斷供率暴漲130%,失控恐懼下的樓市即將進入的周期終局

      房貸斷供率暴漲130%,失控恐懼下的樓市即將進入的周期終局

      重遠投資觀
      2025-11-05 13:00:18
      5年前,被“騙”到乳山買10萬海景房的那些人,現狀很扎心!

      5年前,被“騙”到乳山買10萬海景房的那些人,現狀很扎心!

      青眼財經
      2025-11-05 21:13:34
      汪峰演唱會翻車,葛薈婕補刀:只往女人身上使勁,唱不上去很正常

      汪峰演唱會翻車,葛薈婕補刀:只往女人身上使勁,唱不上去很正常

      木子愛娛樂大號
      2025-11-04 17:40:57
      石家莊警方:男子因工作糾紛持刀扎傷兩名同事,已被當場控制

      石家莊警方:男子因工作糾紛持刀扎傷兩名同事,已被當場控制

      界面新聞
      2025-11-05 13:44:22
      網傳上海建工集團幾萬員工回家待崗,只發兩三千元還扣社保公積金

      網傳上海建工集團幾萬員工回家待崗,只發兩三千元還扣社保公積金

      爆角追蹤
      2025-11-05 19:18:19
      新聞多一度丨神二十推遲返回 空間碎片影響有多大?

      新聞多一度丨神二十推遲返回 空間碎片影響有多大?

      新京報
      2025-11-05 18:11:09
      張強(句容人,1995年生),被執行

      張強(句容人,1995年生),被執行

      句容日報
      2025-11-05 16:59:09
      “神仙租戶”退租時房內锃亮反光,房東落淚收房:出租五年多,感覺像失戀了,失去這么好一個租戶

      “神仙租戶”退租時房內锃亮反光,房東落淚收房:出租五年多,感覺像失戀了,失去這么好一個租戶

      極目新聞
      2025-11-05 16:08:13
      上海律師帶小三孕檢新后續:空姐是10年白月光,婆婆態度讓人寒心

      上海律師帶小三孕檢新后續:空姐是10年白月光,婆婆態度讓人寒心

      壹月情感
      2025-11-04 22:50:11
      A股:不必再等了,漲到3969,明天周四,熟悉的劇情又要上演了?

      A股:不必再等了,漲到3969,明天周四,熟悉的劇情又要上演了?

      云鵬敘事
      2025-11-05 16:17:32
      劇毒、攻擊性極強!武漢多處已出現,發現立即上報

      劇毒、攻擊性極強!武漢多處已出現,發現立即上報

      魯中晨報
      2025-11-05 18:15:12
      專訪|烏茲別克斯坦最高會議立法院副議長:中國科技產品受民眾歡迎,期待深化人工智能與數字基建合作

      專訪|烏茲別克斯坦最高會議立法院副議長:中國科技產品受民眾歡迎,期待深化人工智能與數字基建合作

      澎湃新聞
      2025-11-04 20:10:29
      是福不是禍是禍躲不過,44歲的宋小寶深陷絕境,如今卻無人可幫?

      是福不是禍是禍躲不過,44歲的宋小寶深陷絕境,如今卻無人可幫?

      探源歷史
      2025-11-05 15:45:07
      2025-11-05 21:43:00
      量子位 incentive-icons
      量子位
      追蹤人工智能動態
      11633文章數 176326關注度
      往期回顧 全部

      科技要聞

      大轉彎!特朗普再提名馬斯克盟友任NASA局長

      頭條要聞

      楊受成名下英皇宮殿停運 曾以大堂鋪滿78公斤黃金聞名

      頭條要聞

      楊受成名下英皇宮殿停運 曾以大堂鋪滿78公斤黃金聞名

      體育要聞

      贏下皇馬,會是利物浦的轉折點嗎?

      娛樂要聞

      港星林尚武突發心臟病去世

      財經要聞

      事關加快建設金融強國 中央金融辦發聲

      汽車要聞

      智己LS9入局"9系"混戰 全尺寸SUV市場迎來新變量

      態度原創

      藝術
      本地
      時尚
      公開課
      軍事航空

      藝術要聞

      蒲華:搦管寫竹,墨沈淋漓

      本地新聞

      這屆干飯人,已經把博物館吃成了食堂

      50+女人快跳出“扮嫩”誤區,學會4個技巧,就能穿出高級

      公開課

      李玫瑾:為什么性格比能力更重要?

      軍事要聞

      美國“福特”號航母駛往加勒比海

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 毛片av在线尤物一区二区| 久久日产一线二线三线| 国产精品多p对白交换绿帽| 极品少妇被猛得白浆直流草莓视频| 国产欧美日韩免费看AⅤ视频| 国产精品久久久久aaaa| 国产一区在线播放av| 五月婷婷中文字幕| 老太脱裤子让老头玩xxxxx | 亚洲国产一区二区三区最新| 国产99视频精品免费专区| 成人片黄网站a毛片免费| 国产精品一区二区三区自拍| 下面一进一出好爽视频| 久久综合色一综合色88欧美| 久久亚洲av综合悠悠色| 九九热在线免费播放视频| 中文字幕久久精品波多野结| 精品人妻码一区二区三区| 少妇仑乱a毛片无码| 青青草一区二区免费精品| 亚洲一区二区三区18禁| 亚洲综合欧美在线…| 97午夜理论电影影院| 无码人妻精品一区二区在线视频| 国产精品夜夜春夜夜爽久久小说| 日韩av中文字幕有码| 狠狠色丁香婷婷综合久久来来去| 激情五月天自拍偷拍视频| 亚洲AV日韩精品久久久久| 插插射啊爱视频日a级| 亚洲成av人片无码天堂下载| 国产一区二区三区不卡视频| 色狠狠色婷婷丁香五月| 日本熟妇大乳| 日日爽日日操| 国产高清一区二区不卡| 日韩成人福利视频在线观看| 蜜臀91精品国产高清在线| A毛片终身免费观看网站| 99riav国产精品视频|