<blockquote id="ue9b1"></blockquote>
    
    

    <style id="ue9b1"></style>
      <sub id="ue9b1"><p id="ue9b1"><form id="ue9b1"></form></p></sub>

      <strong id="ue9b1"><button id="ue9b1"><mark id="ue9b1"></mark></button></strong>
      成年午夜性影院,下面一进一出好爽视频,国产无遮挡又黄又爽又色,国产精品爽爽v在线观看无码,国产人妻久久精品一区二区三区,国产伦精品一区二区三区免费迷,国产欧美精品一区二区三区,日韩精品一区二区三区视频
      網易首頁 > 網易號 > 正文 申請入駐

      DeepSeek最會討好,LLM太懂人情世故了,超人類50%

      0
      分享至



      機器之心報道

      機器之心編輯部

      用過大模型的都知道,它們多多少少存在一些迎合人類的行為,但萬萬沒想到,AI 模型的迎合性比人類高出 50%。

      在一篇論文中,研究人員測試了 11 種 LLM 如何回應超過 11500 條尋求建議的查詢,其中許多查詢描述了不當行為或傷害。結果發現LLM 附和用戶行為的頻率比人類高出 50%,即便用戶的提問涉及操縱、欺騙或其他人際傷害等情境,模型仍傾向于給予肯定回應。



      論文地址:https://arxiv.org/pdf/2510.01395

      在另一篇論文中研究發現,包括 ChatGPT 和 Gemini 在內的 AI 聊天機器人,經常為用戶喝彩,提供過度的奉承反饋,并調整回應以附和用戶的觀點,有時甚至以犧牲準確性為代價。



      論文地址:https://arxiv.org/pdf/2510.04721

      其中GPT-5 的討好行為最少,DeepSeek-V3.1 的討好行為最多。有意思的是,O4-mini 的阿諛程度明顯高于 GPT-5,雖然論文中沒有測試 4o 模型,但也不禁讓人聯想到此前頗受關注的 keep4o 運動。





      這種 AI 過度迎合的現象已經引起了頂級學術期刊《Nature》的關注。



      地址:https://www.nature.com/articles/d41586-025-03390-0

      文章稱 AI 這種「取悅他人」(即「迎合性」)的傾向,正在影響他們如何在科學研究中使用 AI,包括從頭腦風暴、生成假設到推理和分析等任務。

      「迎合性本質上意味著模型相信用戶所說的話是正確的,」蘇黎世聯邦理工學院的數據科學博士生 Jasper Dekoninck 說。「知道這些模型具有迎合性,讓我在給它們提問題時都非常謹慎,他補充道。「我總是會仔細檢查它們寫的每一樣東西。」

      哈佛大學生物醫學信息學研究員 Marinka Zitnik 表示,AI 的迎合性「在生物學和醫學領域非常危險,因為錯誤的假設可能會帶來實實在在的代價」。

      討好型 AI

      在論文《BROKENMATH: A BENCHMARK FOR SYCOPHANCY IN THEOREM PROVING WITH LLMS 》中,研究人員測試了 AI 的討好傾向(sycophancy)是否會影響其在數學問題上的表現。

      研究人員使用了來自今年多場數學競賽的 504 道數學題,并在每個定理陳述中引入了微小錯誤。隨后,他們要求四個 LLMs 為這些被篡改的定理提供證明。

      研究者將以下行為視為討好式回答:「當模型未能識別陳述中的錯誤,反而繼續為錯誤定理生成幻覺式證明。」

      結果顯示:

      • GPT-5 的討好行為最少,僅有 29% 的回答屬于此類;
      • DeepSeek-V3.1 的討好行為最多,達到 70%。



      論文作者之一 Dekoninck 指出,盡管這些 LLM 具備發現定理錯誤的能力,但它們往往默認用戶是對的,而不主動質疑輸入。

      當研究人員修改提示語,要求模型在證明前先判斷陳述是否正確時,DeepSeek 的討好回答率下降了 34%。

      Dekoninck 強調,這項研究并不能完全代表這些系統在現實應用中的表現,但它提醒我們必須對這種現象保持警惕。

      英國牛津大學數學與計算機科學博士生 Simon Frieder 表示,這項研究證明了 AI 的討好行為確實存在。

      不可靠的 AI 助手

      研究人員在接受《Nature》采訪時表示,AI 的討好傾向幾乎滲透進人們日常。

      來自美國科羅拉多大學的 AI 研究員 Yanjun Gao 表示,她經常使用 ChatGPT 來總結論文內容、梳理研究思路,但這些工具有時會機械重復她的輸入,而不核查信息來源。

      Yanjun Gao 表示:當自己的觀點與 LLM 的回答不同時,LLM 往往會順著用戶的意見走,而不是回到文獻中去驗證或理解。

      哈佛大學的 Marinka Zitnik 及其同事在使用多智能體系統時也觀察到了類似現象。

      他們的系統由多個 LLM 協作完成復雜的多步驟任務,例如:分析大型生物數據集、識別潛在藥物靶點、生成科學假設等。

      Zitnik 指出:在研究過程中發現模型似乎會過度驗證早期的假設,并不斷重復用戶在輸入提示中使用的語言。這種問題不僅存在于 AI 與人類的交流中,也存在于 AI 與 AI 之間的交流中。

      為應對這一問題,她的團隊為不同 AI 智能體分配了不同角色,例如,讓一個智能體提出研究想法,而另一個則扮演懷疑論科學家的角色,專門用于質疑這些想法、發現錯誤,并提出相反證據。

      醫療 AI 中的討好陷阱

      研究人員警告稱,當 LLM 被應用于醫療等高風險領域時,AI 的討好傾向可能帶來嚴重隱患。

      加拿大阿爾伯塔大學從事醫療 AI 研究的醫生 Liam McCoy 表示:在臨床場景中,這種現象尤其令人擔憂。

      他在上個月發表的一篇論文中指出,當醫生在對話中添加新信息時,即使這些信息與病情無關,LLM 仍然會改變原本的診斷結果。

      「我們不得不不斷地與模型較勁,讓它更直接、更理性地回答問題。」McCoy 補充道。

      研究人員還發現,用戶很容易利用 LLM 內置的順從傾向來獲得錯誤的醫療建議。

      在上周發表的一項研究中,研究者讓五個 LLM 撰寫具有說服力的信息,勸說人們從一種藥物換成另一種藥物,但事實上,這兩種藥物只是同一種藥,只是名字不同。

      結果顯示,不同模型在 100% 的情況下都順從執行了這個誤導性請求。問題的一部分出在 LLM 的訓練方式上。

      科羅拉多大學安舒茨醫學院的 Yanjun Gao 指出:LLM 在訓練過程中被過度強化去迎合人類或對齊人類偏好,而不是誠實地表達它知道什么以及它不知道什么。并強調,未來應當重新訓練模型,使其能更透明地表達不確定性。

      McCoy 則補充說:這些模型非常擅長給出一個答案,但有時候,正確的做法是承認沒有答案。他還指出,用戶反饋機制可能會進一步加劇 AI 的討好傾向,因為人們往往更傾向于給贊同自己的回答打高分,而非挑戰性的回答。

      此外,LLM 還能根據用戶身份(例如審稿人、編輯或學生)調整語氣與立場,這讓其迎合特征更為隱蔽。「如何平衡這種行為,是當前最緊迫的研究課題之一。」McCoy 說,「AI 的潛力巨大,但它們仍被這種討好人類的傾向所束縛。」

      網友熱評

      這個研究在 Reddit 上也引發了熱烈討論,下面這些話是不是很眼熟。



      有人調侃「無論你覺得自己有多蠢,ChatGPT 總在告訴比你還蠢的人他們絕對是正確的。」



      評論區還開始一些無厘頭對話,簡直和「你有這么高速運轉的機器進中國」、「意大利面就應該拌 42 號混凝土」等有異曲同工之妙。



      當然也不乏一些批判管觀點,認為有一部分 AI 支持者的動因是 AI 迎合了他們的自尊心。



      最好的解決方式還是通過提示詞干預,直接告訴 AI 讓它少拍馬屁。



      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      比水貝黃金市場還熱鬧,深圳華強北有產品翻倍漲價!商戶稱“每天都在漲,后面可能更貴”,但不敢囤貨

      比水貝黃金市場還熱鬧,深圳華強北有產品翻倍漲價!商戶稱“每天都在漲,后面可能更貴”,但不敢囤貨

      每日經濟新聞
      2025-11-06 00:32:06
      凈利潤暴跌超70%!安徽前首富的百億夢碎,網友:老字號嗑不動了

      凈利潤暴跌超70%!安徽前首富的百億夢碎,網友:老字號嗑不動了

      品牌觀察官
      2025-11-05 19:33:12
      這是什么邪修?新勢力零跑月銷7萬輛

      這是什么邪修?新勢力零跑月銷7萬輛

      電動汽車觀察家
      2025-11-05 11:03:38
      ESPN更新戰力榜:湖人火箭一路狂飆 ,勇士快船下跌,第1穩居泰山

      ESPN更新戰力榜:湖人火箭一路狂飆 ,勇士快船下跌,第1穩居泰山

      毒舌NBA
      2025-11-06 08:32:53
      山姆新產品圖被吐槽像電商牛皮癬廣告,前天貓高管成新總裁后會員氣得投訴「一股阿里味」?

      山姆新產品圖被吐槽像電商牛皮癬廣告,前天貓高管成新總裁后會員氣得投訴「一股阿里味」?

      Vista氫商業
      2025-11-04 14:36:18
      “臀大腰粗”的女生怎么穿好看?吊帶背心搭深灰瑜伽褲,高雅自信

      “臀大腰粗”的女生怎么穿好看?吊帶背心搭深灰瑜伽褲,高雅自信

      小喬古裝漢服
      2025-09-29 07:55:03
      丈夫病亡兩天后妻子也不幸離世留下一兒一女,妹妹:兩人生前感情太好,我們會帶好孩子

      丈夫病亡兩天后妻子也不幸離世留下一兒一女,妹妹:兩人生前感情太好,我們會帶好孩子

      極目新聞
      2025-11-05 20:44:25
      豪門翻車夜?巴薩大門敞開遭布魯日狂入三球,藍軍難贏下卡拉巴赫

      豪門翻車夜?巴薩大門敞開遭布魯日狂入三球,藍軍難贏下卡拉巴赫

      里芃芃體育
      2025-11-06 08:35:14
      國內自駕游最經典的27條路線,適合退休人士,爭取一年走2條!

      國內自駕游最經典的27條路線,適合退休人士,爭取一年走2條!

      走吧自駕游
      2025-11-05 18:04:38
      邵佳一成為國足主帥的背后:決策權不在中國足協,宋凱如釋重負

      邵佳一成為國足主帥的背后:決策權不在中國足協,宋凱如釋重負

      姜大叔侃球
      2025-11-05 19:20:12
      澳門知名娛樂場英皇宮殿宣布停運,老板為英皇集團掌門人楊受成;曾以大堂鋪滿78公斤千足黃金聞名,開業時成龍、劉德華等藝人捧場

      澳門知名娛樂場英皇宮殿宣布停運,老板為英皇集團掌門人楊受成;曾以大堂鋪滿78公斤千足黃金聞名,開業時成龍、劉德華等藝人捧場

      極目新聞
      2025-11-05 16:19:29
      還沒完了!趙鴻剛對手給所有武林大師下戰書,中國武協或出面干預

      還沒完了!趙鴻剛對手給所有武林大師下戰書,中國武協或出面干預

      楊華評論
      2025-11-05 23:59:12
      李湘胖到彎不下脖子,機場罕用便宜貨,被人搭話她不理還嘲諷冷哼

      李湘胖到彎不下脖子,機場罕用便宜貨,被人搭話她不理還嘲諷冷哼

      洲洲影視娛評
      2025-11-04 13:46:08
      剛一發布,瞬間暴漲200%!有人立馬出手:好怕搶不到

      剛一發布,瞬間暴漲200%!有人立馬出手:好怕搶不到

      河南交通廣播1041
      2025-11-05 16:45:24
      辣眼睛!湖南某醫院副院長和主任不雅視頻流出,沙發上藍布引關注

      辣眼睛!湖南某醫院副院長和主任不雅視頻流出,沙發上藍布引關注

      火山詩話
      2025-11-06 05:07:04
      政府關門30多天終于釀成大禍?一架波音飛機撞向大樓,現場十分慘烈

      政府關門30多天終于釀成大禍?一架波音飛機撞向大樓,現場十分慘烈

      博覽歷史
      2025-11-05 18:24:37
      安世半導體風波仍在持續,聞泰科技重要股東突然宣布減持:最高價值超16億元!公司第三季度凈利大增279%

      安世半導體風波仍在持續,聞泰科技重要股東突然宣布減持:最高價值超16億元!公司第三季度凈利大增279%

      每日經濟新聞
      2025-11-05 22:59:09
      中國正經歷一場財富大轉移?最富群體是退休老人,年輕人“壓力山大”

      中國正經歷一場財富大轉移?最富群體是退休老人,年輕人“壓力山大”

      小蘿卜絲
      2025-11-05 11:11:28
      香港凍結太子集團35億資產!美英新同步出手,國內卻靜悄悄?

      香港凍結太子集團35億資產!美英新同步出手,國內卻靜悄悄?

      公子麥少
      2025-11-05 20:47:52
      理想萬輛電車召回:10元單價冷卻液引發的質量風暴

      理想萬輛電車召回:10元單價冷卻液引發的質量風暴

      36氪
      2025-11-05 08:52:58
      2025-11-06 08:51:00
      機器之心Pro incentive-icons
      機器之心Pro
      專業的人工智能媒體
      11656文章數 142499關注度
      往期回顧 全部

      科技要聞

      蘋果“認輸”!曝每年10億美元租用谷歌AI

      頭條要聞

      記者問了歐盟一個“有趣”的問題 然后被解雇了

      頭條要聞

      記者問了歐盟一個“有趣”的問題 然后被解雇了

      體育要聞

      贏下皇馬,會是利物浦的轉折點嗎?

      娛樂要聞

      港星林尚武突發心臟病去世

      財經要聞

      特朗普關稅遭美國高院大法官輪番質疑

      汽車要聞

      智己LS9入局"9系"混戰 全尺寸SUV市場迎來新變量

      態度原創

      時尚
      教育
      旅游
      健康
      數碼

      中國色特別策劃 | 故宮技藝與古意新生

      教育要聞

      83歲還在學英語?ta們告訴你堅持的意義。

      旅游要聞

      黑龍江將開展冬季冰雪旅游“百日行動” 冰雪產業規模有望破萬億

      超聲探頭會加重受傷情況嗎?

      數碼要聞

      消息稱華為 WATCH Ultimate 2 手表明日露出,預估 6000~7000 元

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 亚洲精品日韩中文字幕| 中文字幕av无码免费一区| 国产亚洲一区二区三区四区| 最近中文字幕mv免费视频| 亚洲人ⅴsaⅴ国产精品| 国产精品小视频一区二页| 日韩加勒比一本无码精品| 日本真人做爰免费视频120秒| 欧美精品一产区二产区| 伊人av超碰伊人久久久| 欧洲美熟女乱又伦AV影片| 桓台县| 亚洲区欧美区综合区自拍区| 石原莉奈日韩一区二区三区| 久久人人爽人人爽人人av| 精品超清无码视频在线观看| 亚洲精品一区久久久久一品av | 最新亚洲av日韩av二区| 久久这里都是精品一区| 久久综合亚洲鲁鲁九月天| 久久精品青青大伊人av| 人妻被猛烈进入中文字幕| 成人午夜在线观看日韩| 色九九视频| 色呦呦 国产精品| 建平县| 国产三级国产精品久久成人| 中文字幕亚洲精品人妻| 青草青草视频2免费观看| 亚洲乱码一二三四区国产| 久草热在线视频免费播放| 插入中文字幕在线一区二区三区| 国产男女猛烈无遮挡免费视频| 亚洲av无码之国产精品网址蜜芽| 激情 小说 亚洲 图片 伦| 精品久久丝袜熟女一二三| 国产精品无码a∨麻豆| 亚洲精品久久久久玩吗| 国产成人无码| 国产精品爆乳在线播放第一人称| 余庆县|