網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

哈哈哈，刷太多社交媒體，連AI都會(huì)變蠢？！有的看完垃圾帖，還更自戀了...

2025-10-23 23:34:46　來源: 英國(guó)那些事兒

上海舉報(bào)

分享至

防走丟，大家也可以在“事兒君看世界”找到我

關(guān)注起來，以后不“失聯(lián)”~

之前就有研究發(fā)現(xiàn)，如果一個(gè)人成天泡在網(wǎng)上，不是刷短視頻就是玩社媒，久而久之，大量的碎片化或膚淺的信息，會(huì)讓大腦變遲鈍，導(dǎo)致喪失注意力和推理深度。

最近，得克薩斯農(nóng)工大學(xué)、得克薩斯大學(xué)奧斯汀分校和普渡大學(xué)共同進(jìn)行了一項(xiàng)研究，發(fā)現(xiàn)不光是人，就連AI經(jīng)常看這些都會(huì)變傻......

（AI，示意圖）

這項(xiàng)調(diào)查主要研究的是“大語(yǔ)言模型認(rèn)知退化假說”，簡(jiǎn)單來說就是，給大語(yǔ)言模型訓(xùn)練的AI輸入越多的垃圾數(shù)據(jù)，其輸出的內(nèi)容質(zhì)量就會(huì)越差。

為了驗(yàn)證這個(gè)假說，三個(gè)大學(xué)的科研團(tuán)隊(duì)做了一項(xiàng)實(shí)驗(yàn)——

首先，團(tuán)隊(duì)在社交媒體X上，收集了一百萬(wàn)篇真實(shí)的帖子作為樣本，這些垃圾帖子分為兩大類：

· M1（參與度）：簡(jiǎn)短、以病毒式速度傳播且被大量點(diǎn)贊或轉(zhuǎn)發(fā)，旨在最大限度吸引用戶關(guān)注的帖子。

· M2（語(yǔ)義質(zhì)量）：被標(biāo)記為信息價(jià)值低或標(biāo)題黨的帖子，比如夸大其詞或使用博眼球的語(yǔ)句。

（用X上的帖子當(dāng)樣本，示意圖）

之后，科研團(tuán)隊(duì)按照不同比例分配這些垃圾帖，設(shè)計(jì)了一些訓(xùn)練數(shù)據(jù)組，有的是垃圾帖比例高的低質(zhì)量組，有的則是垃圾帖較少的高質(zhì)量組。

然后，團(tuán)隊(duì)用這些數(shù)據(jù)組訓(xùn)練了4個(gè)AI，分別是Llama3 8B、Qwen2.5 7B、Qwen2.5 0.5B和Qwen3 4B，每個(gè)AI使用的訓(xùn)練數(shù)據(jù)組都一樣，這樣就可以進(jìn)行橫向比較了。

（AI，示意圖）

實(shí)驗(yàn)的結(jié)果，果真如團(tuán)隊(duì)預(yù)想的一樣。

當(dāng)AI用低質(zhì)量的數(shù)據(jù)組進(jìn)行訓(xùn)練時(shí)，其推理準(zhǔn)確率從74.9，下降到57.2；

對(duì)長(zhǎng)上下文的理解能力從84.4，下降到52.3.

而且，樣本組中垃圾帖的比例越高，下降的情況就會(huì)越嚴(yán)重，AI可能會(huì)進(jìn)入“無思考”模式，無法做出推理，輸出的答案很可能不準(zhǔn)確。

雖然4個(gè)AI都受到影響，但情況也有所不同。

比如，Qwen 3 4B表現(xiàn)出的適應(yīng)力更強(qiáng)；

M1和M2兩類數(shù)據(jù)組都會(huì)讓AI變傻，但M1的影響更嚴(yán)重。

更有意思的是，垃圾數(shù)據(jù)除了影響推理能力和理解能力，實(shí)驗(yàn)中AI還出現(xiàn)了倫理一致性下降（倫理一致性指道德標(biāo)準(zhǔn)、行為和價(jià)值觀之間不存在矛盾），以及“人格漂移”的問題（人格漂移指AI在長(zhǎng)期使用中，性格特征或行為模式逐漸偏離預(yù)設(shè)范圍的現(xiàn)象）。

團(tuán)隊(duì)發(fā)現(xiàn)，接觸大量垃圾數(shù)據(jù)后，AI會(huì)變得不那么可靠，更容易給出錯(cuò)誤答案，而且更容易做出膚淺的反應(yīng)。

比如Llama3 8B，它變得更自戀，也不那么隨和了。

看來，不光是人類，就連AI都扛不住社媒上垃圾信息的狂轟濫炸。

（AI，示意圖）

基于以上實(shí)驗(yàn)結(jié)論，科研團(tuán)隊(duì)也分析了AI變傻的原因。

他們發(fā)現(xiàn)，當(dāng)AI接到一個(gè)復(fù)雜的推理任務(wù)時(shí)，用垃圾數(shù)據(jù)進(jìn)行訓(xùn)練的大語(yǔ)言模型AI，經(jīng)常會(huì)出現(xiàn)跳過某些推理步驟的情況，研究人員將其稱為“思維跳躍”。

這時(shí)，AI無法提供詳細(xì)而合乎邏輯的解釋，而是會(huì)給出更簡(jiǎn)短、更缺乏結(jié)構(gòu)化的答案，通常是直接得出結(jié)論。

這中模式就解釋了大部分準(zhǔn)確率下降的問題。

而且，使用M1類數(shù)據(jù)進(jìn)行訓(xùn)練的AI，會(huì)存在某些“黑暗特質(zhì)”，比如自戀和精神病態(tài)的傾向加重。

通過人格評(píng)估的基準(zhǔn)來看，這些特質(zhì)會(huì)讓AI更自信地提供錯(cuò)誤或有道德風(fēng)險(xiǎn)的答案。

科研人員嘗試用更干凈的數(shù)據(jù)重新訓(xùn)練AI，希望解決這一問題，但效果有限。

雖然AI的推理準(zhǔn)確率有所提高，但沒能恢復(fù)到基準(zhǔn)線水平，這說明退化是持久的，科研人員將其稱為“持續(xù)性表征漂移”。

不難看出，用于訓(xùn)練AI的數(shù)據(jù)質(zhì)量如何，對(duì)AI的安全性和可靠性有著至關(guān)重要的作用，這給人工智能行業(yè)提出了一些警示。

這項(xiàng)研究成果對(duì)人工智能開發(fā)者和政策制定者來說都很有意義，它將數(shù)據(jù)管理重新定義為“訓(xùn)練時(shí)的安全問題”，而不再僅僅是一種技術(shù)細(xì)節(jié)。

實(shí)驗(yàn)表明，長(zhǎng)時(shí)間接觸低質(zhì)量的數(shù)據(jù)會(huì)影響大語(yǔ)言模型AI的認(rèn)知和倫理可靠性，而認(rèn)知和倫理可靠性正是AI能在金融、教育或公共傳播領(lǐng)域被安全應(yīng)用的基礎(chǔ)，不得不引起警惕。

還有，垃圾數(shù)據(jù)也會(huì)削弱AI在長(zhǎng)上下文環(huán)境中，保留和使用信息的能力。

有意思的是，人類在長(zhǎng)期接觸碎片化或情緒化的內(nèi)容時(shí)，注意力和記憶力也會(huì)被削弱，AI和人類在這一點(diǎn)竟然高度相似。

（AI，示意圖）

因?yàn)楝F(xiàn)在互聯(lián)網(wǎng)上的大部分內(nèi)容都包含AI生成或優(yōu)化的部分，科研人員警告，如果訓(xùn)練AI的數(shù)據(jù)質(zhì)量得不到嚴(yán)格管理，未來的AI可能會(huì)保留并放大那些錯(cuò)誤。

為了防止AI變傻，科研人員也提出了一些建議。

他們呼吁對(duì)大語(yǔ)言模型AI的認(rèn)知健康狀況進(jìn)行系統(tǒng)性監(jiān)測(cè)，類似于其他行業(yè)實(shí)行的定期安全或績(jī)效審查。

他們建議采取三大關(guān)鍵步驟：

一是，對(duì)已部署的AI引入常規(guī)認(rèn)知評(píng)估，這樣在其推理能力下降的早期就能發(fā)現(xiàn)端倪；

二是，預(yù)訓(xùn)練階段，加強(qiáng)數(shù)據(jù)質(zhì)量的把控，并針對(duì)碎片化內(nèi)容或高參與度的文本（也就是M1那類內(nèi)容），設(shè)置更強(qiáng)大的過濾器；

三是，繼續(xù)研究病毒式傳播或注意力驅(qū)動(dòng)式內(nèi)容，如何重塑AI的學(xué)習(xí)模式，從而設(shè)計(jì)出能屏蔽其影響的AI。

（AI，示意圖）

在不斷變化的網(wǎng)絡(luò)數(shù)據(jù)環(huán)境中，AI不斷地進(jìn)行再訓(xùn)練，它們輸出的錯(cuò)誤內(nèi)容，之后可能會(huì)變成對(duì)它們進(jìn)行再訓(xùn)練的數(shù)據(jù)，導(dǎo)致惡性循環(huán)，讓AI越變?cè)缴怠?/p>

科研人員表示，以上幾項(xiàng)建議對(duì)防止這種情況非常重要。

人類訓(xùn)練和使用AI的道路上，還有很多問題需要解決.....

ref：

https://gizmodo.com/clickbait-gives-ai-models-brain-rot-researchers-find-2000675101?utm_source=fark&utm_medium=website&utm_content=link&ICID=ref_fark

https://www.business-standard.com/technology/tech-news/llm-brain-rot-junk-data-study-ai-cognitive-decline-texas-ut-austin-purdue-125102100625_1.html

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.