“我們比較了 AI 系統(tǒng)和生物系統(tǒng),發(fā)現(xiàn)二者在合作行為方面具有驚人的相似性。”美國加州大學(xué)洛杉磯分校(UCLA)洪哲教授對 DeepTech 表示。
隨著 AI 技術(shù)的發(fā)展,我們經(jīng)常用包括 ChatGPT 和 DeepSeek 等 AI 工具幫助更高效地學(xué)習(xí)和工作。實際上,AI Agent 也能夠通過合作完成更復(fù)雜的任務(wù),而研究 AI Agent 的合作行為與研究人類的合作行為存在相似之處。
此前,已有研究提出 AI 系統(tǒng)和生物系統(tǒng)存在相似性。可以說,AI 系統(tǒng)在一定程度上也是受生物啟發(fā)而來,比如卷積神經(jīng)網(wǎng)絡(luò)(CNN,Convolutional Neural Network)的結(jié)構(gòu)就是參考人類的視覺系統(tǒng)構(gòu)建的。
有些觀點認(rèn)為,未來的 AI Agent 可能并不是單獨產(chǎn)生功能的。無論是與用戶互動,還是它們自身的功能,或許都需要多個 Agent 之間共同協(xié)作來完成。因此,合作行為是非常重要的研究方向。
在近期發(fā)表在 Science 的一項研究中,洪哲教授團(tuán)隊通過對小鼠和 AI 系統(tǒng)在合作任務(wù)中的行為和神經(jīng)活動變化的對比,揭示了 AI 系統(tǒng)和生物系統(tǒng)之間在合作行為方面的神經(jīng)基礎(chǔ),并證明了二者在合作行為中的相似性。
![]()
圖丨洪哲(來源:洪哲)
這項研究對研究神經(jīng)科學(xué),特別是研究社會行為機(jī)制的領(lǐng)域具有重要的意義。該領(lǐng)域最本質(zhì)的問題是理解大腦中的神經(jīng)元以及大腦是如何控制(廣義)行為的,包括決策、社會行為、合作和幫助等。
此外,該研究為人們理解 AI 和 AI Agent 提供了新的思路。一方面,AI 系統(tǒng)在一定程度上受生物啟發(fā),很多架構(gòu)和結(jié)構(gòu)都與生物系統(tǒng)有關(guān)。另一方面,通過系統(tǒng)地比較二者的共同點和不同點,也會推進(jìn)未來對 AI Agent、AI 及其發(fā)展的相關(guān)研究。
近日,相關(guān)論文以《生物和人工智能系統(tǒng)中合作行為的神經(jīng)基礎(chǔ)》(Neural basis of cooperative behavior in biological and artificial intelligence systems)為題發(fā)表在 Science[1]。UCLA 博士生 Jiang Mengping 和 Linfan Gu 是第一作者,洪哲和 Jonathan Kao 教授擔(dān)任通訊作者。
![]()
圖丨相關(guān)論文(來源:Science)
![]()
小鼠合作行為的自發(fā)策略:靠近、等待和互動
這項研究源于研究團(tuán)隊觀察到的現(xiàn)象:合作行為和幫助行為是僅在生物體中才會出現(xiàn),還是在任何智能體中都會出現(xiàn),這是一個普遍原則嗎?AI Agent 的神經(jīng)網(wǎng)絡(luò)中具體有哪些神經(jīng)元參與到了其合作行為的調(diào)控?
需要了解的是,在生物體中通常只能同時控制神經(jīng)元(例如讓其同時活動或同時不活動),有選擇性地操控特定神經(jīng)元活動。但這在 AI 系統(tǒng)中很容易實現(xiàn),如果清楚地了解它的單元之間具體位置,它是如何被激活的,就能更清楚它背后的機(jī)制。
洪哲對 DeepTech 解釋說道:“在合作行為中,結(jié)果是最終目標(biāo),而我們想了解的不僅是一起做某件事的合作現(xiàn)象,更重要的是通過怎樣的策略來達(dá)成這個目標(biāo)。”
![]()
圖丨小鼠通過合作行為獲得互利的回報(來源:Science)
在實驗中,該團(tuán)隊通過協(xié)調(diào)兩只小鼠的行為,讓它們在 0.75 秒內(nèi)同時將鼻子伸進(jìn)同一洞中,并設(shè)置如果完成合作任務(wù)則能夠獲得水的獎勵。研究人員觀察到一種有趣的現(xiàn)象:兩只小鼠為達(dá)成合作行為,它們發(fā)展出主動接近、等待和互動行為——在合作行為之前會互相碰一下鼻子。
洪哲解釋說道:“頂一下鼻子這個動作,其實是它們互相告知對方馬上開啟合作行為的信號。有意思的是,這并不是本來就存在的,而是小鼠在學(xué)習(xí)和訓(xùn)練的過程中逐漸形成的默契,這種自發(fā)的策略為它們實現(xiàn)最終目標(biāo)提供了保障。”
用動物或 AI 做實驗時,一個很重要的問題是:如果它們產(chǎn)生了某種行為,不管是自發(fā)的還是訓(xùn)練出來的,這些行為會在大腦的具體區(qū)域被表征出來。研究人員想了解的是,大腦中哪些區(qū)域處理這些行為,哪些腦區(qū)可能與這些行為的產(chǎn)生及其學(xué)習(xí)過程有關(guān)?
他們發(fā)現(xiàn)在合作行為中,前扣帶皮層(ACC,anterior cingulate cortex)發(fā)揮了關(guān)鍵作用。ACC 是在動物決策中一個重要的腦區(qū),在普遍的框架中也非常關(guān)鍵。該腦區(qū)與很多行為有關(guān),而這些行為又與很多社會行為密切相關(guān)。
“當(dāng)時選擇研究 ACC,是因為以往的研究發(fā)現(xiàn),ACC 可能在合作行為中發(fā)揮重要作用。因此,我們對 ACC 進(jìn)行了深入的分析和實驗。”洪哲表示。
![]()
圖丨ACC 中合作行為的編碼(來源:Science)
研究團(tuán)隊找到了研究 ACC 的方法:他們能夠每秒甚至每毫秒都觀察 ACC 神經(jīng)元的活動,并在合作行為過程中同時記錄幾百個神經(jīng)元,以確定 ACC 神經(jīng)元的活動是否和這些行為有關(guān)。
以上文提到的小鼠合作策略為例,研究人員能夠在 ACC 神經(jīng)元的活動中觀察到相關(guān)的信息。比如在等待時,對應(yīng)的神經(jīng)元活動會變強(qiáng)。這說明 ACC 和這些行為可能有關(guān),而且 ACC 的活動強(qiáng)度與合作的好壞呈正相關(guān)。也就是說,ACC 如果能更好地反映對方的位置,小鼠的合作行為則效果更好。
此外,研究人員還可以對 ACC 進(jìn)行功能調(diào)控。研究人員發(fā)現(xiàn),通過降低小鼠 ACC 的活動,小鼠的行為策略會消失,合作行為的效率也會大幅降低。例如,正常情況下,小鼠在 0.3 至 0.4 秒內(nèi)就能完成合作,但在 ACC 活動降低后,它們的表現(xiàn)會變差很多。
圖丨抑制 ACC 神經(jīng)活動會損害合作行為(來源:Science)
在該研究中,研究人員不僅觀察小鼠的行為、進(jìn)行生物相關(guān)實驗,而且擴(kuò)展到 AI 和 AI Agent,還用多智能體強(qiáng)化學(xué)習(xí)(MARL,g multi-agent reinforcement learning)的策略比較了 AI Agent 在類似的環(huán)境中的合作行為。研究人員開發(fā)了兩個基于循環(huán)神經(jīng)網(wǎng)絡(luò)的 AI Agent,并在模擬動物行為的環(huán)境中訓(xùn)練其協(xié)作。通過觀察和學(xué)習(xí),這些 Agent 逐漸發(fā)展出與小鼠相似的行為策略和神經(jīng)表征。
該研究共經(jīng)歷近四年,回顧研究過程,洪哲指出,最大的挑戰(zhàn)是讓 AI Agent 或小鼠進(jìn)行合作。
實際上,在研究初始階段研究人員對小鼠的時間設(shè)置得比較簡單。他們發(fā)現(xiàn),如果是在 3 秒內(nèi)完成合作行為,小鼠會采取完全不同的策略——它們總是能找到一些方法拿到獎勵,但過程中并沒有合作行為。
洪哲表示:“科學(xué)研究的過程并不是一條直線,這種意想不到的情況讓我印象深刻。”為此,該團(tuán)隊進(jìn)行了多次調(diào)整和嘗試,最終將兩只小鼠互相合作的時間設(shè)置為 0.75 秒內(nèi)。
![]()
從源頭去尋找問題的本質(zhì)
洪哲本科和博士分別畢業(yè)于清華大學(xué)和美國斯坦福大學(xué),之后他在美國加州理工大學(xué)從事博士后研究工作。目前,洪哲團(tuán)隊致力于研究社會行為的規(guī)律以及社會行為神經(jīng)機(jī)制,即動物或人類在進(jìn)行社會行為時,大腦中的神經(jīng)元如何調(diào)控這些行為。過去十年,他們專注于研究生物體的神經(jīng)網(wǎng)絡(luò)如何調(diào)控社會行為,特別是親社會行為中的合作行為。
大腦是人體中最復(fù)雜的器官,也是我們目前對其了解最少的器官。其他器官雖然由很多細(xì)胞組成,但細(xì)胞類型相對單一。而在大腦中,盡管神經(jīng)元之間有相似之處,但是任何兩個神經(jīng)元的差異可能非常大。
從很早開始,洪哲就對問題的本質(zhì)高度關(guān)注,并喜歡探索復(fù)雜過程背后的機(jī)制,特別是神經(jīng)科學(xué)中的社會神經(jīng)科學(xué)方向。“人與人之間或動物之間的社會行為非常復(fù)雜,其需要大腦的高度參與,是一個高度非線性的、很難預(yù)測的過程。不管是自然智能還是 AI,最高境界都是社會行為。”洪哲說。
為探索問題的本源,他經(jīng)常提出一系列問題:為什么我們會去做一件事情,這件事能夠為別人帶來哪些好處?我們?yōu)槭裁磿氲饺ミ@么做?這個動機(jī)背后在大腦中對應(yīng)的是什么?具體是哪個區(qū)域去激勵這些個體,使其產(chǎn)生一些行為,從而為其他個體帶來好處?
該方向的研究具有廣泛的社會意義。實際上,整個經(jīng)濟(jì)、政治、社會結(jié)構(gòu)都是一個廣義的社會行為。所以,從兩個人的小團(tuán)體到一個龐大的社會,背后個體的大腦和一群個體的大腦是如何控制這些行為的。
今年 7 月,研究團(tuán)隊在發(fā)表于 Nature 的一篇論文中 [2],也研究了 AI 與生物體之間的相似性,其研究重點是社會行為。他們發(fā)現(xiàn),當(dāng)兩個人或兩個 AI 進(jìn)行社會行為時,腦活動/神經(jīng)活動表現(xiàn)出高度的一致性。并且,甚至在某些方面 AI 與生物體的互動模式極為接近。研究結(jié)果表明,共享神經(jīng)動力學(xué)代表了生物和 AI 體中相互作用神經(jīng)系統(tǒng)的一個基本且可推廣的特征,并凸顯了共享神經(jīng)動力學(xué)在驅(qū)動社交互動方面的功能意義。
在接下來的研究階段中,研究人員將對 ACC 繼續(xù)深入探索。例如,ACC 是如何接收信息的,又是如何將這些信息傳遞到其他腦區(qū)的。此外,ACC 處理的信息在其他腦區(qū)是否存在?如果存在,又有什么相同點和不同點?“這個過程需要很多神經(jīng)元共同協(xié)同完成,甚至可能需要整個大腦協(xié)同工作,我們對未來的探索充滿期待。”洪哲表示。
參考資料:
1.Jiang, M. et al. Neural basis of cooperative behavior in biological and artificial intelligence systems. Science(2025). https://doi.org/10.1126/science.adw8151
2.Zhang, X., Phi, N., Li, Q. et al. Inter-brain neural dynamics in biological and artificial intelligence systems. Nature 645, 991–1001 (2025). https://doi.org/10.1038/s41586-025-09196-4
運營/排版:何晨龍
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.