不是拼湊知識點,AI這次是真搞研究。
一個叫Virtuous Machines的AI系統,花了17小時、114美元,找了288個真人做實驗,寫了一篇30頁的學術論文。
![]()
而且還是從選題到成稿全自動化速通!?
![]()
來看看這個AI都寫了點啥。
AI自動化做科研:從靈光一現到可發表論文
像人類一樣搞科研
AI自主完成的這個論文屬于認知心理學領域,具體聚焦于人類視覺認知相關的研究方向。
而且它可不是瞎寫,而是靠人類的科研套路來。
![]()
先是基于認知心理學理論提出研究問題,比如“視覺工作記憶與心理旋轉能力有沒有關系”、“心理意象清晰度對視覺認知任務表現有什么影響”等。(視覺工作記憶是指人類維持并處理視覺信息的能力,涉及信息存儲、操作和提取過程;心理旋轉是指通過心理操作實現空間客體旋轉以完成知覺匹配的認知過程)
![]()
接著設計實驗方案,考慮到了樣本量計算、控制變量,還用VVIQ2量表測量被試(對象)的心理意象清晰度;
在確定好實驗方案后,它還通過在線平臺Prolific招募了288名被試對象,等277份有效數據(部分被試未完成實驗,被AI篩除了)收上來,它又連續寫了8小時Python代碼,用重復測量方差處理數據。
在分析數據的過程中,甚至會識別異常值、調整統計模型;
最后整理結果時,還能引用40+篇PubMed、Semantic Scholar上的真實文獻,連論文的“方法”“結果”“討論”部分都符合APA格式規范。
![]()
這么高效,如何做到的?
不同功能的AI組隊,專人專職
那就來扒一下這個AI系統的架構。
它的自主科研能力源于協作+模擬人類認知機制+動態知識交互的技術設計。
在協同架構中,Master是核心控制模塊,總領全局。
其他的AI助手模塊聚焦文獻檢索、數據分析、實驗設計等細分任務。
![]()
而支撐類人類認知機制發揮作用的底層能力基礎則像“洋蔥圈”。
![]()
最核心的是知識檢索能力,能從海量學術數據庫精準抓取知識;接著是抽象提煉能力,可從眾多具體研究里總結通用邏輯;再往上是元認知反思能力,讓AI能自我檢查,比如做完數據分析會反問方法是否恰當、結論與假設邏輯是否通順。
然后是任務分解能力,把科研大工程拆解成可執行的小任務,比如寫論文拆分為文獻綜述、實驗設計等環節;還有自主迭代能力,無需人工干預,AI會反復修改論文草稿、調試崩潰的代碼,直到滿意。
最外層是多智能體協作能力,不同功能的AI小助手組隊,讓系統做到文獻檢索、實驗設計、數據分析專人專職。
除此之外,還有個d-RAG實時記憶庫,能一邊查最新文獻,一邊記自己之前的研究,新老知識能交互整合。
這一套架構下來,17小時寫出30頁論文也算是手拿把掐。
速度很快,小缺點也有
不過,這AI雖然卷,但也不是完美的。
雖然優點很明顯:效率比人類團隊快10倍以上,數據分析嚴謹到會拒絕統計顯著性陷阱(就算p<0.05,但如果效應量過小,也會說明“結果實際意義有限”),還能處理真實實驗中的噪音數據等。
但它偶爾也會出現理論誤解,比如把已有研究結論說成首次發現;漏標圖表的Y軸單位、把“跨試次間隔”和“刺激呈現間隔”混用等。
只能說,AI搞研究速度是挺牛,但想完全取代人類研究員的理論深度和創新思維,目前看來還差點意思~
研究地址:https://arxiv.org/abs/2508.13421
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.