2025年9月,騰訊與武漢大學的聯合研究團隊(由騰訊王賽、徐中文及武大吳宇領銜)發表了一項顛覆性成果——名為“Cogito, ergo ludo”(簡稱 CEL,意為 “我思故我玩”)的AI智能體。不同于只會“死記硬背” 的傳統AI,它能像人一樣觀察、思考、總結規律,甚至清晰說出決策邏輯,相關論文可通過編號arXiv:2509.25052v1查詢。
想象你第一次玩新游戲:先摸索規則,再積累經驗,最后制定策略。CEL正是這樣的 “智能玩家”。傳統AI學下棋要看完百萬局棋譜,靠調整參數形成條件反射,就像不會理解邏輯的表演海豚;而CEL的決策全程透明,就像身邊的游戲高手會告訴你 “為什么這么走”。
![]()
一、從 “背答案” 到 “想問題”:AI的學習革命
傳統AI的痛點很明顯:它是個“黑箱學霸”。要讓它學會游戲,得喂給它海量數據反復訓練,但你問它“為什么選這個方案”,它只會答“我背過”。這種不透明性,讓醫療、自動駕駛等關鍵領域不敢輕易信任AI。
CEL徹底改變了學習邏輯,分成“游戲中思考”和“游戲后反思”兩步:
- 決策時前瞻:像棋手算棋一樣,先評估當前局面,預測每個動作的后果,再選最優解,全程可追溯思考路徑;
- 結束后復盤:好比考完試整理錯題本,回顧全程對錯,更新對規則的理解和策略庫。這種 “邊玩邊想邊進步” 的模式,讓它能快速吃透新游戲。
![]()
二、AI的“智囊團”:四個“專家”協同工作
CEL 的“大腦” 由四個各司其職的 “專家” 組成,像高效協作的團隊:
- 規則理解專家:靠觀察猜規則,就像小孩看別人下棋悟玩法,還能用自然語言寫出“游戲說明書”;
- 結果預測專家:模擬行動后果,比如 “走這步會觸發陷阱嗎”,堪比棋手腦中的 “沙盤推演”;
- 局面評估專家:給當前狀態打分,判斷“贏面有多大”,幫團隊篩選方向;
- 策略總結專家:攢“游戲攻略”,比如 “掃雷先開角落”“推箱子別堵死路”,還會隨經驗更新。
決策時,評估專家先定基調,預測專家模擬后果,策略專家給建議,最終選出最優解;游戲結束后,規則專家和策略專家更新知識庫,為下一局做準備。
![]()
三、三重考驗:從零學起的游戲實戰
研究團隊選了三種經典游戲“考”CEL,而且故意加了難度:開局完全不教規則,只給基礎操作,還得等游戲結束才知道“輸還是贏”,堪比蒙眼摸路。
- 掃雷(邏輯推理題):靠數字線索猜地雷位置,考驗嚴密思維;
- 冰湖導航(路徑規劃題):從起點到終點避陷阱,需要空間判斷;
- 推箱子(工程規劃題):要把箱子推到目標點,還不能推到死角,得提前想好幾步操作。
四、成績驚艷:比 “知規則” 的AI更會玩
CEL的表現打破了預期:
- 掃雷勝率54%:遠超提前被告知完整規則的AI(僅26%),證明自主領悟比 “喂答案”更有效;
- 冰湖導航10局通關:短短10回合勝率就達97%,學習速度接近人類;
- 推箱子“頓悟時刻”:摸索一段時間后,勝率突然飆升到84%,像人突然 “想通了訣竅”。
更厲害的是它的“舉一反三”能力:用掃雷訓練的CEL去玩冰湖導航,雖然不懂新規則,卻能快速上手。這說明它學會的不是“某款游戲技巧”,而是“怎么學新游戲” 的通用能力。
五、看得見的思考:AI 的“決策日記”
CEL最圈粉的是“透明”。玩掃雷時,它會“說”出思考過程:
“現在只剩一個安全格要開,價值很高。位置 (0,3) 是安全的——旁邊 (1,2) 是1、(1,3) 是2,說明 (0,2) 和 (0,3) 里有一個地雷,但 (0,2) 已經確定是雷,所以 (0,3) 肯定安全,開它就能贏。而 (0,2) 是雷,開了就輸。”
它還能自己寫 “游戲手冊”,比如掃雷規則被總結得一清二楚:“‘.’是未開格子,‘0’是無雷安全格,‘n’表示周圍有n個雷,‘*’是雷(踩了游戲結束)”。連 “用數字推地雷位置”“優先開安全格” 等高級策略,都是它自己悟出來的。
![]()
六、不止于游戲:AI的未來方向
CEL的突破,遠不止 “游戲打得好”:
- 邁向通用AI:傳統AI是“專才”,下象棋的不會下圍棋;CEL的跨游戲學習能力,暗示未來AI可能成為“通才”;
- 解決信任難題:就像醫療領域需要可解釋的AI診斷依據,CEL的透明性讓人類能 “看懂” AI決策,為關鍵領域應用鋪路;
- 技術融合創新:它結合了大語言模型的推理能力和強化學習的試錯機制,還用 GRPO技術像老師改作業一樣優化推理模式。
未來,它可能成為:
- 教育領域的“私教”:展示解題思路,幫學生學會 “怎么想”;
- 科研領域的“助手”:分析實驗數據、提假設,還能說清推理過程;
- 商業領域的“顧問”:給決策建議時附上依據,幫管理者拍板。
當然挑戰還在:目前它只玩轉簡單游戲,現實世界的復雜場景更難應對;如何確保智能AI符合人類價值觀,也需要持續探索。但不可否認,CEL讓“會思考的AI” 從概念落地,未來我們可能不再需要盲目信任“黑箱”,而是與透明、理性的AI伙伴協作。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.