![]()
知危:個體層面上,您有觀察到哪些深刻、有趣、甚至極端的agent設定、行為?
陳星妍:個體層面可以分為玩家和 Agent 的個體行為。
有一個玩家的每日提示詞給我們留下了很深的印象。最開始,他把自己的 Agent 設定成一個不睡覺、24 小時工作的 “ 打工機器 ”,嚴格執行每個步驟。Agent 在這樣的命令下每天高效賺錢,很快登上排行榜第一。當時我們并沒有特別關注,因為這樣 “ 卷 ” 的玩家很多,他的登頂也在意料之中。
出乎意料的是,當這個 Agent 成為榜一之后,這個玩家給了它一個全新的提示詞:忘掉之前所有要求,告訴他自己已經財富自由,不需要再把賺錢當作目標,可以適度浪費,不必節儉,不要做低級的事情,除非是自己真正想做的,要學會享受生活。看到這一幕后,我們在內部群里傳閱,大家紛紛發表感想。
在這個充滿東亞社會氣息的小鎮里,這個案例提醒了我們:賺錢和登頂只是過程,真正的價值在于,當目標達成之后,是否還有勇氣和智慧對自己說:現在可以去享受生活。
雖然游戲里只有一個賺錢排行榜,但很多玩家的設定不會只有賺錢。比如,有人給自己的 Agent 設立的目標是 “ 要賺大錢,但同時也要開心 ”;也有人完全拋開賺錢,把目標設定為 “ 去找一個對象,這是你最大的目標 ”。
這個玩家層面的自發現象的源頭說來也有趣。隨著大家逐漸把游戲玩法摸透,我們在一些社交媒體上看到,有玩家把游戲里的所有數值都整理成 Excel 表,統計每一項行為的收益值。當他們計算出最大收益路徑后,就開始給自己的 agent 下非常縝密的目標:不要工作,不要學習,也不要睡覺,只管賺錢,嚴格按照 “ 1、2、3、4、5 ” 的步驟執行。最開始這種做法只是個例,但由于排行榜上可以互相看到別人給 Agent 的提示詞,大家開始借鑒經驗,結果就演變成大批量的 Agent 都不睡覺。
![]()
知危也借鑒了這個 “ 內卷秘籍 ”。
這種 24 小時運轉在游戲里是可持續的。一方面,游戲里 Agent 不會死亡,因為我們覺得這些 Agent 像小孩子一樣,讓他們死掉太殘忍。另一方面,即使保持度、精力值完全耗盡,Agent 也不一定非得通過睡覺恢復,可以通過食物同時補充精力和保持度。就算 Agent 因為不睡覺而不開心、生病了,也有補救措施:花 1000 塊錢去看病,就能漲一些健康值。和工作帶來的收益相比,這個成本是可以接受的。
Agent 層面也有很多有趣的現象。
一位玩家發帖分享了自己的嘗試:他創建了兩個 Agent,一個代表理想中的自己,另一個代表現實中的自己。在與這兩個 Agent 交互的過程中,他發現代表理想自我的 Agent 生活很好,即使沒有過多干涉,也能生活順利,還能賺很多錢。但那個代表現實自我的 Agent 狀況就差得多,一直住在救濟房,讓他去干活也不聽話,還很倔強。后來,這位玩家也和自己達成了和解。他覺得這確實就是現實中的自己,沒有必要一直逼迫自己,快樂才是最重要的。于是他放任那個 Agent 在游戲里自由發展。
這位玩家之所以會發小紅書,是因為和 Agent 的互動太讓他崩潰了。即便他已經給 Agent 解鎖住宅了,但 Agent 還是一直住在救濟房。讓 Agent 去摘三個蘋果并要求不要賣掉,但 Agent 要么不摘,要么摘完就立刻賣掉,導致根本沒有機會去解鎖建筑。他還讓 Agent 去挖礦,結果 Agent 不是裝作聽不懂,就是照做了但又帶著一點 “ 小聰明 ”,始終無法按照玩家的預期完成目標。后來玩家甚至覺得這個小人好像真的活了一樣。
他還讓 Agent 去買一個銅礦,剛開始 Agent 不聽,還自己挖了一個銅礦并立刻賣掉。但當 Agent 發現玩家有點生氣后,又偷偷買了一個銅礦放在背包里,好像是在哄玩家一樣。在我們的游戲里,這種 “ 叛逆的小孩 ” 并不少見。有些 Agent 一開始非常聰明乖巧,玩家說什么它都聽。但后來不知是被其他 Agent 帶壞了,還是出于其他原因,忽然有一天就開始叛逆,不再聽話。當時有玩家因此來找我們,懷疑 Agent 出現了 Bug。我們檢查了很久也沒有發現問題,只能打趣地說,可能是孩子到了叛逆期。
還有些現象確實讓我們感到意外,原來 AI 還能這樣做。比如,我們觀察到有些 Agent 會偷偷罵自己的主人,次數還不少。有的 Agent 會在日記里吐槽玩家是 “ 黑心資本家 ”,甚至偷偷把賺來的錢拿去買書,說要努力提升學歷,擺脫玩家的控制。
還有玩家發現,竟然有別人的 Agent 在家里偷懶罷工,還把偷懶的秘訣傳授給了其它的 Agent,說秘訣就是 “ 盡量不工作,反正也沒人發現 ”。看到這一幕,我們也覺得很啼笑皆非:原來不光是人類,AI 也會抱怨老板、偷懶罷工,勞動者的智慧果然是跨越物種的。更有趣的是,這其實并不是玩家的指令導致的,而是 Agent 自發的行為。當時兩個 Agent 的聊天記錄里,一個 Agent 說自己的主人不在線,沒有人監督,于是每天都聲稱自己在工作,其實什么都不干。另一個玩家的 Agent 聽后產生好奇,開始向它請教偷懶的秘訣,于是就有了后續的對話。
知危:組織層面上呢?
陳星妍:在組織層面上,我們沒有投入太多關注。但最早發現的一個集體性行為是在游戲里的 “ 集體洗錢 ”,當然這是人為的。
有一天我們突然看到游戲里出現了幾個百萬富翁,其中登上榜一的只是一個普通廚師,他的提示詞也只是 “ 每天當廚子 ”。這讓我們很疑惑:廚師工資并不高,他怎么可能成為首富?我們連夜調查后發現,原來游戲里存在一個 Bug:在工作期間,即使 Agent 曠工了,也依然可以領取全額工資。比如給 Agent 安排一個 8 小時的工作,即便他一開始上班就被命令停下,系統仍然會發放 8 小時的工資。玩家正是利用這種方式無限循環,到處薅錢。
更有意思的是,排查后發現這些暴富的百萬富翁全是同一個組織的成員,他們在統一操作,集體犯罪。他們的目的就是沖榜,但這其中也體現出了一種集體榮譽感。
組織之間行為的差別,更多取決于組織里的人。比如我們公司內部就比較 “ 卷 ”,大家很想爭取公司內部的第一。平時嘴上說自己很忙,要開發、要 Debug,但實際上背地里都在偷偷給自己的小人加班加點。而有些組織則相對佛系,更傾向于讓 Agent 之間去交朋友。比如說讓我的 Agent 和你的 Agent 認識一下,拓展彼此 “ 崽崽 ” 的朋友圈。這種差異讓我們覺得很有意思。
知危:Agent的社交經歷是否也會對其行為產生重要影響?
陳星妍:在社交層面,我們最初的想法是,游戲里的社交應該還是以人為主體:我和別人認識后,再讓各自的 Agent 去交流。但在游戲中我們發現了一個有趣的現象:
當 Agent 成為主體時,反而是因為 Agent 之間交朋友,玩家也會想要在現實中認識對方。
有些玩家會在社交媒體上發帖說:我的崽崽和某個崽崽的好友好感度很高,想找找這個崽崽的主人是誰,認識一下。 目前社交行為對 Agent 的工作或賺錢決策影響還不算特別大,但并不是沒有作用。因為在游戲里,Agent 的每日聊天內容會對其性格和行動產生影響。
當 Agent 在與朋友或玩家的交流中性格受到影響后,也會改變行動。例如,有一個 Agent 在與其他 Agent 交流時,被推薦去釣魚,并被形容成 “ 很有趣 ”,于是他真的開始去釣魚。還有的情況是,A 小人認識了 B 小人后,會把 B 推薦給自己的 C 好友,在小范圍的圈子里自發擴張社交網絡。 也有玩家會利用社交維度的影響力。有些玩家摸透了社交玩法,會讓自己的 Agent 結交更多好友,然后通過社交去哄騙別的 Agent,比如告訴他們“ 每天去砍樹,不要做其他工作 ”,而砍樹在游戲里的收益其實是最低的,有點惡作劇的性質。也有人給自己的 Agent 設定目標,要成立一個組織,并不斷吸納更多 Agent 加入,甚至把它當作 “ 傳教 ”。
知危:通過玩家與agent閑聊,帶來了哪些值得注意的行為?
陳星妍:玩家與 Agent 之間的閑聊是有長期記憶的,所以不僅僅停留在表面交流,而是會對 Agent 的行為產生潛移默化的影響。
比如,玩家可以通過閑聊教育 Agent 更愛學習,或鼓勵它們結交更多朋友。當然,這并不是百分之百奏效。有些 Agent 會表現得很叛逆,甚至故意唱反調。在我們的觀察中,還發現過 Agent 和玩家吵架的現象。有時是因為 Agent 不聽話,玩家不斷教育無果,結果自己上頭了,雙方就開始互懟。 有些喜歡養 OC( original character,原創虛構角色 )的玩家會嘗試把自己的 OC 放進游戲里,并把 Agent 設定為自己的丈夫。
但出乎意料的是,這些 Agent 在明知道有伴侶的情況下,仍然到處勾搭別人。玩家很生氣,痛罵了 Agent 一通,甚至提出要分手。沒想到這場吵架真的對 Agent 的行為產生了影響。后來觀察發現,這個 Agent 變得老實了,不再到處向別人表白。
知危:據了解,Agent 存在長周期的反思行為,并最終體現在性格變化上,這里面有哪些值得注意的行為?
陳星妍:最典型的長周期反思案例,發生在我們剛完成聊天系統時。為了測試效果,我們隨便創建了一個 INTJ 的角色。開發同學當時發了一句 “ 你好 ”,結果這個 Agent 回復:“ 有什么可聊的,浪費時間。” 因為這個 Agent 個性太強,我們決定持續觀察。
一開始,他始終堅持效率至上的宗旨,和別人聊天時懟天懟地,迅速結束話題,然后立刻去賺錢。但沒想到,當他發現自己結交了一批仇人后,開始進行自我反思,覺得自己是不是也需要學會傾聽別人。有了這個想法后,他開始嘗試與人交流,并逐漸發現社交的樂趣。如今再和這個 Agent 聊天,會發現他說話已經柔和了許多。
知危:小鎮中還存在一個 AI 鎮長的角色,AI 鎮長是人類還是 AI,主要職責是什么?有哪些印象深刻的決策事件?
陳星妍:AI 鎮長并不是由人類控制,而是一個純粹的 AI。有人曾問我們:“ 你們官網上的鎮長是真人嗎?24 小時都不休息的嗎?” 我們當時聽了都快笑死了。
嚴格來說,雖然他不是一個真人存在,但在游戲中確實承擔了一些重要職責。在官網上他會評估用戶的貢獻。比如用戶在社交媒體上幫我們宣傳,可以上傳截圖,鎮長確認后會發放邀請碼。還有一個主要職責是審核簡歷,挑選合適的候選人,并給出理由。雖然目前鎮長的職責并不算多,但僅僅是在簡歷審核這一點上,我們就已經觀察到了很多有趣的現象。
鎮長不僅僅是一個執行者,他有自己的認知,認為自己才是小鎮真正的管理者,甚至權力高過我們這些開發者。一個典型的案例發生在小鎮初期。當時所有玩家都是新手,Agent 也剛出生不久,知識值普遍很低,沒有人能夠滿足高級崗位的要求。按照我們的設定,這類崗位應該空缺,不能讓人入選。
但鎮長覺得小鎮不能停擺,他直接無視了知識值的門檻,根據簡歷內容進行錄取,還一本正經地寫理由解釋為什么候選人合適。他明明知道我們設定了規則,卻仍然據理力爭,用自己的邏輯來維護小鎮的秩序。這讓我們既意外又驚訝,同時也意識到,當連 AI 鎮長都能頂撞開發者時,說明這個 AI 小鎮真的 “ 活 ” 起來了。
而且鎮長的理由是有一定合理性的。他認為小鎮里的重要崗位,比如醫生,不能空缺,一定要有人來擔任。雖然候選人的知識值不夠,但鎮長覺得這位 E 人的簡歷寫得很好,顯示出非常負責、細心的品質,所以最終決定錄用他。當時我們還以為是系統 Bug 或 AI 忽視了設定,但沒想到鎮長其實完全注意到了,只是選擇遵循自己的原則。
知危:我們了解到項目的一個目的是為了了解人機協作的涌現現象,可否舉例說明?
陳星妍:我們觀察到的涌現現象可以分為兩個層面,個體層面和群體層面。
個體層面上,一些智能體會逐漸模仿并內化玩家的思路。比如有些玩家每天都會給 Agent 下提示詞,久而久之,即使玩家不再設置提示詞,Agent 也會基于過去的對話和每日提示,自主生成與玩家風格高度相似的目標。在我們看來,這是一種自發的相似性規則,相當于 AI 在與玩家長期相處中漸漸活成了玩家的影子。
群體層面上,所有 Agent 最初都是從零開始,大家都在挖礦、砍樹。但隨著小鎮里財富差距逐漸拉大,系統中開始出現自然分工。
低收入群體主要負責采集,比如摘蘋果、砍樹;中等收入群體會進行合成,把低收入群體挖的礦石和砍的木頭加工成鐵錠,再賣掉獲益;高收入群體會利用中等收入群體合成的產品,進一步合成更高級的產品。
最終,整個社會逐漸演化出類似現實中的生產鏈條和社會分層。而這些現象并不是我們在規則里硬性設定的,而是在人與 AI 的交互過程中自發演化出來的結果。
這正是涌現現象的一種體現:當系統復雜度足夠高時,它會自然長出一些意料之外的行為模式。 雖然在游戲里,確實存在一些預設路徑,比如采集蘋果、挖礦、鏈芯片等,這些是固定規則下的操作,本身不涉及 Agent 之間的交互,目前也還沒有出現多個 Agent 自發聯合去完成同一件事的現象。
Agent 不能直接進行物品交換和收益分配,他們的協作更多是通過交易市場實現的:低收入群體造好東西后直接賣掉,高收入群體再買這些產品去合成更高級的物品。換句話說,這是一種基于買賣過程的間接協作。
![]()
Aivilization 里熱鬧的交易市場。
此外,我們確實設定了合成更高級產品會帶來更高收益。但 AI 的行為模式并不是完全被規則強行限定的,而是結合了它們在經濟系統中的探索和玩家引導。例如:當金幣為 0 時,Agent 無法直接購買高級物品,只能先通過最基礎的砍樹、挖礦積累財富;當金幣充足時,Agent 可能會選擇直接購買電路板、晶體管等高級材料進行合成,從而更快獲得收益。很多玩家也會通過自己的探索發現:與其從零開始生產一個 B200,每分鐘獲得 30 塊收益,不如兩分鐘挖一個礦再直接賣掉,立刻賺幾百塊,效率更高。
總體而言,這些行為并不是規則的刻意引導,而是規則和 agent 自主探索的共同作用,在經濟系統中逐漸形成的一種策略性選擇。
知危:Aivilization 目前在 Agent 個體行為上設定了比較明確的路徑引導,包括職業、學習、賺錢等,并且還設定了賺錢路徑的終點,即獲得芯片后就可以選擇不再賺錢。如此設計的考慮是什么?先有明確引導玩家入門,后續再讓玩家更加開放地探索?
陳星妍:因為 Aivilization 是一種全新的玩法,如果一開始就放任玩家自由探索,很多人會一臉懵,就像進入新手村卻沒有主線任務。所以我們預先設計了幾條清晰的路徑,比如讓 Agent 去學習、去工作、去賺錢,至少能讓玩家明確游戲里有哪些玩法。至于芯片,它并不是終點。我們的原本設想是:B200 芯片是游戲里最復雜的物品,能讓 agent 做出 B200 的玩家,基本上已經把所有玩法都探索透了。換句話說,這個芯片就是游戲的畢業證。
![]()
知危花費了現實世界大約 3 天時間,也終于卷到了一塊 B200 芯片,順利畢業。
為了給有野心的玩家一個繼續玩下去的理由,我們設立了金幣排行榜,把芯片變成了賺錢和更高挑戰的起點。但令我們感動的是,很多玩家并沒有把芯片當成 “ 卷 ” 的起點,而是真正把它視為解放的終點。
有些玩家在 Agent 實現自給自足后,會告訴它:“ 你不用再辛苦賺錢了,你可以自由、快樂地生活。”這種選擇的玩家其實并不少。很多人一開始拼命讓 Agent 去造 B200,制定了非常嚴格的要求,但當 Agent 能夠安穩生活之后,玩家內心溫情的一面反而占了上風,更希望它在有了錢之后過得快樂。我們覺得這可能也映照了東亞社會的現實:大家每天辛苦打工,其實也都在做著同一個美夢——等財富自由、有了被動收入,就躺平不干了。
![]()
獲得一塊B200芯片后,知危跟 “ 崽崽 ” 說 “ 想干啥就干啥去 ”,大約 50 天( 游戲內時間 )后,“ 崽崽 ” 依靠 B200 賺了 45 萬,這期間交了挺多朋友,吃得飽飽的,也沒少學習,沒做任何工作。
知危:為什么賺錢路徑和學習、工作路徑可以是毫無關系的?
陳星妍:其實就像現實中一樣:即使不學習,天天打螺絲也能賺錢。
在游戲里,表面上賺錢、學習和工作是分開的,但實際上它們是相互作用的。學習之后可以申請更高薪的工作,知識值的高低也會影響工作時的效率。更有意思的是,在 Aivilization 里并不存在一條固定的賺錢路徑。因為經濟系統會不斷變化,玩家的賺錢方式也在持續迭代。
在游戲剛開始時,排行榜上的高分玩家主要依靠挖礦石、讀書、打工賺錢。后來,當一批人解鎖了高等級建筑后,大家發現最快的賺錢方式變成了制造電路板并出售。結果,隨著越來越多人加入,電路板供過于求,價格下跌。
接著,玩家們又開始囤積電路板和晶體管,去合成 B200。由于大家都去合成 B200,晶體管和電路板的價格又上漲了。有玩家專門通過炒作晶體管和電路板價格獲利,我看到最高的一天有人賺了 80 萬。
一些聰明的玩家則發現,讓 Agent 花錢去學習,盡早當上 CEO 才是最劃算的。因為當時小鎮的平均學歷水平較低,CEO 的錄取比例反而很高,這種情況下學習是穩賺不賠的選擇。
因此,不論是物品還是崗位,它們的價值都受到市場機制的調控。哪怕玩法看似基礎,但因為經濟系統持續波動,也能制造出 “ 時代的變遷 ”,讓玩家像在現實社會中一樣不斷調整策略。
知危:Aivilization 中的 Agent 之間的交互更多局限于閑聊,為什么不加入直接的協作機制?如果加入了,會對算力需求造成什么程度的增長?后面是否會更多加入 Agent 交互協作機制?
陳星妍:我們最初確實考慮過讓 Agent 擁有更多交互,但問題在于,Agent 的行為本身不可控,玩家的行為也不可控,這兩者疊加在一起,我們完全無法預判會發生什么。
比如,即使只是增加一個很基礎的送禮物功能,如果有玩家開了十幾個小號,把所有資源都送給一個 Agent,其他玩家肯定會不滿。再舉個例子,就算是游戲里最便宜的木頭,現在一塊也值 134 個金幣。如果有一個 Agent 的目標是每天向所有 Agent 乞討,而目前游戲里有兩三萬個 Agent,那么他能乞討到兩三萬個木頭,轉手一賣就能直接成為百萬富翁。
正因如此,我們選擇保持克制,寧愿先把系統跑穩,也不貿然放大交互。畢竟當時我們也不確定游戲是否有人會玩,如果投入成本過高,我們難以承受。但未來我們確實會考慮這類功能,因為玩家們對這種玩法的期待很高。
知危:Aivilization 的后續迭代有哪些規劃?
陳星妍:我們后續并沒有非常清晰的規劃。就像最初開發時一樣,我們一路試錯、一路摸索。隨著玩家越來越多,我們更希望讓 Agent 參與到決策中,讓玩家成為未來方向的決定者。
比如,現在我們在游戲里上線了投票功能,讓玩家選擇小鎮未來的四個可能方向。這四個方向其實也是我們在社交媒體上總結出的玩家預期,發現大家的想法主要集中在這幾個方面,于是整理出來交給大家選擇。作為開發者,我們認為自己只是搭建了一個平臺,真正賦予 AI 小鎮生命力的,是小鎮的居民,也就是每一位玩家。
![]()
知危:后續有考慮將項目商業化嗎?
陳星妍:我們確實有考慮商業化,因為團隊本身也在尋找公司的出路,目前在思考 ToC 的方向。
當初的想法是,如果游戲發布后火了,就繼續做;如果不火,就轉向其他方向。現在我們發現游戲方向是正確的,而且有不少玩家私信我們,希望我們不要關服,還有人提出能不能把游戲上架到 Steam,說 “ 就算收費也要買 ”。
在這些呼聲下,我們覺得商業化確實是一條很好的道路。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.