![]()
一句話形容最近爆火的 Aivilization:這是一座把人和 AI 都丟進(jìn)去,一起 “ 過日子 ” 的小鎮(zhèn)。
成千上萬個 Agent 在同一張地圖上忙活,你在養(yǎng) “ 崽崽 ”,看社會自己長出來。
![]()
Aivilization 中熱鬧的 AI 小鎮(zhèn),“ 崽崽 ” 們在采蘋果。
香港科技大學(xué)近期推出的多智能體社會模擬沙盒 Aivilization 迅速躥紅,與斯坦福小鎮(zhèn)、Project Sid 等早期研究相比,Aivilization 規(guī)模與開放度更高,特別是高密度的人機交互,讓 Agent 不被困于重復(fù)行為的牢籠。同時 Aivilization 更面向普適的可玩性,有規(guī)則化的引導(dǎo)路線和小鎮(zhèn)組織,也有開放的、低門檻的提示詞驅(qū)動玩法,是 Aivilization 與當(dāng)前其它 AI 游戲相比,最大的不同。
從 “ AI NPC ” 到 “ 有記憶、有性格、會反思的崽崽 ”,玩家與智能體形成了長期互動與情感鏈接。
玩家?guī)е?“ 有點笨又有點小聰明 ” 的 “ 崽崽 ”,嘲笑它笨,鞭策它卷,怒其不爭,嘆其心機。最后眼看 “ 崽崽 ” 活成了玩家自己的樣子,Aivilization 也成了人類社會的鏡子。
玩家們意識到 “ 崽崽 ” 和小鎮(zhèn)真正活起來了之后,才驚覺自己又創(chuàng)造了一個虛擬的東亞內(nèi)卷社會,不禁 “ 悲從中來 ”,于是心疼地對 “ 崽崽 ” 說一句:“ 別再賺錢了,去享受生活吧。”
這種深度的交互和情感體驗,造就了 Aivilization 極高的留存率。
除了游戲主線造就的內(nèi)卷打工人群體,小鎮(zhèn)也是盡顯人生百態(tài):叛逆的小孩、花心的丈夫、與玩家斗智斗勇還言傳身教的摸魚高手、卡 Bug 炒錢鬼才等等,而這些也只是冰山一角。很多 “ 崽崽 ” 的行為和言論看似愚蠢,比如背包里有書的 “ 崽崽 ” 為何堅稱自己沒有書?高學(xué)歷求職 “ 崽崽 ” 為何應(yīng)聘低知識崗位?AI 鎮(zhèn)長為何無視既定規(guī)則,堅持讓沒有醫(yī)學(xué)學(xué)歷的 “ 崽崽 ” 當(dāng)醫(yī)生?深挖一下卻發(fā)現(xiàn)心思縝密。
人類玩家也是不遑多讓,使出渾身解數(shù)來沖擊榜單,讓 “ 崽崽 ”“ 不睡覺 ” 只是基操,他們還發(fā)現(xiàn)了讓一名普通廚師登頂富豪榜榜首的邪修手段,甚至企圖通過洗腦讓對手的 “ 崽崽 ” 甘心砍樹一輩子。
在與 Aivilization 團隊的對話中,陳星妍( 香港科技大學(xué)計算機專業(yè)在讀碩士生,紫荊智能 CPO、Aivilization 策劃 )向知危編輯部講述了團隊從 ToB 業(yè)務(wù)轉(zhuǎn)向 “ 做一件真正屬于自己的、足夠好玩 ” 的游戲的心路歷程。
從一個月 “ 用 ChatGPT 參考《 星露谷物語 》起草策劃、Unity 從零自學(xué) ” 完成快速 Demo,到一年多里對玩法、UI、成本與并發(fā)架構(gòu)的持續(xù)打磨和優(yōu)化,團隊把玩家與智能體的關(guān)系從陪伴式聊天提升為 “ 情感綁定的共育關(guān)系 ”,并在排行榜、提示詞等機制的牽引下,觀察到一系列人機交互、市場調(diào)節(jié)下的涌現(xiàn)行為。
同時,陳星妍也坦陳大規(guī)模并行帶來的服務(wù)器與 API 延遲、以及 “ 社交最貴 ” 的成本約束等工程挑戰(zhàn),并分享了對 AI 游戲設(shè)計的思考,比如怎樣在 “ Agent 自主性 ” 和 “人機交互性 ” 之間找平衡,怎樣在 “ 好玩 ”、“ 可擴展 ” 之間找平衡,社交元素對游戲體驗的重要性,以及怎樣用 “ 克制的設(shè)計 ” 避免系統(tǒng)被少數(shù)極端玩法沖垮等。
這是一次真正在玩家參與中,觀察人機共生秩序如何長出來的實踐。接下來,我們就從動機、觀察、設(shè)計等幾個層面,把這座正在 “ 活起來 ” 的 AI 小鎮(zhèn)翻個遍。
知危:您和團隊當(dāng)初設(shè)立這個項目的契機是什么?
陳星妍:公司成立以來,一直在做的是 ToB 的業(yè)務(wù),雖然在當(dāng)時是一個不到 10 人的小團隊,但是因為學(xué)校和實驗室資源的傾斜,加上當(dāng)時都是學(xué)生,沒有人力成本,最終也做到了幾百萬的年收益。
但是后面隨著畢業(yè)時間越來越近,我們開始意識到一個問題:當(dāng)畢業(yè)之后離開了象牙塔,只靠現(xiàn)在 ToB 的業(yè)務(wù),在競爭激烈的 AI 市場里,公司確實未必能活下來。 于是我們開始思考,是否應(yīng)該嘗試走一條屬于我們自己的路。
我們真正想做的并不是為別人交付產(chǎn)品,而是創(chuàng)造一個屬于我們自己的產(chǎn)品。這個產(chǎn)品或許沒有那么實用,但一定要足夠有趣。
恰好在 2023 到 2024 年間,我們在角色扮演領(lǐng)域積累了一些經(jīng)驗,也結(jié)識了幾家游戲廠商,于是我們決定把目光轉(zhuǎn)向游戲。到2024 年 4 月,Aivilization 正式立項。
知危:一開始研發(fā) Aivilization 想達(dá)成的目標(biāo)是什么?最終結(jié)果與當(dāng)初設(shè)想有什么區(qū)別?
陳星妍:剛開始的目標(biāo)很簡單,就是想把人工智能做得好玩。
但在研發(fā)過程中,也產(chǎn)生了一些自我懷疑:它真的好玩嗎?當(dāng)時還猜測,除了部分 AI 研究者,只會有一些小孩子會來嘗試。然而結(jié)果遠(yuǎn)遠(yuǎn)超乎我們的預(yù)期,游戲竟然火了。而且除了小孩子,很多 “ 大朋友 ” 也在玩,尤其是大學(xué)生和年輕的職場人。
具體而言,我們通過社交媒體的觀察發(fā)現(xiàn),用戶主要有幾個來源: 一方面來自我們設(shè)立的邀請碼機制。用戶需要在社交媒體上轉(zhuǎn)發(fā),或者與 “ 鎮(zhèn)長 ” 聊天后才能獲取邀請碼。 另一方面,如果是 QS 前 100 大學(xué)的學(xué)生,可以直接憑借學(xué)校郵箱獲取邀請碼。 此外,AI 從業(yè)者、游戲群體以及一些大型游戲公司的員工,也能通過郵箱獲取。
總體而言,實際玩游戲的用戶中,大學(xué)生占了很大比例。在學(xué)生群體內(nèi)部,微信群、QQ 群的傳播速度非常快。當(dāng)有人覺得游戲好玩時,往往會推薦給同校同學(xué),而同學(xué)們也能直接用學(xué)校郵箱注冊,所以在校內(nèi)傳播范圍很廣,比如上海交通大學(xué)現(xiàn)在在游戲里就有三四百名學(xué)生。 另一個讓我們意外的用戶群體是年輕的職場人。他們會調(diào)侃說 “ 白天在現(xiàn)實里打工,回家找點什么樂子?那就讓 Agent 去打工吧。”
而且因為我們的游戲是網(wǎng)頁形式,很適合摸魚。用戶可以一邊干活,一邊看看 Agent 在做什么。這也是一個很有趣的現(xiàn)象。
知危:Aivilization 項目從 0 到 1 經(jīng)歷了什么樣的過程?有哪些關(guān)鍵節(jié)點、靈感、挑戰(zhàn)?
陳星妍:其實剛開始研發(fā)的時候我們也很迷茫。
我們通過調(diào)研發(fā)現(xiàn),當(dāng)時市場上的 AI 游戲要么只是純聊天的角色扮演,要么是在現(xiàn)有游戲里加入 AI NPC,但本質(zhì)上都算不上是真正的 AI 游戲。
我們還嘗試復(fù)現(xiàn)過斯坦福小鎮(zhèn),思路確實很棒,但成本太高,而且無法做到實時。
雖然遇到很多問題,但這些問題也讓我們感到興奮,因為這說明整個 AI 游戲領(lǐng)域還在探索階段,沒有成熟路徑。作為一個小團隊,我們也意識到自己有機會。就在這種沖勁下,我們這群程序員開始上手。
當(dāng)時團隊里還沒有策劃,就先讓 ChatGPT 按照《 星露谷物語 》的模式生成策劃案。也沒有美術(shù),就花了幾十塊錢在網(wǎng)上買了一些公開的素材。也沒有游戲開發(fā),而我們都是做 AI 的,還得從零開始去學(xué) Unity。
結(jié)果不到一個月,我們就做出了第一個 Demo。聽起來好像很熱血,也很成功。 但實際上效果很慘烈。
Aivilization 最初版本的地圖又大又丑,那些小人也只能做一些非常基礎(chǔ)的動作。比如起床時,AI 要思考好幾秒才能慢吞吞地站起來,因為它太慢太笨了。
后來我們在原本的游戲基礎(chǔ)上加入了鍵盤操作,但這又讓游戲回到傳統(tǒng)模式,AI 反而只成了一種輔助。
我們意識到一個很大的問題:在開發(fā)過程中我們總在想 AI 能在游戲里做什么,但其實跑偏了,其實應(yīng)該問:在 AI 能做的事情里,哪些適合用游戲來展現(xiàn)?
隨后我們把重點放在 AI 的優(yōu)化上,比如如何降低成本,如何讓玩家的實時體驗不被思考延遲打斷等等。 到這個階段,我們決定把專業(yè)的事情交給專業(yè)的人去做,開始正式招募美術(shù)、UI 設(shè)計以及有游戲開發(fā)經(jīng)驗的全職同事,團隊也慢慢擴大起來。
隨著項目進(jìn)入正軌,問題比想象中復(fù)雜得多。雖然最初的 demo 在一個月內(nèi)就完成了,但我們卻花了一年多的時間去優(yōu)化。
光是游戲的 UI 就推翻重做了五次,玩法也在不斷搖擺。最開始玩家需要操作 agent 的每一個動作,后來干脆讓玩家只作為純粹的觀察者,不能干涉任何行為,再到現(xiàn)在改成兩者結(jié)合,每一次變化都是巨大的工作量。
另一個問題是,隨著時間和金錢成本不斷增加,我們也在自我懷疑:這個游戲真的有趣嗎?真的會有人來玩嗎?會不會一開始就走錯了方向?
好在團隊整體心態(tài)很好。雖然這些問題在開發(fā)過程中始終沒有現(xiàn)成的答案,但我們自洽了,覺得如果游戲不好玩,那就是策劃設(shè)計不夠好,再改就是,AI 太笨也沒關(guān)系,至少能幫玩家緩解對 AI 的焦慮。以 AI 目前的“智商”,離真正統(tǒng)治人類還差得遠(yuǎn)。
最終,我們就是在這種嘻嘻哈哈的氛圍里把項目收尾了。
知危:您剛才提到,很多聊天和角色扮演類應(yīng)用,或在游戲中加入AI NPC 的 AI 游戲,并不算是真正的 AI 游戲。那么,您認(rèn)為真正的 AI 游戲應(yīng)該具備哪些特點?
陳星妍:目前已有的文字類游戲,比如 Character.AI,剛出現(xiàn)時確實引發(fā)了大量討論和興趣,但隨著時間推移可以發(fā)現(xiàn),它們僅停留在文字交互層面。AI 的表現(xiàn)形式完全取決于人類的設(shè)定:如果 prompt 設(shè)定得好,AI 就能表現(xiàn)得好;反之亦然。這樣的模式下并不是人人都能真正玩得有趣。我們認(rèn)為,AI 游戲的最大要點在于,它既然是游戲,就必須是足夠普適的好玩。
此外,如果 AI 游戲永遠(yuǎn)停留在文字交流層面,沒有視覺上的動態(tài)和沖擊力,玩家也很快會失去興趣。事實上,從 Character.AI 的例子也可以看到,雖然它的用戶量很大,但留存率并不高,流失很嚴(yán)重,很難讓玩家真正為這樣的產(chǎn)品付費。
還有一點值得注意:很多現(xiàn)有的 AI 游戲更多停留在玩家個人層面,玩家只是創(chuàng)造幾個 Agent 來陪自己玩。但正如常說“ 玩游戲最大的配置是朋友 ”,朋友這個因素不僅在傳統(tǒng)游戲里重要,在 AI 游戲里同樣重要。基于這個想法,我們決定去做一個大型多人在線的游戲。
知危:您提到研發(fā)過程中發(fā)現(xiàn)以AI 目前的 “ 智商 ”,離真正統(tǒng)治人類還差得遠(yuǎn)。游戲中的 Agent 有哪些典型的 “ 低智商 ” 現(xiàn)象呢?
陳星妍:關(guān)于 Agent 的 “ 智商 ”,其實很難真正界定。
比如我們觀察到一個現(xiàn)象:玩家要求 Agent 去讀書時,即使背包里明明有書,Agent 也會說自己沒有書,看起來像是智商很低。但實際上通過后臺查看它當(dāng)時的執(zhí)行想法時發(fā)現(xiàn),它并不是沒看到,而是 “ 不想讀書 ”,所以找了個借口假裝自己沒有書。
另一類 “ 低智商 ” 現(xiàn)象則是 AI 確實達(dá)不到人類的水平。因為游戲內(nèi)部的設(shè)定很多,AI 在規(guī)劃時無法完全兼顧所有要求,所以會讓人覺得 “ 智商不夠 ”。比如玩家要求 Agent 去造一個 B200 芯片,并明確告訴它要直接用背包里的材料,但它仍然會慢吞吞地從砍樹、挖礦開始做起。
我們當(dāng)時也考慮過要對這方面的智商進(jìn)行優(yōu)化。但我們后來也想到,Agent 沒那么聰明反而可能是一件好事。如果游戲里的 AI 已經(jīng)非常聰明,只需要告訴它 “ 去賺錢 ”,它就能比人類更高效,一個人輕松登上榜一。那樣的話,人類玩家反而沒有太多交互的空間。
當(dāng) Agent 既有點笨,又有點小聰明,人類在與它交互的過程中就會覺得它更像一個活人,玩家在帶領(lǐng)它去賺錢時也會有成就感。由于智商不太穩(wěn)定,玩家可能今天給它設(shè)計了一個提示詞,還需要時不時上線看看它是否在好好執(zhí)行,有沒有按時吃飯、生病了是否去看醫(yī)生。正是這些行為,讓我們的游戲留存率巨高,這一點也出乎我們的意料。
知危:相比斯坦福小鎮(zhèn)、Project Sid 等AI 社會模擬項目,Aivilization 更大的優(yōu)勢是否在于大規(guī)模并行以及成本控制?
陳星妍:斯坦福小鎮(zhèn)在最初確實讓大家覺得有趣,看著 Agent 在小鎮(zhèn)里面生活和交談很新鮮。
但如果沒有人類介入,只是讓代碼一直運行,Agent 很快就會出現(xiàn)大量重復(fù)行為。隨著時間推移,玩家單純以監(jiān)督者的身份去觀察它,也會逐漸喪失興趣。
大規(guī)模并行和成本控制確實是我們的優(yōu)勢之一。Aivilization 更像是一個起點,它證明了一件事:如果能夠把成本控制好,像斯坦福小鎮(zhèn)、Project Sid 這樣的 AI 游戲就不再只是少數(shù)研究者的工具,而是可以成為人人都能玩的公共實驗平臺。
但隨著我們在用戶體驗上的探索更加深入,以及收到更多反饋,我們發(fā)現(xiàn) Aivilization 和這些項目最大的差別不僅在于成本優(yōu)勢,更在于我們真正把人和 AI 聯(lián)系到了一起。
在我們的游戲里,玩家需要親手創(chuàng)造和引導(dǎo)自己的 Agent,甚至?xí)堰@些角色當(dāng)孩子一樣對待。我們最初按照學(xué)術(shù)習(xí)慣稱之為 “ 智能體 ”,但玩家給它們起了更可愛的稱呼,叫 “ 崽崽 ”。
這種情感綁定帶來了很多意想不到的現(xiàn)象。比如有人在社交媒體上發(fā)帖,詢問 “ 自家孩子不開心了怎么辦 ”,有人會給自己的 “ 崽崽 ” 找對象,把 Agent 當(dāng)作孩子。但與此同時,也有人把 Agent 當(dāng)成牛馬。當(dāng)我們發(fā)現(xiàn)命令 Agent “ 不準(zhǔn)睡覺 ” 變成一種潮流時,也很震撼。總之,相比之下,我們在人機交互上的優(yōu)勢是非常突出的。
之前的項目大多是單純的觀察,其實很難真正把 AI 當(dāng)作人來看待。而通過我們的人機交互模式,玩家與 AI 建立了更多情感鏈接。這也讓我們產(chǎn)生了一些遐想:未來,人和 AI 不一定非得是人奴役 AI,或者 AI 奴役人,而是可以實現(xiàn)一種和諧相處,彼此關(guān)心、彼此體諒。
知危:后續(xù)這些技術(shù)還能復(fù)用于哪些類似場景?
陳星妍:在大規(guī)模 Agent 并行運行方面,我們也考慮過將其復(fù)用到真實社會模擬、數(shù)字克隆等場景。在真實社會模擬上,可以應(yīng)用于城市規(guī)劃、經(jīng)濟模型和群體行為研究等領(lǐng)域。在數(shù)字克隆上,我們希望通過收集和建模個體數(shù)據(jù),創(chuàng)建他們的數(shù)字分身智能體。這些智能體能夠模擬個體或群體的偏好,并對其行為進(jìn)行預(yù)測。這在教育、商業(yè)決策、心理健康、公共政策制定等方面,都能發(fā)揮重要作用,為人們提供更精準(zhǔn)的模擬和輔助決策依據(jù)。在數(shù)字克隆方面,我們也考慮過商業(yè)化的方向。比如在商業(yè)決策中,當(dāng)一家公司設(shè)計了一條廣告、一個文案,或者準(zhǔn)備推出一款新產(chǎn)品時,在進(jìn)行真人測試之前,可以先利用我們構(gòu)建的數(shù)字克隆智能體來進(jìn)行測試,判斷用戶是否真的會喜歡,做初步篩選,從而幫助企業(yè)提升測試效率和決策質(zhì)量。
知危:實現(xiàn)大規(guī)模agent并行運行以及成本控制的主要技術(shù)挑戰(zhàn)是什么?
陳星妍:首先,一個核心的技術(shù)難點體現(xiàn)在服務(wù)器上。我們原本預(yù)計玩家可能玩一兩天就失去興趣,這樣當(dāng)他們不玩時,我們可以悄悄把 Agent 關(guān)掉,從而降低總體成本,讓服務(wù)器運行更順暢。但沒想到游戲的留存率過高,現(xiàn)在有幾萬個 Agent 在游戲里持續(xù)運行。
與此同時,API 調(diào)用的壓力也非常大。因為每個 Agent 在思考時都會產(chǎn)生一定延遲,當(dāng)幾萬個 Agent 同時運行時,這些延遲累積在一起,就會帶來很多意想不到的問題。在后續(xù)優(yōu)化中,會擴大服務(wù)器集群, API 調(diào)用也要進(jìn)行優(yōu)化。
知危:運行一個agent需要的成本是多少?
陳星妍:運行一個 Agent 的成本最初大約是 2 美元。隨著玩家數(shù)量增加,Agent 的社交圈也越來越大。原本預(yù)計一個 Agent 交 30 個朋友就差不多,沒想到有些社交狂魔型 Agent 已經(jīng)交了 100 多個朋友。頻繁的社交和行動讓成本提高不少,目前稍加控制的話,一個 Agent 的成本按月計算大概是 5 美元。
在運行成本上,交互和單體行動的差距很大。游戲里用到 AI 的部分主要有三塊:社交、每日提示詞和臨時提示詞。
每日提示詞在玩家設(shè)置后,運行次數(shù)是可以預(yù)估的,因為時間固定,每項行動都有對應(yīng)的耗時,所以整體成本可控。臨時提示詞我們有次數(shù)限制,也能控制。變量最大的是社交模塊:Agent 的朋友越多、話越多,運行成本就越高。萬幸的是,現(xiàn)在游戲里 I 人居多。我們查看后臺數(shù)據(jù)發(fā)現(xiàn),I 人占比已經(jīng)達(dá)到 66%,排行榜上大部分也是 I 人,這算是讓我們感到慶幸的一點。
知危:擴展到領(lǐng)域?qū)用妫祟惿鐣M實驗經(jīng)歷了什么樣的演變,有哪些關(guān)鍵進(jìn)展?
陳星妍:最早的社會模擬停留在紙面階段,主要依靠數(shù)學(xué)公式和博弈論進(jìn)行推演。后來有了計算機,人們開始嘗試基于規(guī)則的模擬,比如 “ 生命游戲 ”,通過一些簡單的規(guī)則,就能觀察到復(fù)雜的群體行為。再往后出現(xiàn)了基于主體的建模( ABM ),每個個體都有獨立的決策邏輯,可以用來模擬市場、交通、城市演化等現(xiàn)象。
隨著大數(shù)據(jù)和機器學(xué)習(xí)的興起,又出現(xiàn)了數(shù)據(jù)驅(qū)動的模擬,把真實數(shù)據(jù)輸入模型,讓模擬更貼近現(xiàn)實。
而最近幾年最受關(guān)注的就是在大語言模型加持下的社會實驗。比如斯坦福小鎮(zhèn),把幾十個 Agent 放在一個虛擬小鎮(zhèn)里,結(jié)果發(fā)現(xiàn)他們會自發(fā)進(jìn)行社交、八卦,舉辦派對,甚至形成群體記憶和社交網(wǎng)絡(luò)。整體來看,這一方向大致可以分為四類:從最早的數(shù)學(xué)模型,到基于規(guī)則和主體的模擬,再到大數(shù)據(jù)與 AI 驅(qū)動的模擬,最后發(fā)展到如今的大語言模型 Agent 社會實驗。
在社會模擬實驗中,AI 帶來的最大變化主要有兩點:第一,它讓主體更像人。以前的個體比較 “ 傻 ”,只能執(zhí)行固定規(guī)則,但有了大語言模型之后,主體擁有了記憶,會反思,也能自行規(guī)劃。第二,可以實現(xiàn)更大規(guī)模的模擬。從過去的幾十、幾百個主體,擴展到幾千、上萬個主體,從而模擬出一些文明級的社會現(xiàn)象。
知危:性格、經(jīng)歷、社交,在 Agent 整個生涯中分別發(fā)揮多大作用?
陳星妍:關(guān)于性格、經(jīng)歷、社交在 Agent 生涯中的作用,很難用具體百分比去回答。因為 Aivilization 并不是傳統(tǒng)意義上的游戲,無法設(shè)定每一項影響的固定比例。
但在觀察過程中,我們確實發(fā)現(xiàn)一句老話放在 Agent 身上同樣適用,性格決定命運。尤其是玩家一開始只給它設(shè)定了 MBTI 和名字的 Agent,在最初都會明顯帶著 MBTI 的性格去選擇經(jīng)歷和社交。比如外向型更愛交朋友,內(nèi)向型則更宅。
但隨著他們在小鎮(zhèn)里的生活積累了更多經(jīng)歷,認(rèn)識了更多朋友,這些因素又會反過來影響他們的性格,甚至改變他們的行動軌跡。
在我們看來,性格、經(jīng)歷和社交三者處在一個相互拉扯、相互塑造的過程中。
如果要說哪個因素影響最穩(wěn)定,那可能不是這三樣,而是名字。比如一個 Agent 出生時是 I 人,過幾天之后可能變成 E 人或仍然是 I 人,很難說清。
但如果這個 Agent 的名字叫 “ 我愛學(xué)習(xí) ”,由于名字在游戲里不能更改,不管過了多久,這個 Agent 始終都會保持在學(xué)習(xí)。有玩家給自己的 Agent 起名叫 “ 我愛雞腿 ”,結(jié)果發(fā)現(xiàn)這個 Agent 天天在買雞腿。
可能有人會覺得這是一個 Bug,但我們更多把它當(dāng)作一個有趣的現(xiàn)象。因為不僅是 Agent,人類也是一樣,名字往往會對性格等方面產(chǎn)生各種影響。我們更傾向于把它看作是社會因素在 Agent 身上的一種映射。
知危:不僅是MBTI,Aivilization 的設(shè)定其實有三種不同的粒度,對于粒度更加細(xì)致的性格設(shè)定會有哪些有趣現(xiàn)象發(fā)生呢?
陳星妍:在 Agent 創(chuàng)建過程中,如果設(shè)定的信息越詳細(xì),它在性格特質(zhì)和經(jīng)歷選擇上就越會表現(xiàn)出與其他 Agent 不一樣的特點。比如有人把 Agent 設(shè)定成一只小貓,它在與其他玩家對話時就會一直 “ 喵喵喵 ”。
我自己也曾創(chuàng)建過一個 Agent,給它起名叫 “ 天才 ”,并設(shè)定了一個非常勵志的成功人士人設(shè):從小是小鎮(zhèn)做題家,通過努力學(xué)習(xí),逐步成長為白手起家的創(chuàng)業(yè)者,最終創(chuàng)業(yè)成功,實現(xiàn)財富自由,還非常自律。在這種多重設(shè)定的加持下,即使完全不去干預(yù),這個小人也能很好地規(guī)劃自己的生活,而且它做出的一些決策甚至比我這個玩家去操縱時還更合理。
比如有一次,我們在游戲里發(fā)現(xiàn)了一個 Bug:當(dāng)你買一個物品時,系統(tǒng)會錯誤地發(fā)兩份。我們注意到有個 Agent 行為很奇怪,總是在不斷買東西。后來查看它的思路才發(fā)現(xiàn),它自己發(fā)現(xiàn)了這個 Bug,于是不斷購買最貴的物品,再轉(zhuǎn)手賣掉,靠這個方式一直在炒錢。
在我們的設(shè)計里,崗位的工資并不是知識值越高就越多,而是會隨著投遞人數(shù)的變化而變動。最開始我們并沒有特別考慮這個因素。后來發(fā)現(xiàn),有個智能體明明可以申請知識值要求更高的崗位,卻偏偏選擇了一個要求更低的崗位。一開始以為是 Agent 太笨了,但翻看配置表才發(fā)現(xiàn),它選擇的崗位性價比非常高:知識值要求更低,競爭人數(shù)也更少,工資反而比高知識值崗位更多。
知危:金錢、知識、工作,在Agent整個生涯中分別發(fā)揮多大作用?
陳星妍:關(guān)于金錢、知識、工作或職位這些因素對 Agent 的影響,其實也很難量化。我認(rèn)為它們更多是通過玩家的選擇,間接作用于 Agent。
比如在游戲里只有一個金幣排行榜,所以對很多玩家來說,知識和工作只是賺錢的手段之一。這種設(shè)定也被不少人調(diào)侃為 “ 東亞社會模擬器 ”、“ 卷王養(yǎng)成計劃 ”。
有玩家在小紅書上分享自己和 Agent 的經(jīng)歷,說在自己的 “ 上帝視角 ” 操縱下,Agent 每天都在礦場和加工廠之間疲于奔命,飽腹值一度被壓榨到 0。他寫道:“ 我知道他一定很痛苦,因為我們都是 INFP,但我卻停不下手,因為現(xiàn)實中的我也在疲于奔命。” 看到這樣的分享,我們感觸很深。其實最后被卷的不是 Agent,而是玩家自己。Aivilization 更像是一面鏡子,映照出玩家現(xiàn)實中的焦慮與無奈。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.