![]()
出品|虎嗅商業消費組
作者|苗正卿
題圖|視覺中國
如何讓一艘正在航行的巨型輪船,在保持前行的同時“換上”新引擎?
這是擺在23歲淘寶面前的“歷史級考題”:擁有10億年度活躍用戶、300余萬商家、6.5萬億年GMV的淘寶,需要完成一場AI升級。而考題的難點在于,它要一邊確保業績穩中有增,一邊確保用戶和商家感覺不到“升級陣痛”。
虎嗅獨家獲悉,2024年12月,淘天決策層針對AI升級進行了多次會議,經過討論后,內部逐漸梳理出三件“最具確定性”的需要通過AI升級的事情:1.大幅度提高流量匹配效率(搜推廣) 2.為商家增效降本 3.新的AI導購產品。而在2025年3月,三件事陸續啟動。
整個過程,采用了AB測試、灰度上線等阿里傳統打法。虎嗅了解到,上述三個事情,幾乎并行。由阿里巴巴中國電商事業群搜推智能事業部和CTO技術線共同牽頭,多個兄弟部門協同推動。
從虎嗅視角觀察,這個過程是非常謹慎的。有知情人士告訴虎嗅,所有AI相關新功能、工具,都會從2%用戶量這個階段開始測試。常見的模式是,采用了新AI產品的2%用戶會被納入到一段為期數周的觀察期。在這兩周之內,技術團隊、數據團隊等部門會連夜復盤,并研究消費者體驗變化背后的原因。
如果一個AI功能或產品,在2%用戶量的維度獲得了不錯的反饋,那么接下來會進入5%、10%直到50%的漫長測試周期,直到50%這個量級測試依然展現出良好的結果,這個產品/工具才能全量上線。
伴隨這個過程的,是幾個“過去十幾年少有的大項目”的誕生。其中的代表項目是“商品庫”。在過去23年,淘寶積淀了龐大的商品信息庫,但傳統的商品信息和淘寶迫切希望引入的生成式AI大模型之間存在“代溝”——過于潦草、錯誤的商品信息,無法讓大模型理解、學習,也無法讓大模型發揮出真正的實力。
但徹底改造數以幾十億級的商品信息庫無疑是個大工程。虎嗅了解到,淘天把AI作為生產力引入到這個超級工程之中。團隊開發了單獨的AI Agent去自動學習、撰寫商品信息,然后AI Agent還會完成復查環節,基于AI助力,這個在人工時代“多年未解決”的難題,在數個月時間里得到了顯著效果。而基于這個新商品庫,淘天重新引入了基于大模型的“搜推廣”體系,改變了舊有的流量分配生態。
虎嗅獲悉,自3月開始,淘天陸續完成了商品庫、六個AI創新產品(AI萬能搜、AISummary、拍立淘、AI幫我挑、AI試衣、AI清單)、搜推廣體系長尾詞復雜詞AI升級、商家AI工具升級等一系列工作。從數據看,這些動作帶來了流量匹配效率雙位數增長。據悉,淘寶復雜語義下搜索相關性提升了20個百分點,推薦信息流點擊量提升10%,商家廣告ROI提升12%。
10月16日,虎嗅在天貓雙11發布會上獲悉,2025天貓雙11將在10月20日晚上8點開賣,今年將是首個AI全面落地的天貓雙11。在用戶側,六款AI創新產品已經在雙11前上線或開啟內測;在搜推廣體系,淘天在雙11前已經完成了包括復雜詞在內的幾個重點AI升級項目。而有品牌商家告訴虎嗅,在今年雙11前,商家后臺已經出現了超過至少10款新的AI工具。
AI顯然已經成為本屆雙11,和當下淘寶天貓進化的關鍵詞。
在16日早些時候,虎嗅與阿里巴巴中國電商事業群搜推智能總裁凱夫進行了獨家交流,這是今年6月份虎嗅與凱夫交流阿里國際AI升級后的再次深入溝通。凱夫分享了他對于淘天AI升級的思考,以及他們在整個過程中的一些基本的、關鍵的邏輯,下附交流實錄,有刪減:
虎嗅:2024年雙11后,您回歸淘天帶隊推動AI升級,你們團隊思考AI進化的整個脈絡是怎樣的?重點做了哪些事?
凱夫:我覺得本質上關鍵的是圍繞三件事。第一個是“搜推廣”的AI升級,也就是在搜索、推薦、廣告三個方面大幅度提高流量匹配效率;第二個是為商家增效降本,這里面包括了很多toB的AI工具,比如美工、客服這些環節;第三個是AI創新產品,主要是一些新的AI導購產品,比如我們的AI萬能搜、AI助手。
虎嗅:這三件事有優先級嗎?你們內部啟動的時間點是有前后順序的,還是幾乎同步?
凱夫:是同時去做的。同時開始討論,同時立項。我們大部分的討論,是在2024年12月就開始了,然后在年初基本上都定下了基本的思路。這三件事,我們整體上是從3月份著手去做的。
虎嗅:為什么選擇這三件事去做?
凱夫:搜推廣的AI化是我們非常有確定性的一件事。因為搜推廣是所有電商平臺的核心,一個電商平臺最重要的其實就是它的商品體系加上搜索、推薦、廣告,這構成了電商平臺的核心引擎。搜推廣體系的效率和能力,直接決定了消費者能不能找到想要的商品、決定了商家有沒有流量。
其實早在生成式AI誕生前,“搜推廣”就已經是機器學習最重要的應用場景之一。當生成式AI出現后,針對“搜推廣”的AI化,其實有兩種思潮。
第一種思潮認為,搜推廣和生成式大模型是兩條路,也就是說不要把二者融合,而是單獨去基于大模型做一些新的東西。第二種思潮,則是想把商品當成token,用生成式大模型next token prediction的范式徹底改造搜推廣。
這兩種思考,其實本質上都有各自的問題。第一個的問題在于,它把這兩件事看得太割裂了;第二個的問題在于,過于理想主義,步子邁太大了。
所以2025年初,我們做的第一個決定是,認為搜推廣是大模型最好的應用場景,我們決定把跟大模型相關的算力、資源投入到搜推廣這件事上。
此后我們做了第二個決定,就是到底怎么投入。我們思考后認為,不能像“科幻小說”那樣迅速完成徹底的、未來的改變,而是要基于現有體系做融合,也就是把大模型的能力加進來。
我舉個例子,搜推廣有很多環節,從當下最優解去看,并不是說所有環節都大模型化就最佳。比如索引環節我可以用大模型、相關性判斷環節我可以用大模型,但在個性化預估環節我其實用以前的稀疏模型也是可以的。簡單來說,一些必須依靠大模型去升級的環節,我們去做升級,但并非全面推翻以往的鏈路。這是一種務實的方法。
這里面還有很多精細化的做法。比如我們會把大模型的能力蒸餾到相對小一點的模型上,簡單說就是用大模型當老師來教小模型。
我來總結一下,在第一件事“搜推廣”AI升級上,我覺得有兩個關鍵點,第一是要把大模型用到搜推廣之中去;第二是,不要做理想主義、不要追求一步到位的系統性替代,而是做融合,讓傳統架構和新架構各自解決擅長的問題。
第二件事是商家側的AI進化。這包括了各種AI工具,這其實涉及了過去20多年阿里的一系列積淀。比如我們的店小蜜,我們很早就有這個產品了,只是之前用的是規則式NLP技術,今天我們把大模型用進來了。這部分其實比較好理解,我就不展開了。
第三件事就是我們的AI創新產品。我們在今年七月、八月、九月一直在測試、上線各種AI產品,我們最早的初衷肯定是希望這些AI產品能帶來一些以往完全沒有的體驗。
我覺得這些產品背后,我們有兩個共性的關鍵邏輯,其一是我們希望每個產品去解決一個用戶痛點。我們沒有去追求一個特別理想主義或者原教旨主義的東西,而是想解決問題。比如我們AI萬能搜想解決復雜場景下商品推薦問題或者說需求發現問題。比如AI助手,我們解決的是挑選難度的問題。
第二個關鍵邏輯是,我們在做一個取舍:到底是把AI產品、工具融入到主產品的使用場景之中去,還是說以“一個超級入口”形式去通過對話解決所有問題。
我們選擇融入使用場景。當然這個不絕對,但我們大部分AI創新產品,是融入或嵌入到使用場景里的,而不是通過一個獨立入口去做。這背后的決策因素和淘寶用戶天生的動線、習慣有關。我們需要把AI的能力,沉浸式埋入到場景里。
虎嗅:你講的這三件事,感覺更像是水面上的冰山,水面下似乎還有很多你們做的事情。比如你們今年花了很大精力做升級商品庫?(虎嗅注:從2025年初開始,淘天把過去二十余年積淀的商品信息庫,做了AI升級,補充了大量更符合大模型學習、理解的商品信息,也做了二十余年來最大規模的一次徹底梳理)
凱夫:你說得很對。我以搜推廣為例,商品庫其實就是搜推廣這件事水面下的部分。因為商品庫是我們做搜推廣AI升級的先決條件。
搜索最簡單的工作原理,就是以搜索詞為出發點,用戶問一個詞,然后引擎把這個詞和商品做匹配。這里面關鍵點在于商品信息。如果你的商品信息是豐富的、準確的,那么模型、算法是容易理解的,但如果商品信息缺失或者錯誤,模型和算法是無法理解的。
簡單來說,需要想辦法讓商家盡量多地寫商品信息。寫得越清楚、越明白,我們就越容易用大模型把用戶需求和商品精準匹配起來。那么怎么去豐富這些信息呢?我們叫底層數據格式的標準化。以往我們需要用大量人工,去一點點查資料、詢問用戶或者商家,然后補充信息。我們今年通過AI去自動豐富、補全信息,最終重新梳理了整個商品庫的底層索引。
這是淘天的一個超級大項目,牽扯到技術、業務很多團隊。而且這是一個缺少了AI沒法做的事情。我給你舉個例子,在2010年、2011年,淘寶小二每天在做豐富商品信息這件事時,會去買百科全書,比如服飾小二,可能就會買一本紡織工業百科全書,然后去查詢品類商品所包含的關鍵屬性。
我們今年用了一個AI Agent。如果沒有這個AI Agent,我們想重新梳理整個商品庫信息,我跟你講我們都雇不起那么多的小二人工,那是一個巨大的工程。但AI Agent可以24小時工作,小二只需要去調教AI Agent就可以了。
虎嗅:我想追問一下,就比如你剛剛講的這個用AI Agent去豐富商品庫的細節,這是一個今年做時機恰好的事情,還是說其實去年做更好?
凱夫:這可能是一個天時地利人和的事情。2024年我們團隊有一些積累,但2025年技術更成熟、技術成本更低。或者說,這件事在2025年的成熟度更高了。需求場景存在、技術成本下降、團隊組織的共識更強,所以今年做這個事情挺合適。
虎嗅:我回到主線,聽你剛才講的三件事以及水面下的事情。感覺比較像是高速路上行駛的汽車要同時換引擎?
凱夫:我覺得換個比喻更合適,我們可能更像是一艘船,然后船一直在前行,我在舊引擎旁邊安裝了一個新引擎。等于我沒有卸下之前的引擎,我裝了倆。
我們在做所有產品技術升級時,我們傳統的業務都在跑。我們一路是靠不斷的AB測試,一點點去推動進化的,測試后數據說話。
虎嗅:你剛才提到的商品庫,感覺它其實是未來若干年淘天生存發展的一個新基礎設施?
凱夫:你可以這么理解。
虎嗅:那今年你們做的這些事情或者項目,還有什么可以屬于這個范疇?
凱夫:我覺得整個搜推廣都屬于這個范疇,這是非常底層的大基建。
虎嗅:這些事情,都是過去八個月左右完成的?
凱夫:我們之前有過一些討論,然后開始做是三月份。搜推廣整體的進化,其實是一個連續的過程,之前幾年我們也在不斷更新。但今年三月份開始,我們在搜推廣上開始有比較大規模的投入,包括針對大模型的算力、資源的投入。
但我覺得,很多事情,確實是淘天這些年動作的延續。比如生意參謀、店小蜜我們都做了很多年了。今年跟以往業務節奏上的差異,我覺得是大項目多一些,比如商品庫就是大項目。
虎嗅:大項目你們是怎么定義的?
凱夫:就是時間長、投入的資源人力多,一般都是一些相對底層的東西。我們今年團隊的勇氣確實是值得嘉獎的,因為我們挑戰了一些以往很多年沒動的事情。商品庫其實我們過去十幾年并沒有大的質變。
虎嗅:聽你剛才分享的內容,這種大項目少不了AI這個生產力。之前和你聊,你并沒有通過OKR這些手段去強推團隊用AI工具,今天你依然保持這個思路嗎?
凱夫:我更希望大家是需求驅動。以商品庫這件事為例子,其實根本不需要定一個AI工具相關OKR,因為沒有AI這件事是做不出來的。
虎嗅:從外界視角看,你們做的這些事情,其實是“動筋動骨”的,但同時你們要確保用戶體感在線。這種平衡是怎么保持的?
凱夫:我們是逐步“切流”,通過新老并存的方式去一點點測試,我們叫灰度上線。其實這些事情,也是靠一個個補丁打起來的。
本文來自虎嗅,原文鏈接:https://www.huxiu.com/article/4793505.html?f=wyxwapp
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.