媒體報道,AI通過通用型聊天機器人和AI編程工具正在改變人們的工作方式,為OpenAI和微軟等公司的收入帶來增長,各家公司一直在嘗試把員工的工作內容交給人工智能代理(AI agents)。
然而,許多企業在使用更復雜的AI代理時卻遇到了困難,這些代理往往“勝任不了工作”,因此AI提供商不得不親自介入、與客戶一起排查問題,避免AI“搞砸事情”。
例如,歐洲零售商Fnac在使用AI客服代理時遇到困難。Fnac曾測試過OpenAI、Google和其他實驗室的模型,但效果不佳。該公司首席數字與電商負責人Olivier Theulle對媒體表示,可靠性是個問題:當顧客反饋產品有缺陷時,AI要求顧客提供產品序列號,但卻把這些序列號與其他產品的序列號混淆了,而這些序列號僅有一位數字不同。
Fnac每年營收達100億美元。Theulle說,直到與以色列公司AI21 Labs達成合作,并獲得其工程師的協助后,這個AI代理的表現才開始變得穩定。AI21聯合CEO Ori Goshen說,
“問題在于,模型開箱即用時在各類基準測試上表現很好,但在真實企業環境中表現并不好。”
“需要進行相當程度的定制化。”
一些公司對媒體表示,只有在自家軟件工程師花上數月時間部署AI代理,并從AI公司那里獲得直接技術支持后,他們才能真正從中受益。如今,科技公司領導者也表示,企業不能指望在沒有AI廠商“手把手扶持”的情況下,讓復雜AI項目順利運行。
風投Vinod Khosla在10月接受媒體采訪時表示,
“這就像說‘我們有輛賽車,任何人都能開’,但普通人根本無法發揮賽車的最大性能。”
Khosla是OpenAI的早期投資者,最近又投資了一家AI咨詢初創公司,該公司向T-Mobile等企業派駐工程師,幫助他們在大型組織內落地AI。這家初創公司Distyl只是眾多在該領域崛起的公司之一,它們為需要支持的企業提供高科技咨詢服務。OpenAI、Anthropic、Salesforce和Snowflake等AI開發商和AI代理提供商也開始招聘前線部署工程師(FDEs)或推出類似咨詢服務,但這往往會提高他們的成本。
另一個例子則是專為汽車經銷商提供軟件、年銷售額90億美元的Cox Automotive。此前該公司開發一個AI代理,用于為經銷商制作營銷網頁。由于該公司是亞馬遜云服務AWS在汽車領域的最大客戶之一,所以得到了“白手套式的服務”。
Cox首席產品官Marianne Johnson對媒體表示,AWS工程師和為該代理提供AI技術的Anthropic工程師飛到Cox位于亞特蘭大的總部,與Cox的軟件開發人員并肩工作了數天共同構建這個工具。她拒絕透露Cox為此向AWS和Anthropic支付了多少費用,但估計未來數年可節省數百萬美元的人力成本,因為公司無需再人工為客戶制作網站。
“它很自信地胡說八道”
AI代理的目標是處理客戶服務問題、管理IT系統等各種任務。AI和云服務提供商正在押注企業使用AI代理帶來的收入,將其作為未來一兩年投入數千億美元建設AI數據中心的理由。
但這些供應商以及部分客戶高管表示,AI代理太難配置,而且行為常常不可預測。這使得它們無法用于那些一旦出錯就會造成嚴重后果的任務。因此客戶降低了預期,不再奢望AI代理能自動化太多工作,并暫緩在客戶支持和網絡安全等關鍵崗位部署AI代理。
例如,IT服務巨頭Kyndryl今年開始測試微軟的Security Copilot,這是一款聊天機器人,旨在對接企業IT系統,用簡單英語解釋潛在安全漏洞,相當于自動化網絡安全分析師的工作。但負責公司內部網絡安全的Scott Owenby對媒體表示,當Kyndryl員工嘗試詢問一些基礎問題,比如“哪些公司設備運行的是過期軟件”時,Security Copilot給出的答案明顯是錯誤的。Owenby說,
“它信心滿滿地胡說八道,而我佩服這種自信,但我無法相信它的數據。”
Kyndryl花了約5萬美元測試了Security Copilot六個月,之后決定停止使用這款軟件。Owenby說,
“我基本上是把5萬美元燒了。這不算多,如果哪怕有一點用我們都會繼續用,但我們沒想到它居然完全沒法用。”
Owenby還說,其他AI工具效果更好,例如Palo Alto Networks的軟件可以自動處理網絡安全中重復繁瑣的工作,例如調查員工從新地點登錄或截取敏感數據截圖的情況。這使得他過去一年減少了部分安全團隊的人手,但他表示仍然需要工作人員監控這些AI工具,而不能完全讓AI全權執行。
“有些炒作成分”
博世電動工具(Bosch Power Tools)年營收超57億美元。該公司數字客戶體驗負責人Florian Haustein對媒體表示,公司一年多以來一直在測試一款聊天機器人,用于回答客戶關于工具使用方式和故障排查的問題。
但Haustein表示,這款聊天機器人仍然經常給出錯誤答案,一些錯誤答案甚至可能導致用戶受傷。因此,該項目仍停留在試點階段。他還表示,博世正在測試Google、OpenAI等多家實驗室的模型。
Haustein對媒體說,博世在另一個不那么激進的客服聊天機器人上收效更好,該機器人只回答更基礎的問題,例如在哪可以買到某款產品;還有一款由SAP提供的AI工具能讀取客戶咨詢內容,并自動分配給合適的人類員工。Haustein說,
“我認為‘完全用AI做客服’有些炒作。”
“你必須確保答案接近100%準確……但我們仍然看到幻覺和錯誤答案。我認為我們還沒有達到能夠完全自動化所需要的信心水平。”
一些技術供應商也承認AI代理還未成熟。亞馬遜CEO Andy Jassy在上周四的財報電話會上說:
“現階段,構建AI代理仍比想象中困難。”AI代理產品收入難計算
“但隨著時間推移,企業從AI中實現的很多價值將來自AI代理。”
目前,通用聊天機器人、編程助手、AI搜索和AI視頻生成工具的采用,已經幫助工程、市場和產品管理團隊提升了效率,企業高管們對媒體表示。
這推動了AI供應商的新收入增長:根據媒體的生成式AI數據庫,由OpenAI和Anthropic引領的20家AI原生初創公司,每年因AI辦公用途獲得的年化收入已達230億美元,而三年前幾乎為零。
但要單獨計算“AI代理”帶來的收入卻很困難。在Google、微軟和亞馬遜等云公司,大部分收入增長來自OpenAI、Anthropic和Meta等大型AI開發商租用服務器,而非企業類AI應用。
在出售AI代理的企業軟件公司中,結果不一。Salesforce今年早些時候表示,其Agentforce產品(用于自動化銷售郵件、跟蹤發票等任務)年收入超過1億美元。ServiceNow則稱,其用于自動處理IT服務工單的AI軟件,有望在2026年底前實現10億美元收入。但這兩家公司的收入增長最近幾個季度都比2023年大多數時間慢。
SAP尚未單獨公布AI產品收入,但CEO Christian Klein在本月的財報電話中表示,AI將在未來兩年帶來“雙位數收入增長”。
許多提供AI代理的軟件公司,包括Salesforce、Snowflake和Xero,目前甚至沒有對這類產品收費,他們希望等客戶真正認可價值之后再收費。
ServiceNow全球客戶運營總裁Paul Fipps對媒體表示,近期客戶在試點AI功能方面不再那么興奮,因為他們變得更加現實,開始考慮AI代理究竟能合理自動化哪些任務。Fipps說,
“在過去12到18個月里,由于生成式AI的發展速度太快,很多客戶積極試點這些AI能力,鐘擺被推到了極端的一側。”
“現在你看到鐘擺開始回擺。”
他仍然樂觀,認為隨著AI代理不斷進步,未來幾年企業會繼續大力投入。
目前,AI代理在軟件開發領域最成功。AI編程代理正成為許多公司工程團隊的標配。但軟件工程師仍需檢查AI的代碼,因為AI會犯錯,意味著任務還不能完全自動化。
“保持現實”
Palo Alto Networks首席執行官Nikesh Arora表示,銷售AI工具的公司必須謹慎,不要過度承諾AI能自動化多少工作。他認為,網絡安全崗位要實現完全自動化仍需數年。
“我們保持現實的態度,(完全自動化)需要更多努力,我們必須非常確定,當把操作交給AI時,它采取的行動是正確的,因為網絡安全是有后果的。”
盡管如此,公司仍然認可AI代理帶來的收益,即使需要“有人看著”。例如,加拿大太陽馬戲團Cirque du Soleil正在使用SAP提供的一款AI代理,追蹤其服裝和舞臺布景供應商的發票。
當供應商發郵件詢問發票狀態時,AI代理會檢查SAP系統中發票是否處理完畢,并草擬回復郵件。過去,該公司有兩名全職員工做這件事;現在,這兩人已被安排到其他部門,只需一人審核AI草稿再發出即可。
該工具的運營成本低于一名全職員工的薪資,副總裁Philippe Lalumière對媒體說:
“有時候AI寫的郵件不太禮貌,但供應商得到回復更快、更清楚,所以整體滿意度更高。我們沒有因為它裁員,但生產力提升很明顯。”
與此同時,其他AI代理供應商也提醒客戶,要把這些工具視為實驗性項目,而不是能立即帶來回報的投資。
微軟核心AI產品開發總裁Asha Sharma上周在The Information的WTF峰會上表示:
“把AI代理視為研發預算……一種將在未來5到10年見效的投資。”
“我認為我們還處在非常早期階段……我們現在有數百萬個AI代理投入生產使用,但大家仍然在摸索如何讓AI代理真正有用。”
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.