0
眼下,Agent正在成為AI應用最具爆發(fā)性的方向之一:資本大力押注、玩家競相入局,企業(yè)也爭先恐后落地Agent,唯怕掉隊。
根據(jù)IDC預測,中國企業(yè)級Agent應用市場規(guī)模在2028年保守估計將達到270億美元。
喧囂之下,Agent落地困境也逐漸顯現(xiàn)。一方面,Agent執(zhí)行任務的廣度、深度和效率仍受技術限制,比如用多Agent解決復雜問題,可能需要等半小時甚至更久。另一方面,模型怎么選、應用場景在哪、Agent如何部署等難題也成為企業(yè)的困惑。
機遇與挑戰(zhàn)并存,廠商玩家們時刻思考自身在Agent賽道上的角色:
有玩家自我定位為“全棧人工智能服務商”,憑借AI和云基礎設施優(yōu)勢向全局發(fā)力;有玩家選擇“強強聯(lián)合”,共同切下Agent應用市場的一塊蛋糕;有玩家則致力于成為小而精的“專業(yè)者”,試圖以垂直領域know-how在Agent賽道爭得一席之地。
百舸爭流中,一些先行者嘗試給出自己的階段性思考。(本文作者為雷峰網(wǎng)主筆,長期關注Agent領域,歡迎添加微信skylar_12_14交流。)
擁擠的Agent賽道,頭部玩家何以突圍?
從全球范圍看,在Agent賽道,AI巨頭和云大廠是兩大玩家。
在Agent商用元年,玩家們不約而同采取同樣的策略:先降低企業(yè)使用Agent的門檻,爭奪企業(yè)級市場。
依托底層大模型能力,AI巨頭在Agent賽道上具備先發(fā)優(yōu)勢。
比如頭號玩家OpenAI基于ChatGPT的模型能力推出ChatGPT Agent。但其野心不止于此,還開始進軍Agent開發(fā)平臺,推出企業(yè)級開發(fā)套件AgentKit。
與此同時,更為“全能型”的云大廠則憑借云與AI等基建設施、龐大客戶群和廣泛的平臺生態(tài),成為Agent賽道里的主力玩家。
對于云廠商而言,布局Agent具有重要的戰(zhàn)略意義:Agent是未來的資源消耗大戶,其給云業(yè)務帶來的增長潛力不容小覷。
比如,Google基于Gemini系列模型的能力,推出Gemini Enterprise(Gemini企業(yè)版),為企業(yè)提供構建Agent的無代碼工具和Agent庫。AWS推出Amazon Bedrock AgentCore,為企業(yè)構建Agent提供從開發(fā)到上線的能力底座。
也有云大廠如阿里云等,憑借“全棧AI服務商”的定位展開了更全面的布局。
比如在模型層,通義大模型家族為Agent開發(fā)、應用提供“大腦”,覆蓋語言、語音、視覺、多模態(tài)等領域。在開發(fā)層,阿里云打造了“一站式”大模型服務和Agent應用開發(fā)的百煉平臺,并推出互補協(xié)作的無影AgentBay,提供安全、可信的任務執(zhí)行環(huán)境,幫助企業(yè)開發(fā)、部署符合自身業(yè)務邏輯的Agent。
而在應用層,阿里云也有企業(yè)級一站式平臺AgentOne,結(jié)合阿里在電商領域的行業(yè)know-how,推出了多款開箱即用的Agent。
在云與AI巨頭之外,近兩年涌現(xiàn)的明星初創(chuàng)企業(yè)也成為Agent賽道的潛力玩家。
這類玩家多聚焦垂直場景,以行業(yè)know-how形成競爭壁壘,比如Cursor專注于服務開發(fā)者的編程Agent,Harvey推出法律領域的垂直Agent。
不難看出,在Agent賽道,頭部玩家們目前呈現(xiàn)出兩種截然不同的競爭姿態(tài):
一是全能型選手,即具備“全棧AI”能力的玩家。
“全棧AI”至少覆蓋三層能力:底層的芯片、算力基礎設施,中間層的云計算平臺,以及上層的模型算法。比如阿里云、谷歌云等。
二是具備某項特長的玩家,選擇與其他頭部廠商生態(tài)聯(lián)盟,實現(xiàn)強強聯(lián)手。
以模型算法見長的OpenAI便是典型代表。一方面,OpenAI與微軟Azure合作,將包括GPT系列在內(nèi)的多個模型托管在Azure AI Foundry上,由Azure提供各類云服務;同時還與數(shù)據(jù)平臺緊密合作,將GPT模型原生集成到Databricks數(shù)據(jù)平臺上,幫助企業(yè)在自身數(shù)據(jù)上快速構建Agent。
星火燎原,Agent是否帶來了顛覆式變革?
廠商玩家們在Agent賽道激戰(zhàn)正酣,Agent在企業(yè)落地的熱度也絲毫不減。
阿里云百煉高級產(chǎn)品專家徐志遠介紹,目前Agent在企業(yè)的應用場景主要有三類:
第一類是技術維度方面,對視頻、音頻、文檔等多模態(tài)復雜內(nèi)容進行處理和二次加工,是目前重要的應用場景之一;
第二類是對話機器人、智能客服等交互類場景,比如具備情感陪伴、多模態(tài)且有復雜場景技能的學習機、AR玩具等終端;
第三類則是不為大眾所知但應用價值高、調(diào)用規(guī)模大的智能巡檢和風控場景。
據(jù)他觀察,率先完成Agent落地的是用戶交互高頻的消費電子行業(yè),但與此同時,像畜牧等傳統(tǒng)行業(yè)也在逐步推進Agent。
雖然Agent以星火燎原之勢席卷各行各業(yè),但業(yè)內(nèi)普遍都有一個共識:Agent帶來的顛覆式行業(yè)變革仍在醞釀之中。
一方面,Agent仍有諸多技術瓶頸亟待突破。
Agent的能力主要取決于大語言模型、記憶系統(tǒng)、任務規(guī)劃能力以及工具使用能力,但目前在模型幻覺、多模態(tài)整合、記憶管理、遷移泛化等方面仍存在技術難點。
同時,Agent從實驗室走向企業(yè)的“落地”過程中也面臨諸多技術挑戰(zhàn)。比如不同系統(tǒng)之間融合難、多Agent之間難以協(xié)同等問題。
眼下,企業(yè)使用的業(yè)務系統(tǒng)主要有購買現(xiàn)成的套裝軟件、自研的業(yè)務系統(tǒng)以及兩者相結(jié)合的模式。Agent與企業(yè)原有的ERP、CRM等系統(tǒng)的融合不能一概而論。
“企業(yè)對軟件的定制化能力受限于軟件本身。比如ERP軟件只能在其開放的接口上實現(xiàn)自動化,相對受限;而企業(yè)自研的業(yè)務系統(tǒng)改功能、改流程相對容易一些?!卑⒗镌乒苍剖聵I(yè)部首席解決方案架構師韓鴻源表示。
此外,面對復雜的業(yè)務場景,單一的通用Agent并不能滿足企業(yè)需求。業(yè)內(nèi)普遍認為,多Agent協(xié)同是Agent在企業(yè)落地應用的重要趨勢。
徐志遠提到,目前在業(yè)內(nèi),多Agent模式面臨的一個難題是決策鏈路過長,當多個Agent協(xié)同處理時,思考時間和處理過程很長,甚至可能需要等待半小時以上;
另外一點則是通信難題,當多個Agent分別來自不同廠商時,在技術和業(yè)務層面上能否實現(xiàn)通信、解決鑒權和身份認證等問題。
另一方面,在企業(yè)側(cè),Agent的落地還面臨不少非技術卡點。
比如AI落地企業(yè)中“特別有意思”的一個現(xiàn)象是:去年的難題是找不到落地場景,而今年的難點則是場景不收斂。
再比如,模型如何選用、選擇哪些業(yè)務場景、應用架構怎么落地也是企業(yè)面臨的主要困境。其中更多真實、瑣碎的卡點難點可添加作者微信skylar_12_14交流。
不僅如此,阿里云無影事業(yè)部AI產(chǎn)品負責人屈立威告訴雷峰網(wǎng)(公眾號:雷峰網(wǎng)),不同類型的企業(yè)對Agent的需求也不同。
中小企業(yè)最關心Agent如何落地部署的問題;而AI原生企業(yè)雖然對Agent了解更深,且擁有大量算法工程師,但運維工程師相對缺乏,所以希望廠商解決復雜的運維問題;
科技驅(qū)動的大企業(yè)則更希望訓練自己的大模型,針對業(yè)務場景做強化學習或后訓練,面臨的難題是Agent落地中的具體技術挑戰(zhàn),比如如何把企業(yè)數(shù)據(jù)清洗成AI能讀懂的格式、怎么做API的封裝等;
此外,從數(shù)據(jù)到語料的轉(zhuǎn)化,也是大模型及Agent在企業(yè)落地需要克服的難題之一。阿里云政企事業(yè)部產(chǎn)品解決方案與服務管理總經(jīng)理霍嘉指出,有數(shù)據(jù)并不代表就有語料,“我們在指導或幫助客戶做query(向數(shù)據(jù)庫或搜索引擎等發(fā)起的查詢指令)項目時,50%-70%的時間都在處理從數(shù)據(jù)到語料的關系”。
面對“落地難”,解法在哪?
破局Agent落地困境,既需要廠商的技術攻關,也需要企業(yè)認真思考Agent如何“為我所用”。
首先,要繼續(xù)保持技術革新。
Agent的智能程度高度依賴底層大模型的能力。對于廠商來說,在模型快速迭代的當下,既要不斷提升模型本身的創(chuàng)新,也要提升背后的系統(tǒng)性工程能力。
此外,Agent在業(yè)務場景中執(zhí)行任務的廣度和深度需求,也倒逼著開發(fā)范式的革新。
過去主流的預定義編排式、單次決策智能式兩種范式,正朝著更高級的技術范式演進。阿里云、Google等國內(nèi)外主流廠商正在探索如何讓Agent具備更強的自主規(guī)劃、多輪反思與循環(huán)執(zhí)行能力,包括如何應對Agent在復雜業(yè)務場景中的系統(tǒng)融合、多體協(xié)同等問題。
相關的探索正在持續(xù)落地。比如在破除Agent與原有業(yè)務系統(tǒng)的融合壁壘上,業(yè)界廣泛應用由Anthropic提出的MCP協(xié)議(模型上下文協(xié)議),打破API通信的“最后一堵墻”,解決Agent在執(zhí)行任務中調(diào)取業(yè)務系統(tǒng)數(shù)據(jù)的問題;
作為MCP協(xié)議的補充,由Google提出的A2A協(xié)議(Agent互通協(xié)議)也正被業(yè)界所驗證,不同廠商、不同場景Agent的通信和協(xié)作壁壘正在被打破。
比如阿里云百煉平臺依托A2A協(xié)議實現(xiàn)了跨Agent的調(diào)用:平臺上的Agent能夠靈活調(diào)度其他符合A2A標準的Agent;平臺上的Agent發(fā)布為A2A協(xié)議后,也能被外部Agent無縫調(diào)用。
而在阿里生態(tài)內(nèi)部,高德、淘寶、釘釘、閑魚等業(yè)務也正在逐步轉(zhuǎn)化為Agent形態(tài),通過百煉實現(xiàn)跨場景的智能協(xié)作,從而構建更加繁榮開放的Agent Store生態(tài)。
其次,除技術攻關之外,行業(yè)know-how也尤為重要。
多Agent協(xié)同不只涉及鑒權和身份認證等技術上的通信問題,還涉及到業(yè)務問題,如費用如何統(tǒng)一、成本如何判斷,以及面臨標準統(tǒng)一、范式統(tǒng)一、最佳實踐普及的困境。
徐志遠認為,這更多不是技術問題,而是需要企業(yè)思考自身業(yè)務與多Agent技術形態(tài)的融合方式,以及結(jié)合成本和效果綜合考量Agent的組合關系。
此外,霍嘉還提到,Agent程序開發(fā)最難的部分是處理復雜的corner case(邊緣案例,即不常見、極端或特殊的場景),期待后續(xù)深入企業(yè)一線的開發(fā)者們可以多分享實際處理這類案例的經(jīng)驗,集全行業(yè)之力共同把Agent開發(fā)好。
徐志遠也透露,阿里云正在推行百煉創(chuàng)客計劃,招募企業(yè)開發(fā)者分享經(jīng)驗,并開展AI實訓營,希望將企業(yè)實踐轉(zhuǎn)化為內(nèi)部分享、對外課程或聯(lián)合運營活動,把Agent編排等業(yè)務經(jīng)驗分享給更多企業(yè),幫助企業(yè)將業(yè)務遷移到AI時代的Agent上。
毫無疑問,Agent的落地需要廠商、企業(yè)以及全行業(yè)共同破局,而作為“基建者”的云廠商發(fā)揮著越來越重要的作用。
正如十多年前,很多企業(yè)客戶不知道怎么“用云”,云廠商職責就是與企業(yè)一道,幫助他們“上云、用云、治云”,而十幾年后的今天,云廠商與企業(yè)再次聯(lián)手,一起撥開AI的迷霧。
作者持續(xù)關注Agent領域熱點話題,歡迎添加作者微信skylar_12_14交流。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。