在AI“泛濫”的當下,我們聽到了太多AI怎么“說”——例如面對上述需求,眾多熱門AI都可以長篇大論給出買票的建議和攻略,卻沒有AI可以真正“代理人類”買到票。顯然,如今我們更想看到AI能“做”什么。
今年3月份,橫空出世的Manus以獨立思考和執行復雜任務的驚艷表現正面回應了這個問題,是否意味著,無所不能、真正可以代理人類的“AI Agent”已經近在咫尺了?
撥開迷霧:拋開炒作概念,正確認識AI Agent
隨著當前市場對AI Agent的熱情逐漸高漲,國際知名分析機構Gartner發現,“Agent Washing”(智能體浪費) 現象也越來越多——某些供應商可能會夸大其產品的功能,將現有技術,如大語言模型、對話助手、自動化軟件等包裝為AI Agent。
根據Gartner的定義,真正的AI Agent是利用人工智能進行感知、決策、采取行動,并在數字或物理環境中自主或半自主地追求既定目標的軟件實體。AI Agent應該具備適應、規劃和獨立行動的能力,從而能夠在較長時間內實現組織的目標。
顯然,真正的AI Agent所需能力超越了傳統的AI助手、機器人流程自動化(RPA)工具與聊天機器人等等。盡管在2024年用AI Agent進行日常工作決策的比例仍是0%,但根據預測,到2028年,這一比例將迅速增加至15%甚至以上,AI Agent有望成為CIO們提高生產力的第一選擇。
直面挑戰:AI Agent的“成長陣痛”
和所有的新技術興起的歷程一樣,AI Agent也正在面臨一些難以跨越的“成長陣痛”。在2025年AI Engineer Summit會議上,國際知名前沿科技投資企業Lux Capital合伙人以“讓OpenAI 訂機票”為例子,展示了在“AI幻覺”之余,AI Agent也很可能會在行動中不斷積累小錯誤,最終嚴重偏離既定目標:
- 決策錯誤: 如系統可能預訂飛往錯誤的目的地(例如將舊金山誤定為秘魯的舊金山),或在細節處理上過于復雜從而影響整體進度(比如連續調整計劃影響出行)。
- 實施錯誤: 例如因輸入格式或捕獲設置錯誤導致流程中斷,甚至無法訪問關鍵數據庫。
- 啟發式錯誤: 模型可能忽略了最佳實踐,比如沒有為不同出發地點(如曼哈頓、布魯克林等)預留足夠時間,進而影響時間安排和交通預估。
- 偏好錯誤: 系統可能忽視用戶的個人偏好,或者從某些帶有歷史偏見的數據中學習,這都暴露出AI Agent在復雜價值判斷中存在很大的潛在風險。
著眼當下:客觀評估AI Agent的真實能力
雖然AI Agent還處于生長期,但不少政企單位已經開始嘗試將其應用在業務環境中。那么,我們如何在日新月異的版本迭代中衡量AI Agent產品的真實能力呢?
Gartner認為可以從自主決策、適應性和學習、交互和協作、價值創造四個4個關鍵指標,來衡量AI Agent的能力是否達到實際應用的“落地級”。
自主決策能力
真正的AI Agent應能在最小人工干預的情況下理解復雜環境、制定決策并執行任務。這種能力不僅體現在執行預定任務上,更體現在面對未預見情況時的應對能力上。
適應性和學習能力
真正的AI Agent應能夠從經驗和反饋中學習,持續優化自身表現。這種學習不僅限于模式識別,還包括理解上下文、調整策略和改進決策過程。相比之下,“Agent Washing”產品通常缺乏這種持續學習的能力,它們的表現往往停留在初始設計的水平上,難以隨時間推移而改進。
交互和協作能力
成熟的AI Agent應能夠理解自然語言指令,與人類和其他系統進行有效溝通。隨著技術發展,多Agent協作將成為趨勢,真正的AI Agent應能夠在復雜任務中與其他Agent協同工作。這種協作能力是區分真假AI Agent的另一個重要標準。
價值創造能力
真正的AI Agent應能夠為企業創造可衡量的價值,如提高效率、改善決策或優化資源配置。即使技術先進,如果無法為用戶創造實際價值,也難以被視為成功的智能體產品。企業在評估AI Agent產品時,應關注其能否解決實際業務問題,而非僅被概念營銷所吸引。
未來圖景:AI Agent與數字世界的共生進化
不僅僅是數字化轉型的參與者們,也許在未來數字世界,人人都能擁有屬于自己的“賈維斯”(鋼鐵俠的超級智能管家)——企業能在最少的人工干預下實現復雜業務流程的自動化,更快響應市場需求,真正發揮AI在數字世界的巨大效能。
在當下,就已經有政企單位朝著AI Agent與復雜業務流程融合——“智能體工作流”的方向不斷探索,在部分場景中已經有所實踐:
人力資源管理
人力資源部門的智能體工作流程可以加速和改善人才管理流程,包括招聘、入職和績效管理。
以甲骨文公司為例,其引入了Oracle Cloud HCM( 嵌入了新的 AI agent),通過提供個性化職業支持、自動執行行政任務以及簡化從入職和合同到績效評估和福利的復雜流程,幫助員工改善體驗并提高工作效率。
甲骨文公司應用開發執行副總裁 Chris Leone 表示:“員工在復雜 HR 流程上可能耗費過多的時間,以至于無法集中于主要職責。Oracle Cloud HCM 中全新的 AI agent 可幫助 HR 和業務負責人自動執行一些耗時的任務,讓員工能夠專注于真正重要的工作,并提高整個員工團隊的工作效率。”
IT服務和運維
智能體工作流在IT支持和服務中的應用場景涉及多個領域,主要體現在故障檢測、網絡安全、技術支持和服務管理等方面。
AI agent可以實時監控IT基礎設施,自動發現系統中的潛在故障或性能瓶頸。對于網絡安全,AI agent能夠監控網絡流量,及時檢測并應對安全威脅,如識別惡意攻擊或未經授權的訪問,自動采取隔離、封鎖等措施,保護企業的IT環境不受侵犯。
目前已有不少頭部廠商正在朝著這個方向不斷前進。如深信服首發的國內第一個安全大模型——在2024年的大型攻防演練期間,安全GPT做到了全天候自主值守,不僅幫用戶將安全告警平均降噪99%以上,更是做到真實攻擊0漏報。其中最受用戶認可的一點,是在“專家+AI agent”協作的方式下研判效率提高85%,“2人+XDR&GPT”即可達到以往14人團隊的守護效果.........這都預示著網絡安全正朝著“最少的人工干預下實現自動防護”的目標穩步前進。
項目管理
智能體工作流在企業項目管理中的應用場景包括任務分配、進度監控、資源調配和風險管理等方面。
AI agent能夠自動跟蹤項目的進展,實時監控任務完成情況,并根據項目的優先級和資源需求智能地重新分配任務。通過數據分析,AI agent還可以預測項目的未來趨勢,優化項目規劃,自動生成進度報告,并為項目經理提供實時決策支持。
同時,AI agent能夠減輕項目經理的日常行政任務,讓他們能夠專注于戰略決策和復雜問題的處理,從而提升整體項目執行的靈活性和成功率。
AI Agent的演進如火如荼,與其害怕被取代,不如思考如何駕馭AI Agent,終其內化為數字時代企業進化的核心基因。正如Gartner所預測——到2026年,成功應用AI Agent的企業將不是追求"完全自動化",而是構建"人類與AI的增強協作網絡"。
文獻參考:
《Gartner發布2025 年十大戰略技術趨勢》
《Gartner: 警惕 “Agent Washing” ,辨別炒作與實質》
《Oracle AI Agent 助力 HR 主管重塑員工體驗》
《Agentic Workflow智能體工作流企業應用解析》