AI Agent的虚火与真章
- 2025-07-28 01:31:10
- 864
中经记者曲忠芳北京报道
“10分钟生成一份婚礼策划案”,“25分钟安排好30支棒球队横跨全美的行程”——近日,OpenAI尽管仍未发布新一代GPT大模型,却推出了其首个AIAgent(指“AI代理”或“AI智能体”)——ChatGPTAgent。
《中国经营报》记者注意到,AIAgent已广泛地出现在我们日常工作生活中,这一名称已被使用在多重语境中,成为办公助手、智能客服、电销专家、AI面试官、疾病管理专家、AI教师等的代称。在ChatGPTAgent面市之前,Manus曾号称自己是“世界第一个通用AI智能体”,而在通用型AI智能体赛道上,市场参与者还包括Anthropic、谷歌、Genspark、稀宇科技(MiniMax)、字节Coze等。
美国政策研究智库R街研究所研究员黄海曼认为,AI智能体的兴起代表着AI的重大变革——从被动、基于提示的工具,转变为能够推理、记忆、学习和执行复杂任务的自主性更强的系统。
“五花八门”密集涌现
一般来说,AIAgent的核心理念是基于大模型自主调用各类工作,实现控制流决策。OpenAI在发布ChatGPTAgent时,官方对它的定义是一个结合了网页交互能力(Operator)、深度研究能力(DeepResearch)、对话与理解能力(ChatGPT)的统一智能体。以现场演示的“策划婚礼”任务为例,用户下达任务指令后,ChatGPTAgent会先浏览购物网站挑选婚纱、订酒店,然后深度研究整合预算和供应商的评价,最后由ChatGPT生成图文并茂的策划书。“规划全美棒球赛行程”的任务类似,最终生成了含路线图、酒店的电子表格。
在此之前,埃隆·马斯克旗下xAI所推出的Grok4Heavy引入了“多智能协作机制”,由多个独立的AI智能体从哲学、伦理、数学等不同维度拆解问题,通过研讨小组整合观点,最终向用户输出深度优化后的答案。马斯克将其比作“由牛顿、伽利略、墨子、达·芬奇组成的智囊团”。显然,这同样体现了AIAgent的核心特征。
除了通用型AIAgent之外,面向垂直场景、服务于B端企业的AIAgent显然规模更为浩大。7月21日,IBM发布企业级通用AI智能体IBMCUGA。IBM科技事业部数据与人工智能资深技术专家吴敏达介绍,传统AI智能体在企业应用中多是“单一功能专家”——比如处理发票、生成邮件、跟踪销售进度等,这些功能虽然实用,但面对跨流程、跨系统、跨业务的复杂场景时,往往会显得力不从心。基于此,IBMCUGA能够跨多个业务场景、整合多种工具、执行复杂的任务,它可以像资深员工一样理解用户意图、规划任务、调用工具、协调多个系统,并不断学习和适应新的挑战。
此外,零一万物于7月22日推出的企业级Agent万智2.0宣称要打造靠谱能干的“超级员工”;7月25日,自猎网招聘求职AIAgent和AI面试官智能体发布,旨在大幅提升招聘效率,解决招聘难与求职难的结构性矛盾;另一家初创企业枫清科技Fabarta表示要打造个人办公专属智能体……各个行业领域的AIAgent层出不穷,令人应接不暇。
中金公司研报中将AIAgent产业图谱进行了四个象限的梳理分类,它以面向B端还是C端作为横轴,而以通用场景vs垂直场景作为纵轴。不难发现,面向C端用户与B端企业的AIAgent“打法”存在差异:前者主打通用性,创新由大厂及创业公司主导,目标是能够以较为标准化的产品形态去满足大众用户泛化的需求;而后者则聚焦于具体场景,由企业服务厂商来推动,更偏向于通过与业务流程更为深度的融合来帮助企业实现生产力的提升。
现阶段的“试金石”
中金研报认为,面向C端的通用型Agent因具有更大的市场想象空间,成为大厂和创业公司集中发力的领域,比如OpenAI、Anthropic、谷歌等海外大厂近半年以来持续提升基础模型的代理能力并优化配套的Agent开发平台。而在国内市场,字节跳动的扣子、阿里的夸克、百度的如流同样在积极布局。与此同时,国内初创企业以及具有华人背景的创业团队愈发活跃,如Manus、Genspark、flowith、智谱、MiniMax等都在探索通用型AIAgent。B端企业级Agent强调与具体业务场景的结合,海外的微软、Salesforce、ServiceNow等已形成较为完整的产品矩阵并实现初步落地,而国内的各类B端软件企业也在积极跟进。
热闹的AIAgent市场鱼龙混杂。国际知名咨询机构Gartner今年7月发布的《2025年人工智能技术成熟度曲线》提醒道:AIAgent尚处于“期望膨胀期”,过度的宣传与不切实际的预测共存。Gartner预测,超过40%的AIAgent到2027年年底将因成本不断攀升、商业价值不明确或风险控制不足而被取消。
Gartner高级研究总监AnushreeVerma表示,目前大多数代理型AI项目仍处于早期实验或概念验证阶段,这些项目大多受炒作驱动且常被误用。这可能使企业忽视大规模部署AI智能体的实际成本与复杂性,从而导致项目无法进入生产阶段。基于此,Verma提醒道,企业应避免轻信此类炒作并就如何使用这项新兴技术做出谨慎的战略决策。
记者通过观察或体验几款AIAgent,发现它们不约而同地将代码能力作为AIAgent落地的“试金石”。代码能力不仅是工具调用和技术落地的体现,更是复杂推理、环境交互和问题解决能力的综合验证。例如,xAI推出独立版本Grok4Code,支持多语言代码生成。
不同数据机构对于AI写代码以及AIAgent的市场增长规模预测不一,但在未来高速增长的趋势上保持了一致。GrandViewResearch预测,2024年AI代码工具的市场规模为61.1亿美元,到2030年将达到260.3亿美元,其间的年均复合增长率(CAGR)为27.1%。RootsAnalysis的报告指出,全球AIAgent在去年的市场规模为52.9亿美元,预计到2035年将达到2168亿美元,其间的年均复合增长率为40.15%。另一家机构MarketsandMarkets预测2025年全球AIAgent市场规模预计为78.4亿美元,到2030年将达到526.2亿美元,年均复合增长率为46.3%。
截至目前,一种参考自动驾驶能力L1—L5分级的方法“复制”到AIAgent上逐渐形成业界共识,AIAgent技术路线已清晰,目前基本处于L2/L3向L3/L4的爬坡中,其能力的上限依然由基础大模型的性能所决定。资本、大厂、创业公司、企业服务公司等产业界在B端和C端不同路径下的探索,都在加速推动AIAgent的商业规模落地进程。
- 上一篇:岁女孩公园荡网红秋千坠河去世
- 下一篇:温州大桥车祸岁摩托车手坠海身亡