您的浏览器禁用了javascript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系尊龙凯时网址。[东吴证券]:ai agent深度(二):2025 agent元年,ai从l2向l3发展 -尊龙凯时人生就博

[东吴证券]:ai agent深度(二):2025 agent元年,ai从l2向l3发展 -尊龙凯时人生就博

信息技术2025-05-04张良卫、周良玖、张文雨东吴证券w***
尊龙凯时人生就博ai智能总结
" data-src="https://public.fxbaogao.com/report-image/2025/05/04/4817798-1.png?x-oss-process=image/crop,x_0,y_0,w_1980,h_2800/resize,p_60" data-sizes="200px" data-error="fx-img-error-default;;;height: 720px;" data-srcset="https://public.fxbaogao.com/report-image/2025/05/04/4817798-1.png?x-oss-process=image/crop,x_0,y_0,w_1980,h_2800/resize,p_60" class="lazy"/>

证券研究报告行业年度策略报告传媒互联网 增持(维持) aiagent深度(二):2025agent元年,ai从l2向l3发展 证券分析师:张良卫 执业证书编号:s0600516070001联系邮箱:zhanglwdwzqcomcn 证券分析师:周良玖 执业证书编号:s0600517110002联系邮箱:zhouljdwzqcomcn 研究助理:张文雨 执业证书编号:s0600123070071联系邮箱:zhangwydwzqcomcn 2025年5月4日 1我们认为2025年是agent元年:ai正从l2(推理者)向l3(agent智能体)进化,标志着ai从“思考”走向“行动”。这一转变由四大驱动力促成:技术成熟度达到临界点:强大的多模态基础模型(能理解视觉信息如gui界面)和成熟的强化学习训练方法已准备就绪。标杆产品的出现:行业领导者(如openaigoogleanthropic)推出了关键产品(如operatordeepresearch),基准测试(如rebench)显示顶尖agent在特定任务上的效率已可匹敌甚至超越人类专家。mcp协议的普及将促进agent生态的互联互通。市场需求驱动:经历了大模型能力竞赛 (2023年)和初步应用探索(2024年)后,市场(尤其是b端)迫切需要ai能够落地解决复杂业务问题、自动化多步骤流程,并带来显著的生产力提升,agent的出现恰好满足了这一需求。 2为什么要关注agent?我们认为其重要性在于:深度自动化:agent具有深度自动化、指数级效率提升和成本优化潜力,将人类从重复性劳动中解放出来,聚焦更高价值的创造性工作。通往agi:agent(l3)是通往通用人工智能(agi)和具身智能的关键环节。重塑互联网入口:agent可能改变用户获取信息和完成任务的方式,挑战传统搜索引擎,并可能使操作系统、浏览器或“超级app”成为新的核心入口。我们预计入口级通用agent的竞争将在2025年下半年开启。 3agent的竞争格局是“巨头环伺,新锐突破”:巨头环伺:大型科技平台(openaigoogle微软;国内bat、字节、华为等)凭借模型、数据、算力、生态优势主导通用agent和平台生态的构建。垂直机会:垂直领域凭借深度领域知识和工作流整合仍有创新机会,但长期面临通用agent能力提升的威胁。初期ai应用价值高度依赖模型能力,但简单的“浅层套壳”产品(即wrapper)缺乏壁垒,易被颠覆。真正的护城河在于复杂工作流的可靠编排、高质量工具集成能力和深度领域知识。 4投资建议:重视agent投资窗口:2025年是布局agent领域的重要窗口期,需密切跟踪基础模型(尤其多模态、推理、规划)、强化学习、工具调用可靠性、推理成本优化以及标准化协议(如mcp)的进展。长期配置平台巨头:拥有强大基础大模型、算力、数据和生态系统的大型科技平台公司是agent时代的核心受益者,最有可能主导通用agent的发展,并能整合或取代单一功能应用,具备长期配置价值。例如海外的google、微软,以及与openai、anthropic深度绑定的公司;国内的阿里、腾讯、字节(未上市)。关注垂直领域领跑者:在通用agent能力尚未完全成熟之前,那些在特定垂直赛道已经建立深厚领域知识壁垒、拥有清晰商业模式和客户基础的垂直agent提供商具有较高的短期增长潜力。我们认为知识工作领域(如编程、研究、法律)将是最先落地的场景,其中,编程领域会是最快落地、最先实现pmf和商业化的领域,已有成功案例(如cursor、devin)。其他垂直应用也值得关注:我们总结了30家上市公司在垂类agent方面的布局,其产品基本符合agent定义且具有垂直领域的比较优势。例如出版校对(果麦文化)、电商外贸(焦点科技)、企业服务(创业黑马)、美学设计(美图公司)等。建议关注其利用aiagent解决具体行业痛点的能力和商业化进展。 5风险提示:技术成熟度风险,高成本风险,商业模式不确定性风险,竞争加剧风险。 一、为什么说2025年是agent元年? ai从l2向l3进化 驱动力:技术成熟度达到临界点;行业领导者推动,标杆产品验证;市场需求驱动 定义:不是所有的ai模型产品都叫agent;agent的四个必要构成(缺一不可);agent的智能程度是有层次和梯度的 二、agent为何重要? 深度自动化、指数级效率提升、解放人类生产力与创造力通往agi和具身智能的关键环节 重塑互联网流量入口格局 预计入口级agent大战将于25h2开启 三、竞争格局:模型即产品,通用agent将由大厂主导 agent领域的竞争维度 模型即产品:爆款应用背后是模型能力更新、浅层套壳产品终将被颠覆 biggiants:角逐agi、通用agent和流量入口 nichemarket:垂直agent长期面临通用agent的威胁、垂直agent的价值在于深耕领域知识、谈谈cursor的壁垒 四、agent将最先落地于知识工作(尤其是代码) agent最先落地的行业和场景预测代码软件开发领域的进展与观点法律aiagent对比 五、投资建议 六、风险提示 一、为什么说2025年是agent元年? 我们认为2025年将是agent之年 openai将ai发展阶段分为l1到l5五个阶段。我们认为,ai正从l2(推理者)向l3(agent)进化,agent代表了ai从“思考”走向“行动”的关键一 步,是继大模型之后的下一个重要发展阶段和业界寻求的新突破口。驱动力来自:技术、产品、需求。 l1聊天机器人chatbot:以chatgpt(2022年底发布)为代表,具备自然语言交互能力。机器直接输出文字或回答。相较于机器学习时代,aichatbot实现了“通用性”,不再局限于特定场景或单一问题,而是能处理广泛的语言任务。这是从基于规则、机器学习、神经网络、transformer架构一路发展过来的通用大模型阶段。在这一阶段,交互模式是主要是输入输出模式,用户提问,模型回答。 l2推理者reasoner:具备更强的推理能力,能够处理更复杂的问题。用户能看见模型的推理过程。代表产品如openai的o1系列、deepseekr1。相较于l1阶段,引入了强化学习和思维链(cot)技术,模型在输出最终答案前会进行多步思考。 l3智能体agent:能够自主规划和执行复杂任务的智能体。具备记忆、规划、工具使用和行为记忆四大核心能力。相较于l2阶段,ai从被动的“信息处理推理”走向主动的“与外部世界交互和执行”。能调用工具(如浏览器、api)、操作软件界面,形成“指令思考交互观察再思考”的闭环系统。 l1 聊天机器人 具有对话能力的ai l2 推理者 像人类一样能够解决问题的ai l3 智能体 不仅能思考,还可以采取行动的ai系统 l4 创新者 能否协助发明创造的 ai l5 组织者 可以完成组织工作的 ai chatgpt的出现 deepseekr1标志着从l1到l2operator标志着从l2到l3 驱动力一:技术成熟度达到临界点。支撑通用agent发展的关键技术要素,特别是强大的多模态基础模型(能理解视觉信息如屏幕内容)和成熟的强化 学习训练方法(能训练agent与环境交互),已经发展到相对成熟的阶段。 从l0到l1:标志gpt3、chatgpt(2022年底)为标志。背后的技术驱动力是transformer架构的出现,使得训练更大、更通用的语言模型成为可能。在这一阶段,实现了“通用性”generality,模型不再局限于特定场景,而是能够处理广泛的自然语言任务,像一个巨大的知识库。 从l0到l1的技术演进路径 基于规则 机器学习 神经网络 transformer gpt3 chatgpt 依赖人工规则,灵活性差 数据驱动,泛化能力增强 深度学习 自注意力机制 预训练微调 人对结果的反馈成为学习 智能处理的数据量较少 分类固定量数据 复杂数据处理能力提升 并行计算 强泛化 自然语言生成能力 过程的一部分 从l1到l2:l1到l2的技术演进,核心在于大模型基础上的推理能力突破,涉及多步推理训练、检索增强、逻辑融合等关键技术,使ai从“会说”进化到“会想”,实现更高层次的智能。从l1到l2的跃迁,是ai从“语言表达”到“认知推理”的质变,这为ai在科学发现、复杂决策、自动规划等高价值场景的应用奠定了基础。技术突破包括: 多步推理训练:通过链式思维(chainofthoughtcot)等方法,训练模型在给出答案前进行多轮、分步骤的推理。 检索增强生成(rag):结合外部知识库,提升模型的事实一致性和推理深度,减少“幻觉”。 更高质量的数据与反馈机制:采用专家数据、复杂问题集和强化学习等方式,持续优化模型的推理表现 alphagozero快速超越了alphago l1chatbotl2reasoner 主要能力自然语言生成复杂推理与决策 技术核心 大规模transformer预训练 思维链cotrag moe等 代表模型 gpt3 chatgpt o1 deepseekr1strawberry等 从l2到l3:关键的技术要素(强大的多模态基础模型和成熟的强化学习训练方法)已经趋于成熟,达到了可以支撑通用agent 发展的阶段。openai在2025年1月发布operator,更是印证和点燃了这一行业共识。具体来说,关键的成熟要素包括: 强大的基础模型:像claudesonnet35这样强大的、原生的多模态基础模型已经出现。这些模型具备了足够好的视觉理解、语言理解和基础推理能力,能够“看懂”图形界面(如网页、操作系统界面),这是构建基于gui(图形用户界面)的agent的前提。而在过去(例如openai在2016年尝试类似项目时),缺乏这样强大的基础模型是导致失败的关键原因。 成熟的强化学习技术与框架:以强化学习为核心的posttraining技术在2024年通过o1、o3等模型在纯文本领域被证明是极其有效的,能够显著激发和提升基础模型的深层推理和规划能力。行业将这种成功的范式应用到多模态领域,以训练出能够与环境交互、执行任务的agent。 o3模型和o4mini模型在数学和代码能力上表现出色过去五年ai持续刷新各类排行榜 驱动力二:行业领导者推动,标杆产品验证。openai、anthropic、google等头部公司发布关键产品(如operatordeepresearch)和技术协议(如mcp),并投入研发,起到了引领和示范作用。相对成型的agent产品开始涌现(例如manus、autoglm、genspark等),验证了技术可行性,并点燃了行业共识,标志着agent从设想走向相对成熟的产品阶段。 工具 底层模型 核心技术 自主性级别 多模态能力 openaioperator 定制cua模型 浏览器自动化、视觉理解 高(网页交互) 强(视觉理解) manus claudesonnet37 多智能体架构、linux沙盒 高(跨领域任务) 强(文本、图像、代码) devin 未公开 远程执行环境、规划系统 高(软件开发) 中(主要文本和代码) cursor 多个大模型 代码上下文理解、智能补全 中(辅助编码) 弱(主要代码处理) autogpt 可定制llm 任务分解、互联网连接 高(自主执行) 中(文本和图像) windsorai 专有ai模型 数据归因、营销分析 中(数据处理) 弱(主要结构化数据) deepresearch gemini15pro 多步骤研究、网页浏览 中(研究执行) 强(文本、图像、pdf) chatgptcanvas gpt4 代码编辑、多文件管理 低(辅助编辑) 弱(主要代码处理) 2024年的rebench基准测试显示:在2小时短时限内,顶尖aiagent得分是人类专家的4倍;但将时间放宽到32小时,人类表现则反超部分agent。这表明agent在特定任务上已能匹敌人类专家,且更快、更经济,但人类在长

关于尊龙凯时网址

发现报告是苏州互方得信息科技有限公司推出的专业研报平台。平台全面覆盖宏观策略、行业分析、公司研究、财报、招股书、定制报告等内容。通过前沿的技术和便捷的产品体验,为金融从业人员、投资者、市场运营等提供信息获取和整合的专业服务。

不良信息举报电话:0512-88971002   举报邮箱:cs@hufangde.com

商务合作、企业采购、机构入驻、报告发布 > 添加微信:hufangde04

联系尊龙凯时网址

联系客服

0512-88971002(工作日9:00-18:00)

hfd04@hufangde.com

中国(江苏)自由贸易试验区苏州片区苏州工业园区旺墩路269号星座商务广场1幢圆融中心33楼

微信公众号

发现报告

微信公众号

发现报告商业局

© 2018-2025 苏州互方得信息科技有限公司

||

网站地图