[infoq研究中心]：中国ai agent应用研究报告 2024 -尊龙凯时人生就博

信息技术2024-09-05infoq研究中心l***

ai智能总结

ai agent市场综述与未来展望

市场特征与案例分析

ai agent市场特征：ai agent作为连接模型层与应用层的关键，为大型模型的应用落地提供了重要补充。它们通过技术形式帮助应用层实现大型模型不具备的特定能力。
案例分析：从2023年至今，一系列技术框架如autogpt、hugging gpt、camel、generative agents等的发布，展示了ai agent在不同领域的应用潜力，包括但不限于文本生成、智能交互、数据处理等。

ai agent市场未来趋势

智能体（agent）的发展：智能体作为ai agent的核心，具备封装模型微调、提示工程、检索增强等功能，未来有望在更多场景中扮演重要角色。
成本与适应性：检索增强生成在幻觉和知识更新方面成本较低，适应性强；而提示工程则有助于解决模型在不同任务上的泛化不足。
框架持续发布：自2023年3月起，多个ai agent框架相继发布，包括单智能体和多智能体协同发展的框架，表明市场对此类技术的需求日益增长。
技术框架统一认知：随着技术的不断探索，ai agent的技术框架逐渐形成统一认知，强调模型作为大脑、工具使用、记忆等模块的重要性。
成本与性能平衡：2024年前后的大模型“大脑”经历了3轮主要更新，竞争焦点从单纯的数量参数转向了性价比和快速响应能力。

应用场景分析

生活类与专业类场景：生活陪伴类场景探索程度较高，而专业领域如医疗、金融等场景则受限于服务监管和盈利模型，探索程度较低。
企业应用场景：企业场景与大模型应用保持一致性，优先在办公、编码、数据分析等领域开展。
产品形态与市场格局：产品形态多样，涵盖从代码构建到自然语言一键构建等多种方式。市场由大模型创业厂商、互联网科技厂商、rpa/流程自动化厂商和数字化企业服务商共同构成。
平台类与垂直类agent：平台类agent提供从创建到管理的全流程服务，而垂直类agent则更侧重于特定领域内的数据、工作流程和工具生态构建。
盈利模式：盈利模式尚处于探索阶段，多数采用订阅制或按使用量计费。部分平台开始尝试线索转化、商品转化、广告模式等新型盈利途径。

办公场景应用

智能体在办公场景中的角色：ai agent在办公场景中的角色从辅助工具转变为“办公搭子”，旨在提高沟通效率、简化流程执行，并通过深度整合企业内部系统，实现自动化和智能化的办公流程管理。
智能协同与智能管理：通过消息总结、智能问答、快速阅读等功能，智能体为员工提供高效的信息获取和问题解答服务，同时通过智慧文档、智能纪要、智能日程等工具优化工作流程和安排，实现智能管理。
知识整合与流程执行：ai agent通过整合企业知识、执行流程操作，帮助用户快速分析和改进流程，同时通过数据分析提供业务洞察，简化数据填报和差旅管理，实现全面的办公效率提升。

综上所述，ai agent市场正朝着更加智能化、个性化和高效化的方向发展，未来将为企业和个人提供更为广泛和深入的应用场景，推动生产力的进一步提升。

" data-src="https://public.fxbaogao.com/report-image/2024/09/05/4503928-1.png?x-oss-process=image/crop,x_0,y_0,w_1980,h_2800/resize,p_60" data-sizes="200px" data-error="fx-img-error-default;;;height: 720px;" data-srcset="https://public.fxbaogao.com/report-image/2024/09/05/4503928-1.png?x-oss-process=image/crop,x_0,y_0,w_1980,h_2800/resize,p_60" class="lazy"/>

目录 content 01aiagent市场发展背景和特征分析 02aiagent市场特征和案例分析 03aiagent市场未来趋势 aiagent市场发展背景和特征分析 2024年中国人工智能成熟度模型研究说明 2024年中国人工智能成熟度模型准成熟技术▸ 半定制芯片（fpga） 2023年，infoq研究中心第一次发布人工智能成熟度模型。在这一年中，人工智能领域发生了诸多变化，因此infoq研究中心再次基于技术专利数量、技术发展时间、技术舆论指数等核心指标，结合市场规模与融资事件等公开资料，以及技术和市场专家的验证，绘制了中国人工智能成熟度模型。前沿技术▸ 航天航空、航海和特种汽车无人驾驶合成数据生成类脑芯片脑机接口人型机器人视频生成通用人工智能（agi）早期推广技术▸ ai安全可解释ai 大模型工程化检索增强生成（rag）通用大模型行业大模型端侧ai（iot、edge、mobile）基于大模型的对话机器人多模态模型 ai智能体（agent）图像生成 3d生成三维视觉llmops 全定制芯片（asic）强化学习分布式深度学习机器/深度学习平台提示工程文本分析文本生成音频生成语义分析知识图谱代码生成智能视频编码汽车自动驾驶数字人/虚拟人rpa aiops 成熟技术▸ 通用芯片（gpu）传统对话机器人机器学习 ocr识别人脸识别生物识别数据挖掘推荐系统物体识别语音识别专家系统mlops agent衔接模型层与应用层，是现阶段大模型应用落地的重要补充 •中间层是连接应用层和模型层的桥梁，在现阶段是作为大模型应用落地能力补充的重要层级。 •随着底层模型技术的持续进步与演化，未来可能会出现模型层逐渐内化并泛化出原本由中间层提供的部分能力。 •与此同时新的应用需求还会持续出现。 •智能体，在众多中间层中，处于中心位置，可以封装模型微调、提示工程、检索增强生成。适随着中间层能力的不断实践和积累，相对通用和标准化的能力将从中间层中提炼集成在模型层中应用层中间层模型层基于应用的需要，中间层通过技术形式帮助应用层实现通用模型不具备的一些能力应性调用高提示工程用于解决模型对于不同任务的泛化能力不足的问题。适应性低成本低智能体（agent）用于解决模型在实际应用中的交互和决策问题。检索增强生成用于幻觉和知识更新的问题。微调用于解决预训练模型在特定任务上性能不足的问题。成本高 agent框架持续发布，单/多智能体协同发展 •自2023年3月，以autogpt为代表的一系列技术框架的发布，aiagent以其自主性和解决问题的能力，迅速获得科技圈各方讨论。并在之后一年多的时间中，陆续发布多项不同种类的技术框架。 •除了使用领域的探索之外，单智能体和多智能体协同的两种智能体框架，也在同步发展。 2023年3月-2024年6月期间发布的典型agent框架通用类环境模拟类软件开发类多模态类翻译类终端交互类数据分析类 camel 多 metagpt autogen talkweaver ufo agentuniverse 智generative 能agents 体 chatdev agentverse agenthospital transagent babyagi 单autogpt 智hugging gpteam agentgpt gpt- engineer crewai autoagents translationagent appagent ds-agent oscopilotscreen swe-agentdevika simclass 体能gpt shortgpt agent jat sima cradle 2023年6月2023年9月2023年12月2024年3月2024年6月 agent是集大模型、数据、工具多维一体的系统化工程 •在技术框架的不断探索中，agent的技术框架认知逐渐统一，大模型作为大脑，驱动规划、工具使用、记忆三大基本能力模块指导行动，智能体逐渐通过与环境、智能体和人类交互的反馈中不断进化。 •在t-eval大模型智能体基准测试中，步骤推理（reason）能力得分明显落后于测试均分，这意味着推理仍是能力短板。 agent通用技术框架长期记忆短期记忆记忆工具使用大模型规划行动智能体环境感知反馈智能体 •cot 插件任务拆解 •plan-and-solve•tot•got•… 外部api 反思改进 •react•reflexion•critic•self-refine•…… t-eval大模型智能体基准测试分数 t-eval均分指令规划得分步骤推理得分 gpt-4 100 internlm-…80 60 yi-chat-34b chatglm-6b-… mistral-7bbaichuan2-13b 40 20 0 llama2-70b claude2.1 qwen-72bdeepseek-… 数据来源：t-eval大模型智能体基准测试，是专门针对智能体工具使用的全过程设计的基准测试，包含：规划（plan）、推理（reason）、检索（retrieve）、理解（understand）、指令跟随（instruct）和审查（review）。测评结果仪表盘链接：https://open-compass.github.io/t-eval/leaderboard_zh.html、https://hub.opencompass.org.cn/dataset-detail/t-eval 大模型「大脑」经历3轮主要更新，竞争重点由参数向应用变化 •作为智能体大脑的大模型，在短短2年时间内，经历了3轮主要更新和竞争重点的转变。 •2024年第二季度，模型竞争逐渐转向在性能不打折的情况下，具备更强的成本效应和快速响应。 2023-2024年主要大模型发布/更新及竞争阶段多模态模型以sora拉开序幕语言模型moe成果积累语言模型长文本竞争拉开序幕模型竞争转向性价比与响应速度 2024q2 国内外大模型厂商第一轮交卷完成宣传重点经历了从单纯的模型参数到能力提升 2024q1 •zamba-7b •abab6.5 •llama3 •qwen2 •claude3.5sonnet •讯飞星火v4.0 2024年以前发布的大模型/大模型家族 •yi-vl-34b •baichuan3 •讯飞星火v3.5 •mobilevlmv2视觉语言模型 •open-sora1.0 •openelm •phi-3mini •qwen1.5 •internlm2.5 •vidu •可灵 •baichuan1-2模型家族 •claude1.0-2.1 •deepseek模型家族 •ernie2.0-4.0模型家族 •gemini1.0 •glm1-3大模型家族 •gpt-1到4共计5个大模型 •混元大模型 •internml •llama开源模型家族 •mistral开源模型家族 •moonshotv1 •skywork •书生·浦语模型家族 •天工模型家族 •qwen开源模型系列 •讯飞星火模型v1.0-3.0 •xverse1.0-2.0 •yi开源模型家族 •minicpm-v-2 •gemini1.5 •mistrallarge •claude3 •deepseekvl •grok-1 •grok-1.5 •magnet •dbrx •qwen1.5-moe-a2.7b •jamba •deepseek-v2 •yi-1.5 •gpt-4o •yi-large •豆包大模型 •baichuan4 •glm-4 •视界一粟yisu •veo •天工3.0 •源2.0-m32 现阶段的智能体应用，仍未长出足够的自主思考能力以应对复杂场景 •在agent的理论框架中，自主思考和规划能力是其核心特征，这也是agent与chatbot和copilot等应用的关键区别。然而，当前阶段的智能体实际构建与这一理想状态仍有显著差距。理想中的智能体现阶段的智能体 •自主思考：理想中的智能体应具有较强的自主决策能力和环境适应性。 •规划与工具调用：只需设立目标，理想中的智能体即可自主思考和规划路径，选择合适的工具达成目标。 •记忆：在逐渐的使用过程中，理想中的智能体可以实现持久的记忆和学习能力，能够积累并保留知识经验。 •多模态：理想中的智能体应具备对现实世界的理解、模拟、反馈持续学习能力。 •自主思考：现阶段的agent大多仍处在rpa的思路中，依赖人为干预和预设规则。 •规划与工具调用：现阶段的智能体在复杂场景下的推理能力差，只有在清晰、详细的指令下才可以稳定发挥。 •记忆：现阶段的智能体大多局限于通过prompt构建短期记忆，事实性记忆多通过rag来构建。虽然大模型的上下文长度上限一直在提升，但仍然缺乏在对话之外持久保存和累积知识的机制。 •多模态理解：现阶段的智能体大脑仍以大语言模型为主，缺乏对多模态的理解。 aiagent市场特征和案例分析应用场景分析：生活类情感陪伴场景先行，专业类场景开始试点 •在生活陪伴类场景中，aiagent通过对话交互形式，结合记忆模块的能力，能够提供更加丰富和深入的情感体验，这使得生活陪伴成为aiagent应用探索程度较高的一个领域。场景容错性高 aiagent现阶段典型应用场景分析生活陪伴类场景 ai游戏队友世界观体验（游戏、影视、小说关键角色）生活专业类场景社交媒体运营旅行规划情感陪伴保险规划理财顾问口语教学虚拟顾问（塔罗、星盘、八字等）陪伴助教医疗顾问订票助手个人法律顾问智能导购低低aiagent应用探索程度高应用场景分析：企业场景与大模型应用保持一致 •企业专业类场景应用探索程度，与其大模型「大脑」保持相对一致，在办公、编码、财税、数据分析、营销等场景优先起步。 •对于生活专业类场景而言，受限于早期的工具生态、服务监管和尚未清晰的盈利模型，aiagent应用探索程度普遍较低。场景容错性高 aiagent现阶段典型应用场景分析企业财务助手招聘助手研报分析智能npc 数据分析开票专家话术专家内容制作私域运营智能纪要企业法律顾问低低商家助手企业专业类场景营销助手智能编码企业知识顾问智能客服 aiagent应用探索程度高产品发展早期阶段，四大类厂商各显神通 •infoq研究中心在对市面上对外服务的aiagent产品进行研究后，发现其背景主要分为大模型创业厂商、互联网科技厂商、rpa/流程自动化厂商和数字化企业服务商。厂商类型大模型创业厂商互联网科技厂商 rpa/流程自动化厂商数字化企业服务商升级路径借助自身大模型技术基础，满足企业大模型技术实际应用需求借助自身大模型以及ai云服务，为客户提供完整的ai技术尊龙凯时人生就博的解决方案依托自身长期积累的企业内流程自动化落地经验，为客户提供更智能化的产品和服务依托自身长期积累的垂类领域或行业的know-how，实现企业内数字化系统的功能升级产品形态 aiagent应用市场&开发平台 aiagent应用市场&开发平台 agent技术思路集成进原有rpa产品 agent作为一个功能组件，内置进数字化系统用户基础好，产品迭代快速大量成功落地经验 api联动生态完善代表厂商 dify、澜码科技、面壁智能等百度、火山引擎、腾讯等来也科技、实在智能等用友、金蝶、标普云、数势科技等厂商优势对大模型具有技术前瞻视角 ai生态建设完整；在流程自动化领域积累的与原有数字化系统深度集成，多种agent构建方式满足不同技术水平、不同场景的用户需求 •虽然产品形态各异，但在构建和使用方式上，aiagent产品均支持根据内置模版构建、复杂智能体构建和代码构建三种基础构建

点击免费查看完整报告