2024年中国genai技术栈市场报告 rag、多代理系统、模型微调、模块化、去中心化、maas 2024年12月 头豹研究院 弗若斯特沙利文咨询(中国) 报告说明 ———— 沙利文联合头豹研究院谨此发布中国生成式式ai系列报告之《2024年中国genai技术栈市场报告》。本报告旨在梳理genai技术栈的市场发展现状、技术栈核心组件、用户核心需求以及相关技术洞察,明晰市场需求,并结合市场发展前景判断genai技术栈领域内各类竞争者所处地位。 ———— 本市场报告提供的genai技术栈发展趋势分析反映出生成式ai行业整体的动向。报告最终对市场排名、领袖梯队的判断仅适用于本年度中国genai技术栈领域发展周期。 本报告所有图、表、文字中的数据均源自弗若斯特沙利文咨询(中国) 及头豹研究院调查,数据均采用四舍五入,小数计一位。 ———— 报告提供的任何内容(包括但不限于数据、文字、图表、图像等)均系弗若斯特沙利文及头豹研究院独有的高度机密性文件(在报告中另行标明出处者除外)。未经弗若斯特沙利文及头豹研究院事先书面许可,任何人不得以任何方式擅自复制、再造、传播、出版、引用、改编、汇编本报告内容,若有违反上述约定的行为发生,弗若斯特沙利文及头豹研究院保留采取法律措施、追究相关人员责任的权利。弗若斯特沙利文及头豹研究院开展的所有商业活动均使用“弗若斯特沙利文”、“沙利文”、“头豹研究院”或“头豹”的商号、商标,弗若斯特沙利文及头豹研究院无任何前述名称之外的其他分支机构,也未授权或聘用其他任何第三方代表弗若斯特沙利文或头豹研究院开展商业活动。 沙利文市场研读 研究框架(1/2) genai技术栈概述 ---------- 5 •genai技术栈的结构与研究范围 ---------- 6 •genai技术栈的演变发展 ---------- 7 •genai技术栈重要性分析 ---------- 8 genai技术栈核心组件分析 ---------- 9 •genai应用构建架构 ---------- 10 •rag-构建更懂业务的生成式ai应用 ---------- 11 •mas-提供更高效的复杂任务尊龙凯时人生就博的解决方案 ---------- 12 •提示工程-指引更精准的模型输出 ---------- 13 •防护栏-构建更安全的应用 ---------- 14 •api服务-助推更流畅的应用集成 ---------- 15 •mlops-实现更快速可靠的应用发布 ---------- 16 用户构建genai应用考量因素分析 ---------- 17 •高质模型的构建 ---------- 18 •安全合规的优化 ---------- 21 •推理成本的降低 ---------- 23 •数据价值的释放 ---------- 25 •产品应用化的实现 ---------- 27 genai技术栈发展趋势 ---------- 29 •模块化与标准化 ---------- 30 •平台化与简易化 ---------- 31 •去中心化 ---------- 32 •maas模式重构生成式ai商业化生态 ---------- 33 •genai下的信息商品变革 ---------- 34 www.leadleo.com3 400-072-5588 沙利文市场研读 研究框架(2/2) 中国genai技术栈厂商竞争力分析 ---------- 35 •厂商竞争优势构筑 ---------- 36 •评价指标 ---------- 37 •2024年中国genai技术栈市场综合竞争表现 ---------- 39 •中国genai技术栈行业领导者 ---------- 40 名词解释 ---------- 48 参考文献 ---------- 50 方法论 ---------- 51 法律声明 ---------- 52 www.leadleo.com4 400-072-5588 章节一 genai技术栈概述 1.1genai技术栈的结构与研究范围 1.2genai技术栈的演变发展 1.3genai技术栈重要性分析 •genai技术栈连接了硬件设施层与终端用户交互,集成了包括基础模型、模型开发、数据处理、模型部署监控以及应用交互等在内的技术和工具,提供从模型初始化到部署全过程的一站式尊龙凯时人生就博的解决方案。协助开发者高效地构建、训练、微调、部署和维护生成式ai模型。 •在早期的决策式ai时代,ai技术栈的定义较为模糊,业内尚未出现确立的通用技术栈。直至2012年alexnet的突破,ai技术栈开始逐步建立,并在2018年开始的大模型阶段,生成式ai技术栈由原本的碎片化工具格局向更具凝聚力和专业化的生态系统演变。 •作为旨在简化生成式ai应用程序开发和管理的尊龙凯时人生就博的解决方案和组件合集,生成式ai技术栈的设计目的主要包括为开发者提供更高效的编程语言、开发框架与工具链以提升开发效率,给予生成式ai任务系统级的完善支持以及探索和满足大规模与跨平台部署等新需求挑战。 沙利文市场研读 章节一行业概述 1.1genai技术栈结构与研究范围 关键发现 genai技术栈连接了硬件设施层与终端用户交互,集成了包括基础模型、模型开发、数据处理、模型部署监控以及应用交互等在内的技术和工具,提供从模型初始化到部署全过程的一站式尊龙凯时人生就博的解决方案。协助开发者高效地构建、训练、微调、部署和维护生成式ai模型。 genai技术栈定义:指针对开发和部署生成式ai应用的综合环境和平台,集成了包括基础模型、数据处理、模型训练调优、模型部署监控等在内的技术和工具,提供从模型初始化到部署全过程的一站式尊龙凯时人生就博的解决方案。使得开发者可以高效地构建、训练、微调、部署和维护生成式ai模型。 生成式ai技术栈是连接硬件设施与genai应用的中间层,为开发者提供基础模型服务,以及赋能模型调优、监控与维护和编排部署的一系列工具链,满足开发者针对特定应用领域实现高效与灵活的设计和性能优化需求。 genai技术栈(本篇报告主要研究范围) 部 署与监控 代理框架 模型路由 模型维护 数据采集 特征工程 向量数据库 数 据 数据清洗与标注 etl 上下文缓存 数据存储 数据管道 包括cpu、gpu、 存储设备等 硬件设施层 终端用户 用户 交互使用 应用层 模型监控 应用编排 workflows agent 用户体验ux api rag 用户界面ui genai技术栈的结构与报告研究范围 基础模型 •文本生成•语音生成•图像生成•代码生成•视频生成•多模态 •… 模型开发 •模型管理•模型微调finetunning•模型推理•… 来源:沙利文 www.leadleo.com6 400-072-5588 沙利文市场研读 章节一行业概述 1.2genai技术栈演进:从基础到智能体 关键发现 在早期的决策式ai时代,ai技术栈的定义较为模糊,业内尚未出现确立的通用技术栈。直至2012年alexnet的突破,ai技术栈开始逐步建立,并在2018年开始的大模型阶段,生成式ai技术栈由原本的碎片化工具格局向更具凝聚力和专业化的生态系统演变。 genai技术栈的演进历程 2012年以前2012-2017年2018年-至今 决策式ai时代: 技术栈定义模糊 •发展背景:由弱人工智能阶段向统计机器学习阶段发展,进入1990年后,算法和模型开始向多样化发展。 •代表性技术成果: 1966年:eliza对话系统 20世纪70年代:hmm模型在语音 识别领域开始应用 1998年:lenet-5模型被提出, 开始应用于手写数字识别 •技术栈定义:由基于专家知识和规则的系统向“统计机器学习算法 算力包”结构转变 深度学习阶段: genai技术栈开始建立 •发展背景:深度学习的兴起 标志着ai技术进入了全新的 阶段,genai技术栈开始建立。 •代表性技术成果: 2012年:alexnet获奖,展示了 深度学习在图像识别领域的潜能 2015年:resnet被正式提出,解决了深度神经网络中的训练退化问题 2017年:transformer模型被正 式提出,为自然语言处理奠定了 基础 •技术栈定义:深度神经网络 开发框架(tensorflow,pytorch) 大模型阶段: genai技术栈生态系统逐步完善 •发展背景:2018年之后,大语言模型迅速崛起并高效地适用于不同地应用场景。 •代表性技术成果: 2018年:bert模型正式提出 2020年:gpt-3正式发布,能够完成大多数nlp任务 2021年:clip被提出,实现了跨模态文本生成图像技术。 2023年:llama模型提出,对全 球ai社区产生深远影响 •技术栈定义:基础模型 微调 开发者工具链 模型监督与运维等 hmm模型ctf imagenet resnet bert llama 反向传播卷积网络 attentiontransformer gpt-4 glm 随着人工智能重点逐步转向软件工程师和开发人员可以快速且大规模地构建应用程序,ai技术 栈也由传统机器学习的碎片化格局向更完善且专业化的技术栈生态系统演变。 •决策式ai阶段(2012年以前),技术栈定义模糊:人工智能处于向统计机器学习发展的阶段,该阶段算法和模型开始向多样化发展,以hmm、lenet-5等模型正式被提出。该阶段开发人员或团队已经有首选的工具以完成特定的任务,但尚未有统一的技术栈。 •深度学习阶段(2012-2017年),genai技术栈开始正式建立:随着2012年的alexnet的突破带来图像分类的重大进展,也引起了开发人员对于标准化工具和框架的缺失以及针对不同硬件平台需要进行大量调优等局限的重视。 •大模型阶段(2018年–至今),genai技术栈生态系统逐步完善:随着第一代gpt在2018年发布,大模型时代正式来临,人工智能领域的转变使得重点集中于赋能开发人员快速且大规模地构建应用程序,现今的genai技术栈生态系统逐步完善且更关注于实现、优化、评估和监控应用程序及系统,且生成式ai技术栈正在扩展以支持智能体系统。 来源:沙利文 www.leadleo.com7 400-072-5588 沙利文市场研读 章节一行业概述 1.3genai技术栈重要性分析 关键发现 作为旨在简化生成式ai应用程序开发和管理的尊龙凯时人生就博的解决方案和组件合集,生成式ai技术栈的设计目的主要包括为开发者提供更高效的编程语言、开发框架与工具链以提升开发效率,给予生成式ai任务系统级的完善支持以及探索和满足大规模与跨平台部署等新需求挑战。 生成式ai任务的 系统级支持 生成式ai技术栈设计目的 提供高效编程语言、 开发框架和工具链 协助开发者提升genai应用开 01发效率,屏蔽底层硬件计算的 细节,提供更灵活的原语支持。 02 更直观的编辑、调试和实验工具。让用户可以完整的进行神经网络模型的开发、测试、调整诊断与修复和优化程序,提升所开发ai应用程序的性能与鲁棒性。 支持ai生命周期中的各个环03节:数据处理、模型开发与训练、模型压缩与推理、安全和 隐私保护等。 提供更强大和可扩展的计算能力。让用户的ai程序可扩展并部署于可以并行计算的节点或者集群,应对大数据和大模型的挑战。 01 02 自动编译优化算法,实现对计算图的自动推导和根据不同结构的自动并行化。 03 云原生自动分布式化,面对云与集群场景,自动将ai任务扩展与部署,进而支撑分布式计算、弹性计算,让用户按需使用资源。 更大规模坏境的部署需求, 探索解决新需求挑战 在面对多组织、多工程师共01享集群资源的环境下,提供公平、稳定和高效的多租环 境也尤为重要。 面对割裂的边缘侧硬件与软 件栈,如何让模型训练一次, 02跨平台部署到不同软硬件平台,也是推理场景需要解决的重要问题。