1042 newchat hiimdeepseek howcanihelpyoutoday messagedeepseek search deepthinkr1 im the mcr嘉世咨询 2025 中国大语言模型行业现状报告 reportonthestatusofchinaslargelanguagemodelindustry 嘉世咨询 报告说明 本报告的全部内容尊龙凯时人生就博的版权归上海嘉世营销咨询有限公司(简称:嘉世咨询)。 未经授权,任何单位或个人不得以任何形式复制、传插或用于商业用途。 调研方法 桌面研究:搜集整理政府公开数据、行业协会、权威期刊、券商研报及企业 公开披露的行业数据: 数据分析:对初步数据进行清洗、建模与趋势预测: 专家建议:听取行业资深人士意见和观点,提升分析深度与可靠性。 免责声明 本报告结论基于当前可获得信息,不构成投资或决策的唯一依据。研究团队对因使用本报告引发的直接或间接损失不承担责任 嘉世咨询 目录 引言5 第一部分:政策监管环境分析 11国家层面政策支持 12监管框架与合规要求 13政策对行业发展推动作用,8 第二部分:技术演进路径分析 21多模态融合技术进展 22模型轻量化与边缘计算 10 10 11 23持续学习与自适应能力,12 第三部分:算力基础设施分析, 15 31gpu供应链与国际竞争格局15 32国产ai芯片发展现状 33云计算服务提供商战略布局 15 17 第四部分:数据战略分析19 41数据获取架道与质量控制19 42数据治理框架与最佳实践 43合成数据与数据增强技术 第五部分:人才生态分析 20 22 25 51人才供需现状与结构特点,25 52人才结构与薪酬水平 26 嘉世咨询 53人才培养与引进策略27 第六部分:资本格局分析29 61投资趋势与市场规模,29 62主要投资者与投资策略30 63估值逻轻与融资特点32 第七部分:商业模式与应用生态分析 71主要商业模式分析 72应用场景与行业渗透 35 35 37 73开源与闭源策略对比,39 第八部分:垂直行业应用分析43 81金融行业应用 43 82医疗行业应用44 83教育行业应用,46 第九部分:未来趋势与挑战48 91技术发展趋势48 92商业化挑战与机逻50 93政策与合规挑战 52 第十部分:结论与建议56 101行业发展总结56 102对从业者议58 103对投资者的建议 60 嘉世咨询 引言 随着人工智能技术的迅猛发展,大语言模型(llm已经成为全球科技竞争 的焦点、未来产业的关键赛道以及经济发展的新动力,展现出巨大的发展潜 力和广阔的应用前景。目前,ai大模型的应用落地引发行业关注。技术的持 续进步促使ai大模型的应用逐步从云端向终端设备延伸,同时,从通用模型 向针对特定行业的定制化尊龙凯时人生就博的解决方案转变,其商业潜力和对行业的影响不断增强。此外,国内外企业在大模型领域的竞争日趋激烈,伴随着性能的显著提升和应用场景的持续拓展,ai技术正在经历快速的发展,同时推动着产业的 深层次变革。 语言模型是指在机器学习和深度学习领域中,采用大规模参数(至少 在一亿个以上)的神经网络模型,ai大模型在训练过程中需要使用大量的算力和高质量的数据资源。ai大模型具有泛化性(知识迁移到新领域)、通用性不局根于特定领哦以及涌现性产生预料之外的新能力特征。以chatgpt为 代表的ai大模型因其具有巨量参数和深度网络结构,能学习并理解更多的特 征和模式,从而在处理复杂任务时展现强大的自然语言理解、意图识别、推理、内容生成等能力,同时具有通用问题求解能力,被视作通往通用人工智能的重要路径。 从技术发展来看,当前主流大模型普遍是基于transformer模型进行设计 的。transformer模型在google团队2017年论文attentionisallyouneed 中被首次提出,transformer的核心优势在于具有独特的自注意力(self attention)机制,能够直接建模任意距离的词元之间的交互关系,解决了循 环神经网络(rnn)、卷积神经网络(cnn)等传统种经网络存在的长序列 5 嘉世咨询 依赖问题。相较于rnn,transformer具有两个显著的优势。1)处理长序列 数据:rnn受限于循环结构,难以处理长序列数据。selfattention机制能够 同时处理序列中的所有位置,插提全局依赖关系,从而更准确地理解、表示 文本含义。2)实现并行化计算:rnn作为时序结构,需要依次处理序列中 的每个元素,计算速度受到较大限制,而transformer则可以一次性处理整个 序列,大大提高了计算效率。 从部者方式划分,ai大模型主要分为云侧大模型和端侧大模型两类。云 侧大模型由于部署在云端,其拥有更大的参数规模、更多的算力资源以及海 量的数据存储需求等特点:端侧大模型通常部署在手机、pc等终端上,具有 参数规模小、本地化运行、隐私保护强等特点。具体而言,云侧大模型分为 通用大模型和行业大模型:端侧大模型主要有手机大模型、pc大模型。从云 侧大模型来看,通用大模型具有适用性广泛的特征,其训练数据涵盖多个领域,能够处理各种类型的任务,普适性较强。行业大模型具有专业性强的特点,针对特定行业(如金融、医疗、政务等)的需求进行模型训练,因而对特定领域具有更深的业务理解和场景应用能力。从端侧大模型来看,手机和pc大模型由于直接部署在设备终端,让用户体验到更加个性化和使提的智能 体验。 本报告将从政策监管、技术演进、算力基础设施、数据战略、人才生态、资本格局、商业模式与应用生态七个维度对2025年中国大语言模型行业进行全面分析,旨在为相关从业者、投资者、政策制定者提供参考。 嘉世咨询 第一部分:政策监管环境分析 11国家层面政策支持 近年来,我国始终高度重视人工智能发展机遇和顶层设计,发布多项人 工智能支持政策,国务院于2017年发布,新一代人工智能发展规划。科技部等六部门也于2022年印发,关于加快场景创新以人工智能高水平应用促进经济高质量发展的指导意见。对规划进行落实。2024年(政府工作报告》中 提出开展人工智能行动。伴随人工智能领域中大模型技术的快速发展,我国各地方政府出台相关支持政策,加快大模型产业的持续发展。当前,北京、深圳、杭州、成都、福建、安徽、上海、广东等地均发布了关于ai大模 型的相关政策。 此外,国家层面还出台了一系列政策为ai大模型行业提供了明确、广阁 的市场前景。,信息化标准建设行动计划(2024一2027年)》(加快数字人才 培育支撑数字经济发展行动方案20242026年)》等政策文件相继出台,为al 大模型行业提供了明确、广阔的市场前景。这些政策文件的出台,不仅体现了国家对人工智能产业的高度重视,也为大模型技术的研发和应用提供了强有力的支持和引导。 12监管框架与合规要求 随者生成式人工智能技术的快速发展,中国网信办作为主要监管机构,建立了一套较为完善的监管框架。2024年,网信部门会同有关部门按照生 成式人工智能服务管理暂行办法》要求,持续开展生成式人工智能服务备案 7 嘉世咨询 工作。截至2024年12月31日,共302款生成式人工智能服务在国家网信 办完成备案,其中2024年新增238款。这一数据表明,中国对生成式人工智 能服务的监管正在稳步推进,同时也反映了生成式人工智能服务在中国市场 的快速增长。 备案要求方面,生成式人工智能服务需要满足一系列技术规范和安全要求,包括但不限于:内容安全审查机制、数据保护措施、用户隐私保护、算法透明度和可解释性等。这些要求旨在确保生成式人工智能服务的合规运营,保护用户权益,维护社会稳定。 上海市委网信办总工程师杨海军表示,中国是率先出台生成式人工智能服务管理办法法规的国家。通过这次大会,加强国内外人工智能治理交流合作,共同应对人工智能可能带来的风险挑战。这表明中国在人工智能监管方面走在了全球前列,同时也体现了中国对人工智能技术发展和安全治理的高 度重视。 13政策对行业发展的推动作用 国家和地方政府出台的一系列政策对大模型行业的发展起到了积极的推动作用。首先,政策为行业提供了明确的发展方向和目标。《新一代人工智能发展规划》。关于加快场景创新以人工智能高水平应用促进经济高质量发 展的指导意见》等文件明确了人工智能发展的战略方向和重点任务,为大模 型技术的研发和应用提供了政策指引。 其次,政策道过提供资金支持和税收优惠等措施,鼓励更多资本涌入大模型领域。地方政府通过设立专项资金、提供税收减免、设立产业园区等方式,吸引企业投资大模型技术研发和应用。例如,北京着力推动大模型相关 嘉世咨询 技术创新,构建高效协同的大模型技术产业生态:上海强调打造具备国际竞争力的大模型:深圳重点支持打造基于国内外芯片和算法的开源通用大模型,支持重点企业持续研发和送代商用通用大模型:安微从资源方面着手吸引大模型企业入驻:成都着力推动大模型相关技术创新,重点研发和送代cv 大模型、nlp大模型、多模态大模型等领域大模型以及医疗、金融、商务、 交通等行业大模型:杭州支持头部企业开展多模态通用大模型关键技术攻 关、中小企业深耕壶直领城做精专用模型。 此外,政策推动了行业标准的制定和规范化发展。(生成式人工智能服务管理暂行办法》等法规为生成式人工智能服务提供了规范和指导,促进了行业的健康发展。同时,各地政府也纷纷出台相关政策,推动大模型技术在本地的应用和发展。例如,上海的模速空间作为全国首个大模型创新生态社区,几乎浓缩了大模型产业链的每一环。算力层有无问芯穹、仪电智算等, 数据层有库帕思、上海人工智能实验室开源数据平台opendatalab等,基础大模型有商汤科技、minimax、阶跃星辰等,应用层有教育大模型作业帮、能源大模型达卯智能等。 嘉世咨询 第二部分:技术演进路径分析 21多模态融合技术进展 多模态大模型是指能够理解和生成多种模态数据(文本、图像、音频、 视频等)的人工智能模型,具备跨模态理解与交互能力。近年来,多模态技术取得了显著进展,正在成为大模型发展的新方向。多模态大模型通过融合视觉、文本、音频、视频等不同模态的信息,实现了更全面、更自然的交互 体验。 2025年,多模态技术将更加关注多模态融合与交互,其训练方法正在不 断优化。从技术演进来看,多模态大模型的训练方法主要包括联合训练和分阶段训练。联合训练是将多种模态数据同时输入到模型中进行训练,使模型能够学习模态之问的交互关系;分阶段训练则是先在单一模态数据上预训练模型,然后再在多模态数据上微调。 在应用场景方面,多模态大模型已经取得了广泛的应用。视频生成模型 sora的诞生、openai多模态ai大模型gpt4o的到来、clip模型通过跨模态 表示实现图文搜索,用户可以通过输入文本搜索相关图像或视频。此外,文 本到图像生成和视频生成模型也取得了显著进展,进一步拓展了ai的交互体验。在谷歌云发布的(2025年ai商业趋势》报告中,多模态ai被放在首 位。谷歌云预测,2025年将成为企业采用ai技术的关键一年,这一趋势主 要由多模态学习及其实现的情境感知所驱动的,并预计2025年全球多模态 ai市场规模将达到24亿美元。 嘉世咨询 多模态技术发展不仅丰富了ai模型功能,也拓展了其应用领域。多 模态大模型可以应用于内容生成、虚拟助手、智能客服、游戏开发、医疗诊断等多个领域,为用户提供更加自然、流畅交互体验。随着技术不断进步,多模态大模型将能够处理更复杂、更丰富场景,为用户提供更加智 能、更加人性化服务。 22模型轻量化与边缘计算 随着大语言模型规模不断扩大,其计算资源需求和存储需求也在迅速增长,这给模型部署和应用带来了巨大挑战。为了解决这一问题,模型轻量化和边缘计算技术应运而生,成为大语言模型发展重要方向。 模型轻量化技术主要包括模型压缩、量化、剪枝、知识蒸馆等方法,旨 在减少模型参数量和计算复杂度,同时尽量保持模型性能。具体而言, 模型压缩是通过减少模