[中山大学软件工程学院]：从技术突破到场景落地：大模型发展图谱与deepseek创新应用-尊龙凯时人生就博

文化传媒2025-03-01邓***

ai智能总结

" data-src="https://public.fxbaogao.com/report-image/2025/03/01/4855596-1.png?x-oss-process=image/crop,x_0,y_0,w_1980,h_2800/resize,p_60" data-sizes="200px" data-error="fx-img-error-default;;;height: 720px;" data-srcset="https://public.fxbaogao.com/report-image/2025/03/01/4855596-1.png?x-oss-process=image/crop,x_0,y_0,w_1980,h_2800/resize,p_60" class="lazy"/>

从技术突破到场景落地：大模型发展图谱与deepseek创新应用李煜政中山大学软件工程学院2025年03月大纲 n人工智能大模型发展现状 ndeepseek破圈后的大模型发展趋势 n大模型重点应用场景 ndeepseek能力赋能个人发展人工智能 2024年3月5日，李强总理在十四届全国人大二次会议上作《政府工作报告》，其中提出：开展“人工智能 ”行动。人工智能人工智能的定义 artificialintelligence，缩写为ai 1955年，约翰·麦卡锡定义为：“制造智慧机器的科学与工程”。 1989年，罗杰·彭罗斯定义为：“通过机器（通常是电子设备）尽可能多地模仿人类智力活动，并可能在这些方面提高人类的能力”。约翰·麦卡锡（人工智能之父）人工智能人工智能的分类弱人工智能artificialnarrowintelligence(ani) •擅长于单个方面的人工智能强人工智能artificialgeneralintelligence(agi) •人类级别的人工智能，在各方面都能和人类比肩超人工智能artificialsuperintelligence(asi): •“在几乎所有领域都比最聪明的人类大脑都聪明很多，包括科学创新、通识和社交技能。”——牛津哲学家，知名人工智能思想家nickbostrom 科技趋势 gartner十大科技趋势预测 ø2017：人工智能和先进机器学习（第1）ø2018：人工智能基础（第1）ø2019：自动化的一切（第1）ø2020：人工智能安全（第10）ø2021：人工智能工程化（第8）、超级自动化（第9）ø2022：生成式ai（第12）ø2023：自适应ai（第4）ø2024：全民化的生成式ai（第1）、ai信任、风险、安全管理（第2）ø2025：代理型ai（第1）、ai治理平台（第2）人工智能 nllm的原理：大参数函数人脑约有1000亿个神经元人工智能人工智能相比人类的优点速度：计算（机器2ghzvs人脑200hz）、信息传播（光速vs人脑120m/s) 容量：机器具有更大的储存空间可靠性和持久性：晶体管比神经元更加精确可靠可编辑性、升级性：软件更容易升级、修正、测试集体能力：机器>人类>其他物种人工智能人工智能人工智能的发展需要受到规范工业革命人工智能大模型发展现状 deepseek热潮 deepseek热潮 ndeepseek版本发布路径 ø23年11月：deepseekllmø24年1月：deepseek-moeø24年2月：deepseekmathø24年5月：deepseek-v2ø24年11月20日：deepseek-r1-lite-previewø24年12月26日：deepseek-v3ø25年01月15日：deepseekappø25年01月20日：deepseek-r1ø25年01月27日：deepseek暴击美股国内ai软件的关注度（微信指数） deepseek热潮 ndeepseek版本发布路径 ø23年11月：deepseekllmø24年1月：deepseek-moeø24年2月：deepseekmathø24年5月：deepseek-v2ø24年11月20日：deepseek-r1-lite-previewø24年12月26日：deepseek-v3ø25年01月15日：deepseekappø25年01月20日：deepseek-r1ø25年01月27日：deepseek暴击美股 deepseek热潮全球云服务厂商火速接入 2月1日~2月3日，国内云厂商陆续宣布接入deepseek deepseek热潮成为央国企数字化转型“新基建” 通信行业三大运营商：移动、联通、电信，全面接入deepseek，应用于智能客服和云计算赋能能源行业 ø电力：南方电网“大瓦特”；国家电网“光明电力大模型”；中国华电“华电睿思”ø三桶油：中国石油昆仑大模型；中国石化长城大模型；中国海油海能人工智能模型 ø汽车行业东风汽车、长安汽车、吉利、极氪：应用于智能语音交互、ai导航系统及自动驾驶辅助金融行业 ø国有银行、十余家券商：完成本地部署，应用于信息检索、行业研究、合规问答等场景延伸到智慧政务领域北京市丰台区、昌平区、海淀区：部署deepseek用于优化行政审批流程与数据分析东省广 ø广州市：政务服务和数据管理局，部署deepseek-r1/v3模型，应用于民生政策解读、12345热线工单分派等场景ø深圳市：基于政务云提供deepseek模型服务，覆盖龙岗区、福田区、大鹏新区等，实现政务应用一体化升级ø佛山市：完成deepseek本地化部署，接入“粤治慧·佛山城市大脑”，支撑智能问答、公文写作等政务功能ø珠海市：政务服务和数据管理局，在市电子政务外网上线deepseek-r1671b大模型苏省 ø江南京、苏州、无锡、常州、盐城、连云港等地：接入deepseek用于优化营商环境、政策解读及智能客服西省江赣州市：作为省内首个部署deepseek的城市，应用于政务服务与城市治理北省河秦皇岛市：交通运输局引入deepseek推动智慧交通建设，数据和政务服务局上线智能审批助手人工智能大模型发展现状 deepseek核心价值赏析 deepseek核心价值赏析 deepseek简介 deepseek-r1能力 deepseek核心价值赏析推理模型是什么？《modelneedsmoretokenstothink》思维链（chain-of-thought，cot）案例： “计算starwberry里有几个r” ø“计算starwberry里有几个r？请一步步来，先拆解单词拼写，再计算每个字母是否是r，同时注意可能有连续出现的相同字母r” deepseek核心价值赏析思维链技术的局限性对用户的专业技能要求高、使用门槛高例如： ø两个能量分别为e1和e2的量子态，其寿命分别为10^-9秒和10^-8秒。我们希望清晰区分这两个能级，以下哪个选项可能是它们的能量差值，使得二者能够被明确分辨？ ø请拆解为思维链… deepseek核心价值赏析推理模型自动生成链式思考的过程 deepseek核心价值赏析推理模型的适用场景不适用：适用： ø谜题、数学证明ø复杂决策ø开放式答案ø需要显式的思考步骤 ø简单问题ø知识性问答ø娱乐聊天ø延迟要求高 deepseek核心价值赏析长思维链的效果 2024年9月gpt-o1发布后，借助longinternalcot，在数学竞赛，编程竞赛，科学问答方面显著提升，甚至击败人类专家。 deepseek核心价值赏析复现o1推理能力的探索过程主流探索方向 øprm（过程监督奖励模型）主流的研发方向没有跳出prm模式 deepseek核心价值赏析复现o1推理能力的探索过程 kimi团队，从蛛丝马迹中，找到关键破局点 øtrainllmsthroughrltosolveproblemswithexactrewardsøavoidstructuredapproachesastheyultimatelylimitmodelperformance;letthemodelexplorethinkingparadigmsonitsownøthinkingincludessearchprocessesandallowsformistakes deepseek核心价值赏析 deepseek模型的演化路径–阶段1 deepseek团队，提出deepseek-r1-zero的纯强化学习方法（purerl），以数学、物理、编程等有标准答案的题目进行训练准确度激励： ø问“1 1=？”答2，加一分；答1，零分格式激励：问“1 1=？” ø答：用户问我1 1等于几，这应该是一道很简单的数学题，我们可以形象的思考，我有一个苹果，再给我个，就有两个。因此答案应该是2。2加一分答：2零分 deepseek核心价值赏析 deepseek模型的演化路径–阶段1 在训练过程中，模型自主学会了长思考：随着训练轮次增加，平均返回结果长度逐渐上升 deepseek核心价值赏析 deepseek模型的演化路径–阶段1 但存在回复文本可读性差、推理过程语言混乱问题 deepseek核心价值赏析 ndeepseek模型的演化路径–阶段2 训练流程（武当梯云纵，左脚踩右脚） deepseek核心价值赏析 deepseek模型的演化路径–阶段2 追赶上了o1系列模型的能力 deepseek核心价值赏析 deepseek模型的演化路径–阶段3 用生成数据，蒸馏训练其他开源模型（将大模型的知识浓缩到一个小模型上，在降低计算量的同时尽可能使小模型接近大模型的性能） ø效果大幅提升（证明超大模型的sft数据，可以低成本地显著拔高现有模型）模型尺寸变小（引发本地部署热潮、破圈） deepseek核心价值赏析大纲 n人工智能大模型发展现状 ndeepseek破圈后的大模型发展趋势 n大模型重点应用场景 ndeepseek能力赋能个人发展大模型发展趋势从摩尔定律到知识密度提升摩尔定律趋缓 ø定律：每隔大约18个月，集成电路上可容纳的晶体管数量将翻倍，同时计算性能也会随之提升，而成本保持不变ø近年来摩尔定律趋缓（芯片制程接近物理极限），单纯依赖芯片性能提升已无法满足大模型指数级增长的算力需求大模型开始依赖更高效的架构优化 ø知识密度：每一次的计算所需要参与的参数以及对应能力所需要消耗的算力ø一个知识密度越强的模型意味着能力越强，每一次计算所需要的参数规模越小ø模型的知识密度增强将呈现出每8个月提升一倍的规律大模型发展趋势大模型由数据飞轮向智慧飞轮升级演进使用合成数据进行训练成为主流强化学习新范式，带来ai模型的自我迭代大模型发展趋势 ntest-timescalinglaw 模型能力提升维度：预训练计算量、模型尺寸、数据量、思考时间大模型发展趋势 ntest-timescalinglaw 2025年国际消费电子展（ces2025）——全球最大的消费电子展上，nvidia（英伟达）创始人兼ceo黄仁勋发表了一场主题演讲，将过去、现在和未来紧密结合在一起。 “随着预训练的收益达到瓶颈或变得过于昂贵，我们找到了一种新的扩展方向（test-timescaling），它展示了一条通往agi的路径。” 大模型发展趋势大模型发展趋势通用大模型与垂域大模型协同发展通用大模型在专业领域常常产生幻觉（如司法领域）垂域大模型关注解决问题，提高生产力和工作效率但一个好的通用大模型，可以决定垂域大模型的下限通用大模型在专业领域产生幻觉：2020年5月28日，《中华人民共和国民法典》表决通过，自2021年1月1日起施行。大模型发展趋势本地部署小模型成为主流应用渠道 deepseek发布后，通过蒸馏有效提升了小模型的能力小模型本地部署的资源要求低本地部署能有效提升数据安全性，拓宽落地场景大纲 n人工智能大模型发展现状 ndeepseek破圈后的大模型发展趋势 n大模型重点应用场景 ndeepseek能力赋能个人发展大模型应用与现实世界交互大模型应用端侧大模型智能眼镜：solos发布了全球首款集成gpt-4o的智能眼镜airgovision，除了基本的问答，它能够即时识别出眼前的地标，规划路线等等。ces2025上珠海莫

你可能感兴趣

" data-src="https://public.fxbaogao.com/report-image/2025/04/01/4756828-1.png?x-oss-process=image/crop,x_0,y_0,w_1980,h_2800/resize,p_60" data-sizes="200px" data-error="fx-img-error-mini;;;" data-srcset="https://public.fxbaogao.com/report-image/2025/04/01/4756828-1.png?x-oss-process=image/crop,x_0,y_0,w_1980,h_2800/resize,p_60" class="lazy industryimg__app-containers-fxbaogao-detail-industrycard-style-module__ulqfc"/>

2025从技术突破到场景落地大模型发展图谱与deepseek创新应用报告

信息技术

中山大学2025-04-01

信息技术

哈工大计算学部2025-02-28

信息技术

清华大学2025-02-12

" data-src="https://public.fxbaogao.com/report-image/2025/03/24/4744781-1.png?x-oss-process=image/crop,x_0,y_0,w_1980,h_2800/resize,p_60" data-sizes="200px" data-error="fx-img-error-mini;;;" data-srcset="https://public.fxbaogao.com/report-image/2025/03/24/4744781-1.png?x-oss-process=image/crop,x_0,y_0,w_1980,h_2800/resize,p_60" class="lazy industryimg__app-containers-fxbaogao-detail-industrycard-style-module__ulqfc"/>

deepseek系列专题线上公开课（第二季）：从大模型、智能体到复杂ai应用系统的构建——以产业大脑为例

信息技术

浙江大学2025-03-24

信息技术

清华大学2025-02-11