[中邮证券]：金工周报：ai动态汇总：gemini2.5pro发布即屠榜，deepseekv3完成模型更新 -尊龙凯时人生就博

2025-03-31肖承志、冯昱文中邮证券b***

ai智能总结

" data-src="https://public.fxbaogao.com/report-image/2025/03/31/4755175-1.png?x-oss-process=image/crop,x_0,y_0,w_1980,h_2800/resize,p_60" data-sizes="200px" data-error="fx-img-error-default;;;height: 720px;" data-srcset="https://public.fxbaogao.com/report-image/2025/03/31/4755175-1.png?x-oss-process=image/crop,x_0,y_0,w_1980,h_2800/resize,p_60" class="lazy"/>

证券研究报告：金融工程报告 2025年3月31日研究所分析师肖承志 sac登记编号s1340524090001 emailxiaochengzhicnpseccom 金工周报 gemini25pro发布即屠榜，deepseekv3完成模型更新ai动态汇总20250331 研究助理冯昱文 sac登记编号s1340124100011 近期研究报告 emailfengyuwencnpseccom 《英伟达召开gtc2025大会，skyworkr1v、混元t1等推理模型接连上线ai动态汇总20250324》20250325 《反转效应强势，gru模型新高中邮因子周报20250323》20250324 《微盘领涨创下历史新高，4月临近仍有调整压力微盘股指数周报20250316》20250317 《小市值强势，动量风格依旧中邮因子周报20250309》20250310 《泛科技大幅回调，融资资金和etf资金逆市流入行业轮动周报20250302》20250303 《高波不再持续，多数风格切换中邮因子周报20250302》20250303 《3月胜率最高的策略：多微盘空1000微盘股指数周报20250302》 20250302 《deepseek背景综述及在金融领域应用场景初探》20250226 《扩散指数有高位回调风险微盘股指数周报20250216》20250217 《基本面回撤，高波风格持续中邮因子周报20250209》20250210 《各资金持续流入机器人，短期注意回调风险，行业轮动开始超配成长行业轮动周报20250209》20250210 《全面牛市正在到来，微盘有望修复前高微盘股指数周报20250209》 20250210 谷歌发布gemini25pro，发布即屠榜谷歌于2025年3月25日发布了gemini25pro模型，据介绍，gemini25是思维模型（thinkingmodels），能够在响应之前通过思考进行推理，从而提高性能和准确性。截至2025年3月25日，gemini25pro已经登顶了lmarena排行榜的第一位，而且创下了历史最大分数飞跃，截止2025年3月30日，gemini25pro比第二名的chatgpt4olatest20250326高出35分，更是比上月发布即屠榜的grok3分数高了接近40分。 deepseekv3完成模型更新，各项能力全面进阶 deepseekv3模型已完成小版本升级，目前版本号deepseekv30324，本次模型更新提升主要围绕推理任务表现、前端开发能力、中文写作能力、中文搜索能力、工具使用能力展开。 chatgpt4o更新，原生图像生成能力大幅提升 3月25日，山姆奥特曼亲自带队直播发布chatgpt4o更新，并现场利用chatgpt4o制作梗图，生成的吉博力风格图片引起网络上的模仿热潮。昆仑万维发布全球首款音乐推理模型murekao1 继发布skywork后，昆仑万维又发布一重量级大模型mureka01专门应用于音乐领域，发布后一举将同类模型suno拉下第一名的宝座。该模型基于murekav6基座，结合cot技术，只需要一段提示词即可生成想要的音乐。murekao1是全球首个将cot用到音乐生成领域的模型，在众多音乐生成基准对比中表现超过同类大模型。风险提示：本报告所有信息基于网络内容整理，不构成投资建议。目录 1ai重点要闻4 11谷歌发布gemini25pro，发布即屠榜4 12deepseekv3完成模型更新，各项能力全面进阶7 13chatgpt4o更新，原生图像生成能力大幅提升9 14昆仑万维发布全球首款音乐推理模型murekao110 2企业动态11 21gpt4o再次升级，新版本已面向全部付费用户开放11 22蚂蚁集团采用国产芯片训练ai：性能匹配h800，成本显著降低12 23阿里通义千问发布新一代端到端多模态旗舰模型qwen25omni，现已开源12 24百度发布国内首个对话式应用开发平台秒哒14 3ai行业洞察15 31tao方法微调llama模型，financebench跑分超gpt4o15 32arcagi2测试登场：ai模型得分惨淡16 4技术前沿16 41昆仑万维首创musicot框架16 42tao：使用测试时间计算来训练没有标记数据的高效llm17 5风险提示18 图表目录图表1：gemini25pro发布即屠傍4 图表2：gemini25pro跑分5 图表3：提示词demo6 图表4：gemini25pro模型指标7 图表5：deepseekv30324评测对比8 图表6：deepseekv30324前端开发案例8 图表7：chatgpt4o原生图展示9 图表8：mureka模型对比11 图表9：gpt4o更新后排名上升12 图表10：qwen25omni评测13 图表11：秒哒介绍14 图表12：tao15 图表13：tao测评15 图表14：arcagi1vsarcagi216 图表15：musicot论文17 图表16：musicot架构17 图表17：tao架构18 1ai重点要闻 11谷歌发布gemini25pro，发布即屠榜谷歌于2025年3月25日发布了gemini25pro模型，据介绍，gemini25是思维模型（thinkingmodels），能够在响应之前通过思考进行推理，从而提高性能和准确性。截至2025年3月25日，gemini25pro已经登顶了lmarena排行榜的第一位，而且创下了历史最大分数飞跃，截止2025年3月30日，gemini 25pro比第二名的chatgpt4olatest20250326高出35分，更是比上月发布即屠榜的grok3分数高了接近40分。图表1：gemini25pro发布即屠傍资料来源：lmarena，中邮证券研究所本次gemini25pro模型主要有以下亮点：推理和代码能力大幅提升在常见的推理，科学、数学、代码生成、视觉推理、图片识别长上下文以及多语言表现领域，gemini25pro均有不俗的表现。图表2：gemini25pro跑分资料来源：google，中邮证券研究所除此之外，在各类需要高级推理能力的基准测试中，它都达到了sota水平。无需使用测试阶段会增加计算成本的技术（如多数投票法），25pro就能在gpqa和aime2025等数学和科学基准评测中表现卓越。而且，在不使用任何外部工具的条件下，它就在挑战人类知识和推理能力的极限前沿“人类最后的考试”中取得了188的准确率，达到业界领先。编程能力大幅提升相比较于gemini20，gemini25pro在编程方面有了长足的飞跃， 25pro擅长创建视觉上引人注目的web应用程序和代理代码应用程序，以及代码转换和编辑。在代理代码评估的行业标准swebenchverified上，gemini25pro使用自定义代理设置得分为638。谷歌团队通过demo展示了gemini25pro如何运用强大推理，仅通过一行提示词，就能生成可执行代码，来创建完整的动画和游戏。图表3：提示词demo 资料来源：google，中邮证券研究所原生多模态和超长上下文 gemini25继承并发扬了gemini模型的优势原生多模态能力和超长上下文长度。自己发布之初，25pro就支持100万token的上下文窗口，性能显著超越了前代模型。这能让它理解海量数据集，并处理来自多种信息源的复杂问题，包括文本、音频、图像、视频，甚至完整的代码仓库。图表4：gemini25pro模型指标资料来源：google，中邮证券研究所 12deepseekv3完成模型更新，各项能力全面进阶 deepseekv3模型已完成小版本升级，目前版本号deepseekv30324，本次模型更新提升主要围绕以下方面：推理任务表现提高新版v3模型借鉴deepseekr1模型训练过程中所使用的强化学习技术，大幅提高了在推理类任务上的表现水平，在数学、代码类相关评测集上取得了超过gpt45的得分成绩。图表5：deepseekv30324评测对比资料来源：deepseek，中邮证券研究所前端开发能力增强在html等代码前端任务上，新版v3模型生成的代码可用性更高，视觉效果也更加美观、富有设计感。图表6：deepseekv30324前端开发案例资料来源：deepseek，中邮证券研究所中文写作升级在中文写作任务方面，新版v3模型基于r1的写作水平进行了进一步优化，同时特别提升了中长篇文本创作的内容质量。中文搜索能力优化新版v3模型可以在联网搜索场景下，对于报告生成类指令输出内容更为详实准确、排版更加清晰美观的结果。函数调用能力增强提高函数调用的准确性，修复之前v3版本中的问题。 13chatgpt4o更新，原生图像生成能力大幅提升 3月25日，山姆奥特曼亲自带队直播发布chatgpt4o更新，并现场利用chatgpt4o制作梗图，生成的吉博力风格图片引起网络上的模仿热潮。图表7：chatgpt4o原生图展示资料来源：openai，中邮证券研究所 gpt4的图像生成功能擅长准确渲染文本，精确遵循提示词，并利用gpt4o固有的知识库和聊天上下文包括转换上传的图像或将其用作视觉灵感。这些能力让用户可以更加容易地创建想象中的画面，帮助通过视觉更有效地沟通，并将图像生成发展成为一种具有精确性和强大功能的实用工具。毕竟，只有当图像配上指代共享语言和经验的符号时，才能传达精确的含义。与之前相比，这次针对原生图的改进主要有以下特点：1能力大幅增强：通过线上图像和文本的联合分布训练，模型不仅能学会图像如何与语言相关联，还能知道它们之间的相互关系。结合积极的后训练优化，最终的模型展现出惊人的视觉表现力，能够生成实用、一致且具有上下文感知能力的图像。2文本渲染优化：gpt4o将精确的符号与图像融合的能力使图像生成成为视觉交流的有力工具。3多轮交互生成：gpt4o能够基于聊天上下文中的图像和文本进行构建，确保始终保持一致性。4指令遵循优化：gpt4o的图像生成功能不仅可以遵循详细的提示词，而且还十分注重细节。相比起其他只能处理58个物体的模型，gpt4o可以轻松搞定多达1020个不同的物体。5根据上下文进行学习：gpt4o能够分析并学习用户上传的图像，将图像细节无缝整合到上下文中，用于辅助图像生成。6图片风格多样：通过对反映多种多样图像风格的图像进行训练，模型能够以令人信服的方式创建或转换图像。 14昆仑万维发布全球首款音乐推理模型murekao1 继发布skywork后，昆仑万维又发布一重量级大模型mureka01专门应用于音乐领域，发布后一举将同类模型suno拉下第一名的宝座。该模型基于murekav6基座，结合cot技术，只需要一段提示词即可生成想要的音乐。murekao1是全球首个将cot用到音乐生成领域的模型，在众多音乐生成基准对比中表现超过同类大模型。图表8：mureka模型对比资料来源：mureke，中邮证券研究所 2企业动态 21gpt4o再次升级，新版本已面向全部付费用户开放 3月28日，openai宣布gpt4o带来了一些功能上的更新，并确认升级版gpt 4o已面向所有付费用户开放，而免费用户还要再等几周。gpt4o本次更新聚焦四大核心部分：多指令解析优化：显著提升对包含多重需求的复杂指令理解能力；技术问题处理增强：强化复杂技术及编程问题的解析与尊龙凯时人生就博的解决方案生成；逻辑推理与创造力提升：增强创新性思维与跨领域知识融合能力；交互界面精简：减少表情符号使用频率，优化专业场景对话体验。除此之外，在ai基准测试平台lmarena上，最新的chatgptgpt4o（2025 0326）模型已经提升到了第二名的位置，甚至超过了其上个月推出的gpt45。与20250129那次测试成绩相比，此次

你可能感兴趣

" data-src="https://public.fxbaogao.com/report-image/2025/06/03/4877497-1.png?x-oss-process=image/crop,x_0,y_0,w_1980,h_2800/resize,p_60" data-sizes="200px" data-error="fx-img-error-mini;;;" data-srcset="https://public.fxbaogao.com/report-image/2025/06/03/4877497-1.png?x-oss-process=image/crop,x_0,y_0,w_1980,h_2800/resize,p_60" class="lazy industryimg__app-containers-fxbaogao-detail-industrycard-style-module__ulqfc"/>

金工周报：ai动态汇总-deepseek-r1完成小版本更新，阿里开源自主搜索ai智能体

中邮证券2025-06-03

中邮证券2025-05-06

" data-src="https://public.fxbaogao.com/report-image/2025/06/09/4890863-1.png?x-oss-process=image/crop,x_0,y_0,w_1980,h_2800/resize,p_60" data-sizes="200px" data-error="fx-img-error-mini;;;" data-srcset="https://public.fxbaogao.com/report-image/2025/06/09/4890863-1.png?x-oss-process=image/crop,x_0,y_0,w_1980,h_2800/resize,p_60" class="lazy industryimg__app-containers-fxbaogao-detail-industrycard-style-module__ulqfc"/>

ai动态汇总【中邮金工】：谷歌更新gemini 2.5 pro，阿里开源qwen3新模型

中邮证券2025-06-09

中邮证券2025-04-08

" data-src="https://public.fxbaogao.com/report-image/2025/03/17/4734447-1.png?x-oss-process=image/crop,x_0,y_0,w_1980,h_2800/resize,p_60" data-sizes="200px" data-error="fx-img-error-mini;;;" data-srcset="https://public.fxbaogao.com/report-image/2025/03/17/4734447-1.png?x-oss-process=image/crop,x_0,y_0,w_1980,h_2800/resize,p_60" class="lazy industryimg__app-containers-fxbaogao-detail-industrycard-style-module__ulqfc"/>

ai动态汇总：openai发布搭建智能体新工具，谷歌发布轻量级模型gemma 3

中邮证券2025-03-17