智能金融:ai驱动的金融变革 郑小林教授 浙江大学人工智能研究所2025年03月24日 一、新一代人工智能 定义:人工智能(artificialintelligence,缩写为ai),又称机器智能,指由人制造出来的机器所表现出来的智能。——维基百科 ai的核心问题:建构能够跟人类似甚至超卓的推理、知识、计划、学习、交流、感知、移动、移物、使用工具和操控机械的能力等。 research project on artificial intelligence ,august 31, 1955,dartmouth ——维基百科 google transformer:引入注意力(attention)学习, 2017 前馈网络feed forward 捕捉序列中元素之间复杂关系的多功能组件。通过使用线性变换和非线性激活函数,前馈网络使模型能够处理复杂语义,促进文本的稳健理解和生成。 注意力attention 嵌入层embedding wordembedding:目的是将这些非结构化的文本信息转化为结构化的信息,具体来说是将文本空间中的某个word,映射或者说嵌入(embedding)到另一个数值向量空间 position embedding:输入句子的所有word是同时处理的,没有考虑词的排序和位置信息,所以通过positional encoding来衡量word位置信息 gshard:基于moe探索巨型transformer网络(google, 2020) •编码器和解码器里的部分前馈神经网络(ffn)层被混合专家moe层替代,并采用top-2门控机制; •当模型扩展到多个设备时,moe层在这些设备间共享,而其他层则在每个设备上独立存在。 新一代人工智能发展现状 强化学习奠基人获得2024图灵奖 3月5日公布了acm图灵奖获得者andrewbarto(mit教授)和richard sutton(强化学习之父,阿尔伯塔大学教授,deepmind科学家) ◼强化学习的目标是得到一个策略,用于判断在什么状态下选取什么动作才能得到最终奖赏。 模型蒸馏 模型蒸馏是一种将大型复杂模型(教师模型)的知识迁移到小型高效模型(学生模型)的模型压缩技术,其核心目标是在保持模型性能的同时,显著降低模型的计算复杂度和存储需求,使其在资源受限的环境中部署。 deepseek蒸馏技术的关键创新 数据蒸馏与模型蒸馏的深度结合 数据蒸馏:通过大模型来优化训练数据,包括数据增强、伪标签生成和优化数据分布。模型蒸馏强化:采用基于特征的蒸馏与任务特定蒸馏策略,对小模型进行监督微调 教师模型训练:训练一个高性能的教师模型。知识迁移:利用教师模型的输出(如概率分布、中间层特征等)作为软标签,来指导学生模型的学习。学生模型优化:利用软标签监督训练小模型,使其学习到教师模型的决策逻辑和特征表示,从而提升性能。 链式思考推理迁移 知识传递的深化:不同于传统蒸馏仅模仿输出结果,deepseek要求学生模型学习教师模型的推理逻辑,使学生模型掌握完整的推理链条。 deepseek-r1模型蒸馏与行业应用 人工智能三个阶段 能理解会思考 人类多元智能 多元智能理论(theory of multipleintelligences,简称mi)是由美国哈佛大学教育研究院教授霍华德·加德纳(prof.howard gardner)于1983年所提出的教育理论。 每种智能,都可以透过持续的学习或训练,从而到达一定的水平! ——《心智的架构》(frames of mind: thetheory of multiple intelligences) 挑战2:算法共振 算法共振与羊群效应 金融市场中多个决策模型因算法同质化、数据源相似或逻辑趋同,导致它们在市场中的交易行为高度同步,从而放大市场波动甚至引发系统性风险。 1根因1:模型同质化 •模型结构相似:依赖相似的基础模型(如lstm、transformer、强化学习)•数据来源相似:采用公开数据集进行训练•反应时机一致:信号到决策速度快,决策容易同步 2根因2:黑箱脆弱性 •噪声数据敏感:深度学习模型对噪声数据的敏感性可能导致集体误判。•模型不可解释:决策逻辑缺乏透明,隐蔽未知风险容易叠加。 面临挑战3:创造力与幻觉率悖论? openai:推理增强会明显减少幻觉! deepseekr1实测:推理增强后幻觉率增加!过度延展的推理机制训练数据的奖励偏差 尊龙凯时人生就博的解决方案? prompt中添加对输出结果的约束条件,让结果更符合预期 在强化学习框架下引入幻觉在内的反馈信息 提升训练数据质量(标注、过滤噪声) 给模型输入更多的正确知识;检索增强rag 根据vectara的测试,r1的幻觉率14.3%,显著高于其前身v3的3.9%。这跟它加强了的“思维链”(cot)和创造力直接相关。 面临挑战4:价值对齐 价值对齐方法 人工智能治理政策 如何让大模型的能力和行为跟人类的价值、真实意图和伦理原则相一致,确保人类与人工智能协作过程中的安全与信任。这个问题被称为“价值对齐”或“人机对齐”(value alignment,或ai alignment) ◼基于人类反馈的强化学习(rlhf),要求人类训练员对模型输出内容的适当性进行评估,并基于收集的人类反馈为强化学习构建奖励信号,以实现对模型性能的改进优化; 中国:2023年7月,国家网信办等七部门联合公布《生成式人工智能服务管理暂行办法》 ◼可扩展监督(scalableoversight),即如何监督一个在特定领域表现超出人类的系统; 美国:2023年10月30日,美国白宫政府发布最新的ai行政命令—《关于安全、可靠和可信地开发和使用人工智能的行政命令》 ◼增强模型可解释性,即人类可理解的方式解释或呈现模型行为的能力,这是保证模型安全的重要途径之一; 欧盟:2023年12月9日,欧盟委员会、欧洲议会和欧盟理事会就《人工智能法案》达成临时协议。 ◼加强政策治理,因为ai价值对齐问题最终还关系于人类社会。 二、金融智能:研究实践 新质生产力=(科学技术革命性突破 生产要素创新性配置 产业深度转型升级)×(劳动力 劳动工具 劳动对象)优化组合 中国金融大模型市场 中国金融大模型部署市场 金融大模型市场正快速扩张 maas部署(开箱即用、按需付费)占52%市场份额,引领中小型机构规模化应用;私有化部署占48%,是大型金融机构首选。 2023年,中国金融大模型市场的规模为15.93亿元;2024年上半年,市场规模已达到16亿元;2028年,预计将增长至131.79亿元。 金融领域大模型 金融领域知识增强的大模型 金融任务增强的大模型 侧重实现金融场景,例如信贷风控、投资决策、保险销售等。 侧重理解和生成金融领域的自然语言文本,以传达领域内的知识、解释或描述。 目标 更注重推理过程,核心是如何更好地实现金融业务场景。 更注重训练过程,核心是如何学习好金融领域语料库中知识。 侧重点 用户理解 金融领域知识库(资源消耗小) 基础大模型微调(资源消耗中等) 技术 更适用于需要执行金融特定领域场景的应用,如金融知识图谱构建、自动化决策等。 适用于需要生成或理解金融领域知识的任务,通常用于金融文档的理解、摘要和解释。 适用任务 行业人员,如信贷经理、理财专家、保险销售等 行业知识小白 数字化监管规则 金融合规测评 智能监管沙箱 研究实践1:可信数据空间赋能可信行业大模型 开展可信数据空间培育推广行动 (1)积极推广企业可信数据空间(2)重点培育行业可信数据空间(3)鼓励创建城市可信数据空间(4)稳慎探索个人可信数据空间(5)探索构建跨境可信数据空间 可信数据空间核心支撑——“智隐”隐私计算平台 国家和省部级项目支持 ◼国家重点研发计划课题(no. 2018yfb1403001),多源多模态海量实时征信大数据模型与多维度表示方法。(2019-2022)◼国家重点研发计划课题(no.2022yf02001),隐私计算赋能“共同富裕”评估与监测子课题。(2023-2025)◼浙江省尖兵领雁计划(no.2022c01126),“基于区块链的数据共享和隐私计算关键技术研发与应用”(2022-2024)◼浙江省数字经济标准化试点重大项目(fyc012308-187)“浙江省数据多方安全计算标准试点”(2023-2025) 研究实践2:隐私保护大模型 挑战 现有隐私保护大模型面临通信效率低、潜在的隐私安全问题、多方协作的模型产权纠纷等挑战。 解决思路 联邦大模型(fedllm)旨在保障隐私的同时整合多源数据,突破数据壁垒。通信效率问题:通过低秩适配器lora压缩通信参数,提高效率。隐私安全问题:通过自动化敏感数据检测机制,识别隐私片段。模型产权问题:通过动态水印技术,将水印嵌入模型权重,减少产权纠纷。 研究实践3:基于大模型的金融营销短信文案生成 金融短信营销现状 目标1:丰富短信文案素材库 ◼短信文案数量少。先前的短信文案主要依赖人工编写,限制了对用户的个性化的信息沟通。 利用大模型生成更丰富的涉及不同场景和风格的短信文案,以适应不同的营销活动和用户群体 ◼文案内容单一且易被拦截。现有文案缺乏多样性,容易触发运营商的垃圾营销短信过滤机制,导致短信送达率较低。 目标2:降低短信拦截率 目标3:提升短信营销转化率 ◼短信营销转化率低。由于文案缺乏个性化、吸引力和针对性,未能有效激发用户的兴趣和行动。短信链接点击率较低且业务转化率较差。 大模型可以生成内容丰富的文案,有助于提高文案的真实性,减少被拦截的风险。 根据已投放的短信内容和短信转化率,来进行大模型优化,使模型能够生成转化率高的文本 研究实践4:营销领域大模型 营销领域大模型项目围绕大模型在智能体(agent)、检索增强生成(rag)、模型微调三方面能力持续突破,解决“小鱼管家”金融营销应用中四大应用难题:建档回填繁琐、功能检索复杂、客群问答关联性差、产品问答不智能。 营销领域大模型 建档回填助手 构建策略业 务痛 点 :客 户建 档 和面 访 基本 依靠 手动 输 入和 部 分oc r识 别, 且 建档 内容 和 客户k y c内 容不 完 全匹 配 ,还 需要 再 多次 补 充。 解 决方 案:增 强交 互 能力,支 持客户 经理 语 音输 入,通 过a s r语 音转 文本技 术,再 结合大 模型 提 炼对应 结构 化 数据 进 行一 键 填写,对 于客 户建 档 中没 有 的内 容 也支 持 通过语 音或 备 忘的 形 式自 动 落到 用 户k y c中 提高k y c信 息完 整 度。 备忘录asr识别 客户信息回填kyc 项目支持:浙江大学-**银行金融科技联合研发中心一期项目 研究实践5:**银行新决策模型赋能信贷决策 场景分析:在信贷领域,以评分卡模型为主的量化模型已逐渐取代人工审批,提升审批效率。然而,量化模型依然高度依赖专家先验知识进行特征建模和标签发现,无法提升认知效率。该项目拟通过决策大模型,实现认知挖掘的自动化。 新决策模型赋能信贷决策 研究实践6:投研问答与投资尽调助手 投研问答系统痛点: 1.研报的多模态2.知识关联性复杂3.信息检索效率低 技术方案: 图索引g-index • 图检索g-retrieval 图生成g-generation 投研问答与投资尽调助手 案例一:跨年报知识整合总结 在这些文档的年报中,金融机构在应对经济周期波动时,分别通过何种战略性调整来优化资产负债结构?结合这些措施,分析这些调整对其资本充足率、流动性风险及盈利能力的综合影响。 检索 检索 思考 2019年12月31日的企业存款为1,853,262百万元,个人存款为583,673百万元。因此,企业存款比个人存款高出的