浙江大学人工智能教育教学研究中心 浙江大学人工智能教育教学研究中心 浙江大学人工智能教育教学研究中心 浙江大学人工智能教育教学研究中心 浙江大学人工智能教育教 人工智能重塑科学与工程研究 朱霖潮 工智能教育教学研究中心 浙江大学人工智能教育教学研究中心 浙江大学计算机科学与技术学院人工智能研究所zhulinchaozjueducn recognition,learning,reasoning 浙江大学人工智能教育教学研究中心 浙江大学人工智能教育教学研究中心 浙江大学人工智能教育教学研究中心 浙江大学人工智能教育教 科学研究方法 以蛋白质结构预测为例 ai驱动科学研究的全过程 浙江大学人工智能教育教学研究中心 小结 工智能教育教学研究中心 浙江大学人工智能教育教学研究中心 2 浙江大学人工智能教育教 第一范式:经验驱动基于观察和归纳的实验研究 浙江大学人工智能教育教学研究中心 以经验主义和人的思考为主导的科学研究范式 实验是开展研究的主要手段 起源可追溯至古希腊和中国的早期实验方法 浙江大学人工智能教育教学研究中心 数千年文明史中,人类绝大多数技术发展源于对自然现象的观察和实验总结 浙江大学人工智能教育教学研究中心 工智能教育教学研究中心 浙江大学人工智能教育教学研究中心 浙江大学人工智能教育教学研究中心 甲骨文反映了早期古人通过观察自然现象如天气、农作物生长、天象等,并进行记录的做法。 亚里斯多德认为自由落体运动中,物体越重,下落越快;物体越轻,下落越慢。 伽利略的落体实验:通过实验验证物体落下速度与质量无关 开普勒发现行星的移动遵守着三条定律 浙江大学人工智能教育教学研究中心 浙江大学人工智能教育教学研究中心 浙江大学人工智能教育教 第二范式:理论驱动基于科学假设和逻辑演绎的理论研究 浙江大学人工智能教育教学研究中心 当实验条件不具备时,第一范式难以为继 不再局限于描述经验事实,使用数学工具研究更精确的自然现象 从“知其然”到“知其所以然”,对自然界规律做出背后原理性的解释 浙江大学人工智能教育教学研究中心 探索第一性原理(firstprinciple),提供精确描述自然规律的语言,形成可分析的理论模型 23个定义明确了点、线、面等基本几何概念 浙江大学人工智能教育教学研究中心 5条公设确立了几何作图的基本操作 5条公理奠定了几何推理的基础规则 工智能教育教学研究中心 牛顿定律薛定谔方程欧几里德《几何原本》 浙江大学人工智能教育教 第三范式:计算驱动以计算和仿真为主导的科学研究 浙江大学人工智能教育教学研究中心 肯尼斯威尔逊博士(计算物理学家、诺贝尔奖获得者)指出,计算是与理论和实验并列的科学方法之一 高性能计算机和大规模并行计算兴起 利用计算机精确、大规模求解方程组 浙江大学人工智能教育教学研究中心 探索无法通过实验和理论推导解决的复杂问题 将量子力学方程转换为计算机高效求解的形式 处理复杂多电子体系问题 浙江大学人工智能教育教学研究中心 原子结构电荷密度 波函数哈密顿量 工智能教育教学研究中心 密度泛函理论(dft) 有限元仿真的汽车碰撞测试超级计算机系统 浙江大学人工智能教育教学研究中心 浙江大学人工智能教育教学研究中心 浙江大学人工智能教育教学研究中心 浙江大学人工智能教育教学研究中心 浙江大学人工智能教育教 第四范式:数据驱动数据密集型科学研究方法 浙江大学人工智能教育教学研究中心 图灵奖获得者吉姆格雷提出数据密集型科学研究 利用海量数据采集取代传统观察,以机器学习、统计学等技术替代人类归纳 大数据:例如,美国国家海洋和大气管理局每天收集数十t的环境数据,包含卫星、雷达、船舶、气象 浙江大学人工智能教育教学研究中心 传统模式(先提出假设再验证)vs让数据本身”说话” 工智能教育教学研究中心 浙江大学人工智能教育教学研究中心 天文大数据大型强子对撞机lhc实验数据统计 浙江大学人工智能教育教学研究中心 浙江大学人工智能教育教学研究中心 浙江大学人工智能教育教 第五范式:智能驱动(aiforscience)人工智能驱动的科学研究 浙江大学人工智能教育教学研究中心 计算驱动范式准但不够快,擅长处理小规模的科学问题 数据驱动范式中,ai主要作为数据分析工具;然而仅靠统计分析,难以在复杂系统的研究上实现突破 浙江大学人工智能教育教学研究中心 第五范式中,ai驱动科学发现的全过程,包括提出假设、设计实验等,应对计算复杂性高的组合爆炸问题,实现实验、理论、计算和数据科研范式的融合 科学发现是一个多方面的过程,包含几个相互关联的阶段,包括假设形成、实验设计、数据收集和分析。人工智能有望通过增强和加速研究过程的各个阶段来重塑科学发现1。 浙江大学人工智能教育教学研究中心 知识:改变科学家获取和传递知识的方式数据:生成、提取和标注大规模科学数据集实验:模拟、加速并指导复杂实验 工智能教育教学研究中心 模型:建模复杂系统及其组件的相互作用尊龙凯时人生就博的解决方案:为大规模搜索问题提供方案 1scientificdiscoveryintheageofartificialintelligencenature2024 2anewgoldenageofdiscoveryseizingtheaiforscienceopportunitygoogledeepmind 浙江大学人工智能教育教学研究中心 浙江大学人工智能教育教 钻木取火 开普勒定律牛顿定律 天气预测模拟核试验 瘟疫传播规律交通改善 蛋白质结构预测药物快速发明快速天气预测 科学方法科学成果 经验驱动理论驱动计算驱动数据驱动 智能驱动 客观现象 假设实验数据收集数据分析 总结 无 无 无 实验 数据收集 比萨斜塔 麦克斯韦尔方程 易染感染免疫传播模型模拟 观察 归纳建模 关系挖掘 仿真 海量数据 ai 规则发现 ai 实验辅助 自动收集 数据分析 ai 数据精准采集 ai 数据辅助分析 浙江大学人工智能教育教学研究中心 工智能教育教学研究中心 浙江大学人工智能教育教学研究中心 浙江大学人工智能教育教学研究中心 浙江大学人工智能教育教学研究中心 数学表达式生成 方程加速求解 数据合成 粒子碰撞检测 数据驱动机器学习 浙江大学人工智能教育教 斯托克斯方程 浙江大学人工智能教育教学研究中心 气压梯度力的向量式 湍流系统 标量场 浙江大学人工智能教育教学研究中心 给定时间内在垂直于流动的方向上的热通量和动量传递(由剪切应力表示)为 二维darcyflow方程二维diffusionreaction方程 浙江大学人工智能教育教学研究中心 浙江大学人工智能教育教学研究中心 地转方程 从左到右分别是地转相对涡度、行星涡度和伸展涡度。 向量场 工智能教育教学研究中心 浙江大学人工智能教育教学研究中心 二维navierstokes方程 三维maxwell方程 9 湍流烟雾仿真 塑形锻造仿真 机翼空气流动仿真 浙江大学人工智能教育教学研究中心 浙江大学人工智能教育教学研究中心 浙江大学人工智能教育教学研究中心 浙江大学人工智能教育教 浙江大学人工智能教育教学研究中心 工智能教育教学研究中心 浙江大学人工智能教育教学研究中心 光声成像仿真血管液体流动仿真10 浙江大学人工智能教育教学研究中心 浙江大学人工智能教育教学研究中心 浙江大学人工智能教育教学研究中心 浙江大学人工智能教育教 浙江大学人工智能教育教学研究中心 工智能教育教学研究中心 浙江大学人工智能教育教学研究中心 地球气候状态预测地球浅水状态预测地下水流状态预测 11 浙江大学人工智能教育教学研究中心 工智能教育教学研究中心 浙江大学人工智能教育教 浙江大学人工智能教育教学研究中心 飞机机型设计的优化流程 浙江大学人工智能教育教学研究中心 首先确定需要优化的设计参数,然后进行cfd分析评估气动性能,确定多个优化目标,进行参数敏感性分析 根据结果实施最优约束设计变更,通过形态变换调整机身外形,最终得到空气动力学性能更优的机型设计 ansys发布ansyssimai,通过结合ai,将设计流程加速10100倍 浙江大学人工智能教育教学研究中心 雷诺集团利用ansyssimai,加速了汽车零部件的设计和测试过程,数分钟内完成测试,减少了产品开发周期 浙江大学人工智能教育教学研究中心 12 浙江大学人工智能教育教学研究中心 浙江大学人工智能教育教学研究中心 浙江大学人工智能教育教学研究中心 浙江大学人工智能教育教 华为云盘古气象模型是首个精度超过传统数值预报方法的ai模型,速度相比传统数值预报提速10000倍以上 气象模型能够提供全球气象秒级预报,其气象预测结果包括位势、湿度、风速、温度、海平面气压等 浙江大学人工智能教育教学研究中心 googledeepmind的graphcast:利用图神经网络,不到1分钟内生成10天全球预报,在90的1380个验证目标上优于传统系统 工智能教育教学研究中心 浙江大学人工智能教育教学研究中心 13 浙江大学人工智能教育教学研究中心 浙江大学人工智能教育教 浙江大学人工智能教育教学研究中心 浙江大学人工智能教育教学研究中心 浙江大学人工智能教育教学研究中心 人工智能重塑科学与工程研究 浙江大学人工智能教育教学研究中心 以蛋白质结构预测为例 工智能教育教学研究中心 14 浙江大学人工智能教育教学研究中心 浙江大学人工智能教育教学研究中心 浙江大学人工智能教育教 生命的基本构件和功能执行者 浙江大学人工智能教育教学研究中心 结构决定功能 主要结构(primarystructure):由氨基酸残基 (aminoacidresidue)通过肽键(peptidebond)连接形成的多肽链(polypeptidechain) 浙江大学人工智能教育教学研究中心 二级结构(secondarystructures):多肽链局部折叠形成的规则结构,包括螺旋(helix)和折叠(sheet) 三级结构(tertiarystructure):整个多肽链在三维空间中的折叠结构 四级结构(quaternarystructure):由多个蛋白质亚基组合在一起形成的复合蛋白质结构 疾病与蛋白质结构异常 工智能教育教学研究中心 浙江大学人工智能教育教学研究中心 药物开发与蛋白质靶点 浙江大学人工智能教育教学研究中心 浙江大学人工智能教育教学研究中心 浙江大学人工智能教育教 蛋白质折叠 浙江大学人工智能教育教学研究中心 序列决定结构:蛋白质的氨基酸序列包含了所有必要的信息,决定了其最终三维结构。 一条线性氨基酸链如何在水溶液中自发折叠成特定的三维结构? 浙江大学人工智能教育教学研究中心 折叠机制的复杂性:蛋白质折叠涉及多种分子力的精确平衡:氢键形成、疏水相互作用(疏水核心的形成)、范德华力、静电相互作用、熵效应、溶剂效应 实验挑战 直接观察蛋白质折叠过程极其困难 浙江大学人工智能教育教学研究中心 建立完整的折叠理论困难 计算挑战 工智能教育教学研究中心 从计算角度看,蛋白质折叠问题搜索空间巨大,需要模拟复杂的物理和化学过程 头计算折叠过程十分缓慢 浙江大学人工智能教育教学研究中心 浙江大学人工智能教育教学研究中心 浙江大学人工智能教育教 早期挑战与背景 浙江大学人工智能教育教学研究中心 结构预测的可靠性问题:1980年代末到1990年代初,蛋白质结构预测领域处于混乱状态。 johnmoult和janpedersen的愿景 完全透明、公正的“盲测”竞赛 casp的建立与运作机制 浙江大学人工智能教育教学研究中心 首届casp竞赛(1994年) 独特的盲测机制 casp的演变与影响 casp1到casp9(19942010):稳步进展 casp10casp13(20122018):深度学习兴起 工智能教育教学研究中心 浙江大学人工智能教育教学研究中心 casp14(2020):alphafold2 浙江大学人工智能教育教学研究中心 工智能教育教学研究中心 浙江大学人工智能教