浙江大学浙江大学deepseek系列专题线上公开课第四期 浙江大 iejaangunverst 可以燎原 deepseek之火 浙江大学deepseek系列专题线上公开课 朱朝阳 浙江大学医学院基础医学实验教学中心医学人工智能教学分中心主任 浙江大学医学院浙江大学人工智能通识基础 朱朝阳(理工农医)教材主编 浙江大学浙江大学deepseek系列专题线上公开课第四期 求仁得仁,求佛得佛 唐僧,古典名著《西游记》中的人物。俗家姓陈,乳 名江流儿,法名玄装,号三藏。 经藏总说根本教义,即佛学的经典著作 三藏律藏记述戒规威仪,即律法和仪轨 朱朝阳 浙江大学医学院基础医学实 论藏闸明经义,即历代高僧大德的读书验教学中心医学人工智能教 笔记学分中心主任 浙江大学人工智能通识基础 (理工农医)教材主编 图片来源httpsbaijiahaobaiducomsid1809498908099648635wfrspiderforpc 浙江大学浙江大学deepseek系列专题线上公开课第四期 开放、包容和共享历来是我们中华民族的美德 保佑家人平安 通义万相a openaldeepseek 朱朝阳 浙江大学医学院基础医学实验教学中心医学人工智能教 小乘法大乘法学分中心主任 以“自渡”为核心,追求个人和家人的幸福以“利他”为核心,追求普度众生浙江大学人工智能通识基础 (理工农医)教材主编 浙江大学浙江大学deepseek系列专题线上公开课第四期 英文的巴别塔魔咒 巴别塔魔咒:《圣经》中记载的一个故事,人类为了建造一座通天高塔(巴别塔)以彰显自己的智慧和力量,但上帝为了阻止这一计划,让人类说不同的语言,导致沟通障碍,最终高塔未能建成。这个事件象征着人类因沟通不畅而产生的分裂和冲突。 17万通用词汇,含历史词汇、方言、已经和即将废弃7万 存50万专业词汇,各领域总和 量朱朝阳 100万总词汇量,含废弃词、科技术语 浙江大学医学院基础医学实 学分中心主任 约10002000个核心高频词验教学中心医学人工智能教 850025000个广义新增词浙江大学人工智能通识基础 (理工农医)教材主编 浙江大学浙江大学deepseek系列专题线上公开课第四期 zhejanguntveasity 英文将成为ai发展的巨大挑战 2050年 17个地球的算力 朱朝阳 浙江大学医学院基础医学实验教学中心医学人工智能教学分中心主任 浙江大学人工智能通识基础 (理工农医)教材主编 浙江大学浙江大学deepseek系列专题线上公开课第四期 英文存储的低效和空间浪费 modernenglish 1700 1450 cattle牛 meat肉beaf牛肉 middleenglish 1150朱朝阳 oldenglish浙江大学医学院基础医学实 450验教学中心医学人工智能教 英语发展简史 学分中心主任 fly飞 machine机器 airplane飞机 浙江大学人工智能通识基础 (理工农医)教材主编 图片来源httpswww51wendangcomdocd47cc98a0233007f900cb41e2 浙江大 zhejangunnveasity 汉语的高效和可传承 浙江大学deepseek系列专题线上公开课第四期 汉宾演变史 汉字起源于上古的象形文字,历经甲骨文、金文、小篆、隶书、楷书、简化字等演变五千年一路传承,蕴含着中华文明的核心基因密码。从甲骨灼烧的裂纹到手机屏幕的像素点 每一次形态革新都烙印着技术与文化的对话。 存量增量 3700现代常用字几乎为0年 甲骨文股高时所 全文尚家西阳转刻在股周的器上的信文 小翠 大革:春代政国到泰时通行字伴,包据自文和石健文 车统一文午为小家等名息代石刻有 蒙书 构词法搭积木,知识迁移 直接民金书病变西来 46933康熙字典 曲小草滨安百来产汉得单有草书特点朱朝阳 ,,的 产生和演变实全基理 论草书园 5000甲骨文金文浙江大学医学院基础医学实 85万中华字海 又格正书成真书,由现手汉求,敢香指书烧型 南北射时别通行特点是模于整直 形成子两香行书证 是介于借书,早书间的一价字伴 验教学中心医学人工智能教 学分中心主任 浙江大学人工智能通识基础 5万生字,含古字汉字的演变史(理工农医)教材主编 图片来源httpsmbdbaiducomnewspagedatadtlandingsuperniddt4327727722631580564 浙江大学 浙江大学deepseek系列专题线上公开课第四期 deepseek与chatgpt训练语料对比 总语料规模13万亿token 、英文语料占比约926,主要来源于互联网公开文本,包括维基百科、新闻报道、书籍、学术论文、程序代码等 ,中文语料占比仅约01,来源单一,学术文献不足,中文互联网内容(如社交媒体、论坛)噪声较多,需复杂清洗 chatgpt4 总语料规模:148万亿token,涵盖多语言、数学、编程等领域,其中87代码、10英文、3中文 deepseek 中文语料特点:有约23亿字精校的古典文献;覆盖网络文学、社交媒体、学术论文等现代文本;通过“干字文”式分词算法增强对成语、典故理解 朱朝阳 数据处理技术:浙江大学医学院基础医学实 过滤机制:采用多层净化技术(如“八面受敌法”),数据噪音剔除精度达997。验教学中心医学人工智能教 学分中心主任 分词优化:结合古典语法与现代汉语的分词算法,使成语理解准确率提升38。浙江大学人工智能通识基础 ,长上下文支持:通过两阶段扩展训练,将上下文窗口扩展至128k,增强长文本处理能力。(理工农医)教材主编 浙江大学浙江大学deepseek系列专题线上公开课第四期 用汉字进行模型训练将在这场ai之争中胜出? 中文英文 deepseek1333 chatgpt1900朱朝阳 浙江大学医学院基础医学实验教学中心医学人工智能教学分中心主任 浙江大学人工智能通识基础 (理工农医)教材主编 浙江大学 浙江大学deepseek系列专题线上公开课第四期 zhejangunnveasity 增加参数增加数据 大力出奇迹的范式 算力三性能 产业断 ai断思想禁铟 提升性能增加算力 增加算力学术垄断 gpt4o卡脖眸子朱朝阳 grok31027flops gpt31024flops浙江大学医学院基础医学实 验教学中心医学人工智能教 bertlarge1023flops alexnet1020flops1018flops 学分中心主任 浙江大学人工智能通识基础 (理工农医)教材主编 浙江大学浙江大学deepseek系列专题线上公开课第四期 中华民族的不屈不挠精神 deepseek的技术突围 算力优化打破cuda标准库壁垒,为非英伟达算力芯片提供机会 我命由我不由天人工智能 算法革新采用思维链提升逻辑性能,实现模型的顿悟时刻 朱朝阳 若前方无路我便踏出一条路 三要素 浙江大学医学院基础医学实验教学中心医学人工智能教学分中心主任 架构创新知识蒸馏moe,证明小规模高质量数据远胜低质量大浙江大学人工智能通识基础 规模数据(理工农医)教材主编 浙江大学浙江大学deepseek系列专题线上公开课第四期 从中华文化基因看deepseek的成功之道 报告提纲 deepseek的二点争议 朱朝阳 关于人工智能未来发展之路的思考浙江大学医学院基础医学实验教学中心医学人工智能教学分中心主任 deepseek私有化应用方法 浙江大学人工智能通识基础 (理工农医)教材主编 浙江大学浙江大学deepseek系列专题线上公开课第四期 争议一:知识蒸馏是抄袭还是创新 知识蒸馏(knowledgedistillation)是一种模型压缩和加速技术,旨在将大型模型(教师模型)的知识 迁移到小型模型(学生模型),在减少计算资源消耗,缩短推理时间的同时,尽可能达到接近大型模型的 性能。 高质量数据 海量数据预训练大模型提取知识小模型 怒发冲冠凭栏?借? 朱朝阳 浙江大学医学院基础医学实验教学中心医学人工智能教学分中心主任 浙江大学人工智能通识基础 预测分布预测分布(理工农医)教材主编 知识蒸增的实现过程 浙江大学浙江大学deepseek系列专题线上公开课第四期 争议一:知识蒸馏是抄袭还是创新 何为抄袭和剽窃? 牛顿第一定律:如果一个物体所受合外力为0,那么这个物体将保持静止或匀速直线运动牛顿第二定律:物体的动量随时间的变化率与受力成正比。 牛顿第三定律:相互作用的两个物体之间的作用力和反作用力大小相等,方向相反,作用在同一条直线上。 牛顿三大定律我也知道,所以这朱朝阳 些定律是我发现的 浙江大学医学院基础医学实验教学中心医学人工智能教学分中心主任 浙江大学人工智能通识基础 (理工农医)教材主编 浙江大学浙江大学deepseek系列专题线上公开课第四期 争议一:知识蒸馏是抄袭还是创新 何为创新? 基于牛顿定律等 物理实现航天器 制造零件 朱朝阳 浙江大学医学院基础医学实验教学中心医学人工智能教学分中心主任 机械式机床数控式机床浙江大学人工智能通识基础 (理工农医)教材主编 浙江大学 zhejangunneasity 浙江大学deepseek系列专题线上公开课第四期 争议一:知识蒸馏是抄袭还是创新 chatgptdeepseekmol00000000 朱朝阳 meta llama3 revtertopx 女通义干问 deepseek oo0oinputhddenu 浙江大学医学院基础医学实验教学中心医学人工智能教学分中心主任 transformer浙江大学人工智能通识基础 (理工农医)教材主编 attentionisallyouneed 浙江大学浙江大学deepseek系列专题线上公开课第四期 争议二:人工智能是资源黑洞还是效率革命 attyfron grok320万h100deepseok2千h800 vs 智能决策 朱朝阳 浙江大学医学院基础医学实 无情吞噬地球资源的黑洞提高效率验教学中心医学人工智能教 低能耗学分中心主任 浙江大学人工智能通识基础 (理工农医)教材主编 来源:httpsxcomxaistatus18916997152987304822025年2月18日 浙江大学浙江大学deepseek系列专题线上公开课第四期 从中华文化基因看deepseek的成功之道 报告提纲 deepseek的二点争议 朱朝阳 关于人工智能未来发展之路的思考浙江大学医学院基础医学实验教学中心医学人工智能教学分中心主任 deepseek私有化应用方法 浙江大学人工智能通识基础 (理工农医)教材主编 浙江大学浙江大学deepseek系列专题线上公开课第四期 zhejangunveasity ai道与术 从哪里来?到哪里去? 朱朝阳 人工智能浙江大学医学院基础医学实 验教学中心医学人工智能教 学分中心主任 浙江大学人工智能通识基础 (理工农医)教材主编 浙江大学 zhejanguntversitt 浙江大学deepseek系列专题线上公开课第四期 ai道与术 9modelsdatasetsbspacespostsedocsgenterprise models1472572《道德经》:有道无术,术尚可求也,有术 manatwan21t2v14b无道,止于术。 btetovideoupdabed4daysapo142ko646 道是规律、道理和本源,而术则是指具 microsoftphi4mvltimodalinstruct体方法和技巧。这句话告诉我们在解决问题时,只有掌握了事物发展规律,才能更 huggingfaceco 朱朝阳 ddeepseekasdeepseekr好地寻求技巧和方法,而只有真正理解和掌 堆量不堆质握了“道”和“术”,才能更好地应对各种问题,举一反三,不断取得成功 商高定律:记录在公元前1世纪 左右编写《周算经》。商高浙江大学医学院基础医学实 与周公对话中提及:“故折矩验教学中心医学人工智能教 勾广三,股修四,经隅五。学分中心主任 大道至简道不足则多术浙江大学人工智能通识基础 (理工农医)教