您的浏览器禁用了javascript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系尊龙凯时网址。[浙江大学]:deepseek之火,可以燎原 -尊龙凯时人生就博

[浙江大学]:deepseek之火,可以燎原 -尊龙凯时人生就博

信息技术2025-03-10浙江大学健***
尊龙凯时人生就博ai智能总结
" data-src="https://public.fxbaogao.com/report-image/2025/03/10/4855612-1.png?x-oss-process=image/crop,x_0,y_0,w_1980,h_2800/resize,p_60" data-sizes="200px" data-error="fx-img-error-default;;;height: 720px;" data-srcset="https://public.fxbaogao.com/report-image/2025/03/10/4855612-1.png?x-oss-process=image/crop,x_0,y_0,w_1980,h_2800/resize,p_60" class="lazy"/>

deepseek之火可以燎原 从中华文化基因看deepseek成功之道 deepseek的二点争议 报告提纲 关于人工智能未来发展之路的思考 deepseek私有化应用方法 求仁得仁,求佛得佛 唐僧,古典名著《西游记》中的人物。俗家姓陈,乳名江流儿,法名玄奘,号三藏。 总说根本教义,即佛学的经典著作 记述戒规威仪,即律法和仪轨 阐明经义,即历代高僧大德的读书笔记 开放、包容和共享历来是我们中华民族的美德 英文的巴别塔魔咒 巴别塔魔咒:《圣经》中记载的一个故事,人类为了建造一座通天高塔(巴别塔)以彰显自己的智慧和力量,但上帝为了阻止这一计划,让人类说不同的语言,导致沟通障碍,最终高塔未能建成。这个事件象征着人类因沟通不畅而产生的分裂和冲突。 通用词汇,含历史词汇、方言、已经和即将废弃7万 维克存量 斯专业词汇,各领域总和 增量 英文将成为ai发展的巨大挑战 2050年1.7个地球的算力 汉语的高效和可传承 汉字起源于上古的象形文字,历经甲骨文、金文、小篆、隶书、楷书、简化字等演变,一路传承,蕴含着中华文明的核心基因密码。从甲骨灼烧的裂纹到手机屏幕的像素点,每一次形态革新都烙印着技术与文化的对话。 deepseek与chatgpt训练语料对比 chatgpt4deepseek •中文语料占比仅约0.1%,来源单一,学术文献不足,中文互联网内容(如社交媒体、论坛)噪声较多,需复杂清 •总语料规模:14.8万亿token,涵盖多语言、数学、编程等领域,其中87%代码、10%英文、3%中文 维克多-d.o.-桑托斯•中文语料特点:有约2.3亿字精校的古典文献;覆盖网络文学、社交媒体、学术论文等现代文本;通过“千字文”式分词算法增强对成语、典故理解 •过滤机制:采用多层净化技术(如“八面受敌法”),数据噪音剔除精度达99.7%。 •分词优化:结合古典语法与现代汉语的分词算法,使成语理解准确率提升38%。 •长上下文支持:通过两阶段扩展训练,将上下文窗口扩展至128k,增强长文本处理能力。 用汉字进行模型训练将在这场ai之争中胜出? 中文:英文 deepseek1:3.33chatgpt1:900 中华民族的不屈不挠精神 从中华文化基因看deepseek的成功之道 deepseek的二点争议 报告提纲 关于人工智能未来发展之路的思考 deepseek私有化应用方法 争议一:知识蒸馏是抄袭还是创新 知识蒸馏(knowledgedistillation)是一种模型压缩和加速技术,旨在将大型模型(教师模型)的知识迁移到小型模型(学生模型),在减少计算资源消耗,缩短推理时间的同时,尽可能达到接近大型模型的性能。 争议一:知识蒸馏是抄袭还是创新 何为抄袭和剽窃? 一个物体所受合外力为0,那么这个物体将保持静止或匀速直线运动 牛顿第一定律:如果牛顿第二定律:物体的动量随时间的变化率与受力成正比。牛顿第三定律:相互作用的两个物体之间的作用力和反作用力大小相等,方向相反,作用在同一条直线上。 牛顿三大定律我也知道,所以这些定律是我发现的 争议一:知识蒸馏是抄袭还是创新 何为创新? 争议二:人工智能是资源黑洞还是效率革命 智能决策提高效率低能耗 从中华文化基因看deepseek的成功之道 deepseek的二点争议 报告提纲 关于人工智能未来发展之路的思考 deepseek私有化应用方法 ai的道与术 《道德经》:有道无术,术尚可求也,有术无道,止于术。 桑托斯道是规律、道理和本源,而术则是指具体的方法和技巧。这句话告诉我们在解决问题时,只有掌握了事物发展的规律,才能更好地寻求技巧和方法,而只有真正理解和掌握了“道”和“术”,才能更好地应对各种问题,举一反三,不断取得成功 堆量不堆质 商高定律:记录在公元前1世纪左右编写的《周髀算经》。商高与周公的对话中提及:“故折矩,勾广三,股修四,经隅五。” 道不足则多术 大道至简 ai的道与术 《道德经.第四十二章》:道生一,一生二,二生三,三生万物。万物负阴而抱阳,冲气以为和。 维克多-d.o.-桑托斯《易经·系辞》:形而上者谓之道,形而下者谓之器。 何为道? ai的道与术 智:为阴,即心智,内心之所思所想,即人工智能的算法 能:为阳,即行动,外在的表现,即人工智能带给我们的能力扩展 ai的道与术 能:为阳,即行动,外在的表现,即人工智能带给我们的能力扩展 智:为阴,即心智,内心之所思所想,即人工智能的算法 道生一,一生二,二生三,三生万物。万物负阴而抱阳,冲气以为和。 ai的伦理安全与道德困境 ai的算法偏见和统治 阴阳气和是人工智能的一条发展之道 维机器人三守则,机器人能做到吗?我们该把人工智能当工具还是人?当个人隐私与公共安全冲突时,该如何选择?人工智能是否会造成教育不公?面对ai的算法统治和偏见怎么办?不同种族和宗教信仰的人群又如何达成伦理共识?aigc幻觉是不是造假?通过ai换脸进行诈骗该如何杜绝?学术诚信如何防范?............. 从中华文化基因看deepseek的成功之道 deepseek的二点争议 报告提纲 关于人工智能未来发展之路的思考 deepseek私有化应用方法 增强本地deepseek能力的二个方案 检索增强生成retrieval-augmentedgeneratio,rag 提示词工程promptengineering 微调fine-tuning •针对特定任务或领域定制,显著提高任务性能•适应特定领域的细微差别、语气或术语•依赖足够高质量标注数据•适合目标任务明确、数据相对静态的场景 •通过精心设计输入提示,引导llm生成期望的高质量输出•无需重新训练模型,不需要标注数据•一些提示工程框架可以显著增强llm的推理能力•灵活性、使用简单 维克多-d.o.-桑托斯•利用外部知识库增强答案•提供支持性的证据•能够动态检索相关知识•适合数据频繁更新的场景•成本效益高更可信、更可解释、时效性和准确性高 提供项目资料 任务布置清晰 训练实习生 斯 1、下载安装ollama:https://ollama.com/download rag部署过程 2、下载安装cherrystudio:https://cherry-ai.com/download rag部署过程 3、下载基座模型:ollamapulldeepseek-r1:7b 4、下载嵌入模型:ollamapullbge-m3:latest rag部署过程-管理ollama模型 关于ollama的安全报告 https://mp.weixin.qq.com/s/n7pylykk7mlo3re2ooyy5w o.-桑托斯 维克多 大模型微调的二种技术——lora 维克多-d.o.-桑托斯lora(low-rankadaptationoflargelanguagemodels)的核心思想是通过仅训练低秩矩阵,然后将这些参数注入到原始模型中,从而实现模型的微调,这种方法显著减少了所需的训练资源,特别适合在资源有限的环境中使用。 经过lora微调后的参数会覆盖原来基础模型的部分参数,因此模型的参数规模不会改变,但是输出已经跟专业数据对齐了 大模型微调的二种技术——lora 维克多-d.o.-桑托斯lora(low-rankadaptationoflargelanguagemodels)的核心思想是通过仅训练低秩矩阵,然后将这些参数注入到原始模型中,从而实现模型的微调,这种方法显著减少了所需的训练资源,特别适合在资源有限的环境中使用。 经过lora微调后的参数会覆盖原来基础模型的部分参数,因此模型的参数规模不会改变,但是输出已经跟专业数据对齐了 大模型微调的二种技术——backbone backbone微调就是通过设计一个专业的骨架模型,这个骨架模型可以是不同类型的深度神经网络,如mlp、cnn等,但是参数较小。 -d.o.-桑托斯将这个骨架模型装载在基础模型的输出端,在微调训练时,基础模型的参数冻结,只训练骨架模型。 这种微调的方法非常实用,不同的骨架模型完成不同的专业场景任务,推理的时候,只需要切换不同的骨架模型。就好比一个专业的摄影师通过更换不同的镜头和滤镜完成专业水平照片的拍摄。 大模型微调的二种技术——backbone backbone微调就是通过设计一个专业的骨架模型,这个骨架模型可以是不同类型的深度神经网络,如mlp、cnn等,但是参数较小。 -d.o.-桑托斯将这个骨架模型装载在基础模型的输出端,在微调训练时,基础模型的参数冻结,只训练骨架模型。 这种微调的方法非常实用,不同的骨架模型完成不同的专业场景任务,推理的时候,只需要切换不同的骨架模型。就好比一个专业的摄影师通过更换不同的镜头和滤镜完成专业水平照片的拍摄。 1、llama-factory的安装部署:gitclonehttps://github.com/hiyouga/llama-factory.git 维克多-d.o.-桑托斯2、llama-factory必备项安装:pip3install--upgradepippip3installbitsandbytes>=0.39.0进入llama-factory目录中,执行pip3install-e".[torch,metrics]" 3、llama-factory的主要子目录说明 config:存放自定义模型训练脚本data:存放示例的训练数据集样本,采用json格式examples:存放示例的训练脚本,包括train_full、train_lora、train_qlora、inference(推理)、merge_lora(模型合并saves:微调模型临时存放目录models:模型合并临时存放目录 轻代码微调方法-基于llama-factory 4、训练模版制作 在examples目录下找到train_lora子目录,复制llama3_lora_sft.yaml文件的一个备份,进行修改,重新命名,比如deepseek_lora.yaml,存放到config目录中 轻代码微调方法-基于llama-factory 5、修改模板(deepseek_lora.yaml)的训练参数,根据自己的项目修改相应的参数,几个主要的参数说明如下: 联系邮箱:zhuzhaoyang@zju.edu.cn 轻代码微调方法-基于llama-factory 7、训练:执行命令llamafactory-clitraindeepseek_lora.yaml即可开始训练 6、将训练的数据集拷贝到data目录下,并修改 dataset_info.json文件,增加数据的索引 deepseek本地微调的简单应用 ai智能助教 deepseek本地微调的简单应用 ai智能助教 总有一天,我们将会用ai技术揭开推背图、梅花易数的神秘面纱也许人工智能正走在不断论证中医和周易的路上 敬请批评指正

关于尊龙凯时网址

发现报告是苏州互方得信息科技有限公司推出的专业研报平台。平台全面覆盖宏观策略、行业分析、公司研究、财报、招股书、定制报告等内容。通过前沿的技术和便捷的产品体验,为金融从业人员、投资者、市场运营等提供信息获取和整合的专业服务。

不良信息举报电话:0512-88971002   举报邮箱:cs@hufangde.com

商务合作、企业采购、机构入驻、报告发布 > 添加微信:hufangde04

联系尊龙凯时网址

联系客服

0512-88971002(工作日9:00-18:00)

hfd04@hufangde.com

中国(江苏)自由贸易试验区苏州片区苏州工业园区旺墩路269号星座商务广场1幢圆融中心33楼

微信公众号

发现报告

微信公众号

发现报告商业局

© 2018-2025 苏州互方得信息科技有限公司

||

网站地图