j9九游会 - 真人游戏第一品牌(中国)j9九游会

真人游戏第一品牌公司动态行业新闻技术知识解决方案锂电行业汽车与零部件行业平板显示行业 3C电子行业烟草行业电商物流行业家电行业食品饮料行业家居行业医药行业鞋服行业石油化工行业其他行业产品中心移动机器人新能源专用移动机器人潜伏牵引式移动机器人潜伏举升式移动机器人背负移载式移动机器人搬运式智能叉车机器人 CCM-定制系列 CCS-充电站系列软件产品智能控制系统智能仓储管理系统 AI算法服务支持品质服务服务内容关于j9九游会公司简介资质荣誉联系我们加入我们合作夥伴 j9九游会 - 真人游戏第一品牌

公司动态行业新闻技术知识

九游会j9官方网站|迪乐馆棋牌|计算机｜DeepSeek V3发布加速AI应用落

发布时间：2025/02/23

来源：j9九游会 - 真人游戏第一品牌

　　近日★ღ，DeepSeek-V3的正式发版引起AI业内广泛高度关注迪乐馆棋牌★ღ，其在保证了模型能力的前提下★ღ，训练效率和推理速度大幅提升★ღ。我们认为★ღ，DeepSeek新一代模型的发布意味着AI大模型的应用将逐步走向普惠★ღ，助力AI应用广泛落地★ღ；同时训练效率大幅提升★ღ，亦将助力推理算力需求高增★ღ。我们持续看好AI产业链的加速落地机遇★ღ，建议重点关注AI应用★ღ、AI Infra★ღ、AI算力三大主线★ღ。

　　12月26日★ღ，DeepSeek-V3（深度求索）首个版本正式发布并同步开源★ღ，已在网页端和API全面上线★ღ。其在训练效率和推理速度上相较历史模型有了大幅提升★ღ，同时可保证领先的模型能力表现★ღ，引起业内高度关注★ღ。

　　参考官方论文★ღ，DeepSeek v3为6710亿参数MoE架构模型★ღ，激活37B★ღ，在14.8T token上进行了预训练★ღ。能力上★ღ，模型暂不支持多模态输入★ღ，但在通识和专业知识测试集上表现优秀★ღ，MMLU pro正确率75.9%九游会j9官方网站★ღ，GPQA-Diamond正确率59.1%★ღ，达到国内第一梯队★ღ，接近Claude 3.5 Sonnet的水平★ღ；并且在数学和代码领域测试表现突出★ღ，MATH 500正确率90.2%★ღ，SWE-bench正确率42.0%★ღ，Codeforces得分51.6★ღ，超越所有非o系列模型★ღ。模型生成速度达到60TPS★ღ，是前代模型的三倍★ღ。定价上★ღ，API定价为输入每百万tokens 0.5元（缓存命中）/2元（缓存未命中）★ღ，输出每百万tokens 8元★ღ，与字节Doubao-pro-256k定价输入每百万tokens 5元★ღ，输出每百万tokens 9元的水平相当★ღ，在国产模型中性价比较高★ღ。

　　豆包pro★ღ、DeepSeek v3等国产模型连续发布★ღ。模型能力上★ღ，国产模型在文本和知识能力上接近GPT-4★ღ、Claude★ღ、Llama等海外前沿模型水平★ღ，多模态能力逐步完备★ღ，逻辑和代码能力在非o1技术路线下达到可用水平★ღ。价格上★ღ，国产模型API百万tokens输出普遍定价10元以内★ღ，是GPT-4o的1/3甚至更低★ღ。我们预计模型性价比持续提升下★ღ，国内AI应用依托丰富生态和成熟流量加速各领域落地★ღ。其中★ღ，Agent模式有望以更长的任务流程★ღ、更好的场景理解★ღ、更高的自主能力★ღ，成为所有互联网用户的数字助手★ღ，在企业管理★ღ、教育★ღ、办公★ღ、金融等领域展现应用价值★ღ。

　　1）训练效率大幅提升★ღ，GPT4的训练成本约为DeepSeek V3的6.2倍★ღ。根据DeepSeek V3的官方技术文档★ღ，本次DeepSeek的训练仅使用了2048个H800 GPU★ღ，总训练GPU卡时为2788千小时（其中预训练为2664千小时）★ღ，平均到每个GPU上迪乐馆棋牌★ღ，仅为1361小时★ღ，约合56.7天★ღ。与之相对比★ღ，根据英伟达CEO黄仁勋在GTC2024上的演讲内容★ღ，GPT-4 MoE使用8000个H100训练了90天★ღ，合计约为17280千卡时★ღ，相当于DeepSeek V3的6.2倍★ღ。

　　2）训练效率提升归因★ღ：我们认为DeepSeek V3训练提效的原因主要包括低精度计算★ღ、小参数量★ღ、高质量数据等方面★ღ。精度方面迪乐馆棋牌★ღ，根据英伟达官方文档★ღ，其GPU的8位精度算力通常是16位精度算力的2倍★ღ，因此数据精度从FP16降低到FP8可以贡献一倍效率提升九游会j9官方网站★ღ。参数方面★ღ，GPT-4 MoE模型总参数量达到1800B★ღ，而按照DeepSeek V3官方文档★ღ，其总参数量只有671B★ღ，约为GPT-4 MoE的1/3★ღ，同时★ღ，DeepSeek的激活参数大约为37B★ღ，而GPT4-MoE每次推理激活的参数量约为280B★ღ，二者约为7.57倍关系★ღ；数据方面★ღ，GPT-4 MoE使用了13万亿（1300B）token迪乐馆棋牌★ღ，而DeepSeek V3使用的token数量约为14.8万亿（1480B）★ღ，数据量相差不大★ღ，但DeepSeek V3技术文档提及了使用模型生成训练数据等★ღ，因此我们认为数据质量或有较大幅度提升★ღ。此外★ღ，采用负载均衡★ღ、更好的流水线策略亦是其官方提及的提升训练效率的重要原因★ღ。

　　3）从推理侧助推AI普惠★ღ，带动推理算力需求倍增★ღ，打开更广阔算力市场空间★ღ。我们认为★ღ，DeepSeek模型相比GPT4模型更小的参数量也意味着更低的推理成本★ღ，推理成本的降低★ღ，将是AI应用普及的前奏★ღ，正如4G提速降费给我国移动互联网产业提供了助力★ღ。当前AI应用渗透率仍然较低★ღ，产业仍在早期★ღ，根据我们在2024年12月13日外发的报告《计算机行业“智能网联”系列报告54—算力需求测算★ღ：Agent+Sora》★ღ，随着Agent成为流量入口★ღ，渗透率达到30%左右★ღ，全球Agent的推理token数量将增长3个数量级以上★ღ，且视频生成与实时视频理解等形态的AI同样有望带来巨量需求增长★ღ，并且根据我们对视频生成模型的测算★ღ，视频推理算力需求将有望达到训练算力需求的2-3个数量级以上九游会j9官方网站★ღ。算力需求的指数级提升与模型训练推理成本的下降将构成产业飞轮★ღ，带动全产业链扩张★ღ，随着AI进一步普及到日常生活与产业当中九游会j9官方网站★ღ，我们认为推理算力需求将仍然驱动AI算力产业链持续增长★ღ。

　　AI核心技术发展不及预期★ღ，AI被不当使用造成严重社会影响★ღ，企业数据安全风险★ღ，信息安全风险★ღ，行业竞争加剧★ღ。

　　▍投资策略★ღ：建议关注AI全产业相关投资机会★ღ，综合梳理以下投资主线）AI 应用★ღ：伴随模型能力升级九游会j9官方网站★ღ，Agent等应用形式有望加速落地★ღ，带动办公迪乐馆棋牌★ღ、教育★ღ、管理★ღ、端侧★ღ、具身智能等应用领域公司加速兑现业绩弹性★ღ。九游会j9官方网站j9九游会 - 真人游戏第一品牌★ღ。人工智能自动化流程★ღ。J9九游★ღ。j9九游会官方网站★ღ，AI应用★ღ，

上一个 : 九游会官网登录首页麻省理工推出免费AI学习平台：1000万人已在使用的儿童教育新下一个 : 九游老哥俱乐部官方网站善用人工智能|碧玺论坛|护航“数字出海” 返回真人游戏第一品牌