DeepSeek-V4正式发布华为云实现首发适配

7003383

7005136

7005137

<article><section data-type="rtext"><p>【环球网科技报道 记者 张阳】4月24日，DeepSeek-V4模型正式发布并开源，华为云率先完成适配上线。该模型具备百万Token级超长上下文，在智能体能力、世界知识覆盖及推理性能方面均达到国内及开源领域的领先水平。</p><p><i class="pic-con"><img data-alt="" src="//img.huanqiucdn.cn/dp/api/files/imageDir/e486fdf1ea04711e2667726cb7494c38u1.png?imageView2/2/w/1260" /></i></p><p>其中，DeepSeek-V4-Flash版本参数量降至284B，进一步降低了推理成本。该版本以更小的模型参数与激活参数，提供更高效、经济的API服务，推动百万级上下文能力的普惠应用。目前，华为云MaaS（模型即服务）平台已面向开发者提供免部署、一键调用DeepSeek-V4-Flash API的Token服务。</p>
              <adv-loader __attr__inner="7004636" __attr__style="width: auto;position: relative;float: left;border: 1px solid #ebebeb; padding: 20px;overflow: hidden;margin: 10px 30px 40px 0;"></adv-loader>
            <p>在此次模型适配过程中，华为云从系统层、算子层到集群层进行了全面协同优化，聚焦调度效率、计算效率与数据流转效率三大维度，保障新模型的快速适配与高性能落地。</p><p>针对DeepSeek-V4，华为云首发适配了模型的分层注意力压缩机制，实现了对V4注意力机制下KVCache的高效分配管理。同时，平台集成了TopK、SWA、CFA等十余项昇腾高性能融合算子，结合框架异步调度与多步投机解码等优化手段，支持原生百万级长上下文的高性能推理。</p><p>华为云以高效AI基础设施为核心，打造“硅基黑土地”，开放兼容自研及第三方主流大模型与众多智能体，助力企业解决业务难题、提升生产效率。</p><p>据悉，金山办公、360等企业已通过华为云接入DeepSeek新模型。此外，DeepSeek-V4-Pro版本也将于近日上线。</p></section></article>

7003385

7003386

7003387

7003388

7004638

7004639

7004637

7003389