4RINwYVKt4v tech.huanqiu.comarticleDeepSeek-V4正式发布 华为云实现首发适配/e3pmh164r/e3pn4gh77【环球网科技报道 记者 张阳】4月24日,DeepSeek-V4模型正式发布并开源,华为云率先完成适配上线。该模型具备百万Token级超长上下文,在智能体能力、世界知识覆盖及推理性能方面均达到国内及开源领域的领先水平。其中,DeepSeek-V4-Flash版本参数量降至284B,进一步降低了推理成本。该版本以更小的模型参数与激活参数,提供更高效、经济的API服务,推动百万级上下文能力的普惠应用。目前,华为云MaaS(模型即服务)平台已面向开发者提供免部署、一键调用DeepSeek-V4-Flash API的Token服务。 在此次模型适配过程中,华为云从系统层、算子层到集群层进行了全面协同优化,聚焦调度效率、计算效率与数据流转效率三大维度,保障新模型的快速适配与高性能落地。针对DeepSeek-V4,华为云首发适配了模型的分层注意力压缩机制,实现了对V4注意力机制下KVCache的高效分配管理。同时,平台集成了TopK、SWA、CFA等十余项昇腾高性能融合算子,结合框架异步调度与多步投机解码等优化手段,支持原生百万级长上下文的高性能推理。华为云以高效AI基础设施为核心,打造“硅基黑土地”,开放兼容自研及第三方主流大模型与众多智能体,助力企业解决业务难题、提升生产效率。据悉,金山办公、360等企业已通过华为云接入DeepSeek新模型。此外,DeepSeek-V4-Pro版本也将于近日上线。1777035353409环球网版权作品,未经书面授权,严禁转载或镜像,违者将被追究法律责任。责编:石婷婷环球网17770353534091[]//img.huanqiucdn.cn/dp/api/files/imageDir/e486fdf1ea04711e2667726cb7494c38u1.png{"email":"shitingting@huanqiu.com","name":"石婷婷"}
【环球网科技报道 记者 张阳】4月24日,DeepSeek-V4模型正式发布并开源,华为云率先完成适配上线。该模型具备百万Token级超长上下文,在智能体能力、世界知识覆盖及推理性能方面均达到国内及开源领域的领先水平。其中,DeepSeek-V4-Flash版本参数量降至284B,进一步降低了推理成本。该版本以更小的模型参数与激活参数,提供更高效、经济的API服务,推动百万级上下文能力的普惠应用。目前,华为云MaaS(模型即服务)平台已面向开发者提供免部署、一键调用DeepSeek-V4-Flash API的Token服务。 在此次模型适配过程中,华为云从系统层、算子层到集群层进行了全面协同优化,聚焦调度效率、计算效率与数据流转效率三大维度,保障新模型的快速适配与高性能落地。针对DeepSeek-V4,华为云首发适配了模型的分层注意力压缩机制,实现了对V4注意力机制下KVCache的高效分配管理。同时,平台集成了TopK、SWA、CFA等十余项昇腾高性能融合算子,结合框架异步调度与多步投机解码等优化手段,支持原生百万级长上下文的高性能推理。华为云以高效AI基础设施为核心,打造“硅基黑土地”,开放兼容自研及第三方主流大模型与众多智能体,助力企业解决业务难题、提升生产效率。据悉,金山办公、360等企业已通过华为云接入DeepSeek新模型。此外,DeepSeek-V4-Pro版本也将于近日上线。