一、核心参数特性
参数规模
总参数达 6710 亿,属于超大规模语言模型,具备接近专家级的复杂任务处理能力,尤其在数学推理、长文本理解等场景表现突出14。
支持 BF16、FP8、F32 多精度计算,优化了训练与推理效率2。
架构特性

采用 混合专家(MoE)架构,通过动态量化技术对关键层与 MoE 层差异化处理,平衡性能与资源消耗
二、部署硬件需求
根据用户提供的配置 (CPU:4鹏920;NPU:8昇腾910;显存:8*64G;存储:系统盘+数据盘),对比公开部署要求:
显存与存储
原版 671B 模型需 720GB 存储空间,但动态量化版本可压缩至 最低 131GB(1.58-bit 量化)用户配置的 NVMe 数据盘(2*3.84T)可满足存储需求。
显存总量 512GB(8*64G)可支持 FP8 或 BF16 精度部署,但需关注实际推理过程中显存分配的峰值占用7。
系统兼容性
官方推荐使用 sglang 框架部署,兼容 OpenAI API 格式7;昇腾 NPU 适配性需结合厂商提供的加速库验证(搜索结果未明确提及昇腾支持)。
三、典型应用场景
数学推理与复杂逻辑在数学基准测试集 PutnamBench 中展现断层式领先性能,支持超长思维链(CoT)合成数据驱动的推理38。
垂直领域任务通过全参数微调(代码架构包含 SFT 脚本与 RL 优化模块),可适配医疗、金融等专业场景
Deepseek 70b
CPU:4*鲲鹏920NPU:8*昇腾910显存:8*32G系统盘:2*480G SATA SSD数据盘:2*3.84TNVME内存:32*32G
这个 80W
欢迎随时联系我们