浪潮信息元脑R1推理服务器，让大模型运行更高效

云淡风轻 • 2025-03-23 12:59 • 环保 • 阅读 4

浪潮信息近期推出的元脑R1推理服务器，阐述了其在搭载自研NVMe SSD后，对DeepSeek R1 671B模型部署的优化，还介绍了不同型号服务器的特点以及浪潮信息元脑SSD的优势。

在科技不断发展的当下，近期浪潮信息有了新的动作。该公司正式推出了元脑R1推理服务器。这一服务器搭载了自研的NVMe SSD，通过一系列系统创新以及软硬协同优化，有着出色的表现。在单机的情况下，它就能够部署运行DeepSeek R1 671B模型。这一能力意义重大，显著降低了DeepSeek R1全参数模型的部署难度以及成本，同时还提升了推理服务性能。要知道，DeepSeek R1 671B模型作为全参数基础大模型，相较于蒸馏模型，具备更强的泛化能力、更高的准确性以及更好的上下文理解能力。

元脑R1推理服务器有不同的型号，其中NF5688G7是领先的高算效AI计算平台。它原生搭载了FP8计算引擎，在针对DeepSeek R1 671B模型进行部署时，速度快且不会出现精度损失的情况。该服务器提供了1128GB HBM3e高速显存，显存带宽高达4.8TB/s，GPU P2P带宽达900GB/s。同时，它搭载的自研NVMe SSD，读写速度分别达到7400/6200MB/s。此外，还配备了3200Gbps无损扩展网络，并且提供成熟的R1服务器Turnkey解决方案。

而元脑R1推理服务器NF5868G8则是专为大推理模型设计的高吞吐推理服务器。单机支持16张标准PCIe双宽卡，能够提供高达1536GB显存容量。通过软硬协同优化，它可将DeepSeek 671B模型推理性能提升近40%。

浪潮信息的元脑SSD也起到了关键作用。它能够提供足够的存储空间以及快速的读写能力，确保参数可以高效访问，进而提升模型稳定运行速度。其中，NS6500/6600G2 NVMe SSD集成了3D eTLC NAND闪存，顺序读写速度达到7400/6200MB/s，全面支撑NF5688G7推理服务器高效运行。

本文介绍了浪潮信息推出的元脑R1推理服务器，包括其通过创新和优化降低DeepSeek R1 671B模型部署难度与成本、提升推理性能，还阐述了不同型号服务器特点以及元脑SSD的优势，展示了浪潮信息在服务器领域的技术实力和创新成果。

原创文章，作者：云淡风轻，如若转载，请注明出处：https://www.kqbond.com/archives/3507.html