部署一个 DeepSeek-R1-0528-FP4 模型推理服务
DeepSeek
A800x8
FP4
文本生成
以 FP4 精度在 8 张 A800 上部署一个模型推理服务,相比于 FP16 精度,具备更高吞吐与更快响应,适用于高并发文本生成与问答场景
预估¥51.12 /小时
一键部署
README
首充活动