3月1日,DeepSeek官方通过支吾媒体账号公布了其线上系统的本色统计数据,称要是通盘tokens一齐按照DeepSeek R1的订价蓄意,表面上老本利润率为545%。
DeepSeek官方公布,DeepSeek V3和R1的通盘就业均使用H800GPU,使用和磨练一致的精度,即矩阵蓄意和dispatch传输给与和磨练一致的FP8秩序,core-attention蓄意和combine传输给与和磨练一致的BF16,最猛进度保证了就业成果。
另外,由于白日的就业负荷高,晚上的就业负荷低,因此DeepSeek终说明一套机制,在白日负荷高的期间,用通盘节点部署推理就业。晚上负荷低的期间,减少推理节点,以用来作念连接和磨练。在最近的24小时里(北京时分2025/02/2712:00至2025/02/2812:00),DeepSeek V3和R1推理就业占用节点总和,峰值占用为278个节点,平均占用226.75个节点(每个节点为8个H800GPU)。假设GPU租出老本为2好意思金/小时,总老本为$87,072/天。
在24小时统计时段内,DeepSeek V3和R1:
输入token总额为608B,其中342B tokens(56.3%)射中KVCache硬盘缓存。
输出token总额为168B。平均输出速度为20~22tps,平均每输出一个token的KVCache长度是4989。
平均每台H800的浑沌量为:关于prefill任务,输入浑沌约73.7k tokens/s(含缓存射中);关于decode任务,输出浑沌约14.8k tokens/s。
以上统计包括了网页、APP和API的通盘负载。要是通盘tokens一齐按照DeepSeek R1的订价蓄意,表面上一天的总收入为$562,027,老本利润率545%。
DeepSeek官方默示,本色上莫得这样多收入,因为V3的订价更低,同期收费就业只占了一部分,另外夜间还会有扣头。
本文系不雅察者网独家稿件买球下单平台,未经授权,不得转载。