瀏覽單個文章
polor
Power Member
 

加入日期: May 2001
您的住址: 台北
文章: 548
2025-02-27 DeepSeek開源第三天 輝達出手優化DeepSeek-R1 B200性能飆升25倍

根據報導,DeepSeek-R1 的本地化部署已經引起廣泛關注,輝達也親自下場,
開源了基於 Blackwell 架構的優化方案——DeepSeek-R1-FP4。
這一新模型在推理吞吐量上達到了高達 21,088 token 每秒,與 H100 的 844 token 每秒相比,提升幅度高達 25 倍。
同時,每 token 的成本也實現了 20 倍的降低

 
__________________

舊 2025-02-28, 01:44 PM #12
回應時引用此文章
polor離線中