瀏覽單個文章
muder
Regular Member
 
muder的大頭照
 

加入日期: Jan 2008
文章: 95
引用:
作者野口隆史
現在有一種新的推理晶片
把 LLM 硬編碼在晶片內
成本跟功耗比 B200 更低,性能還高出十倍
而且還不用 HBM
https://taalas.com/the-path-to-ubiquitous-ai/



看了一下,只能跑Llama 3.1 8B這隻上古神獸
舊 2026-02-22, 12:20 AM #298
回應時引用此文章
muder離線中