DeepSeek的成本辨误
· 阅读需 2 分钟
DeepSeek被封神已毋庸置疑,但各路营销号们似乎混淆了一些东西…
比如,训练成本557.6万刀,此数字出自V3的技术报告,应该指的是V3模型,并不是爆火的那个R1模型(也就是自带长思维链的那个推理模型),并且是按照租卡方式折算出来的(跟自己购卡成本不同),也只是正 式在卡上跑的成本(不包含前期很多投入)…
请注意:这已经非常了不起了,相信大部分公司就算拿到了所有数据,在1000万刀以内恐怕也做不出来DS同样的效果…
DS在这波里已经很神了,尤其是给伙伴们证实了一条可以走得通的新路径,也就是即便在算力受限的情况下,通过打磨算法和数据,也能做出来非常好的东西。
DS,YYDS~