微信号:扫一扫 联系我们
如何评价MiniMax推出的全球首个开源大规模混合架构的推理模型MiniMax-M1,其有何技术优势?
你在健身房发生过什么有趣的事情?
Golang与Rust哪个语言会是今后的主流?
苹果为什么要给每代MacOS起个名字,真以为人们记得住分得清吗?
真实生活中的***压缩。
不是GPU太弱鸡,而是CPU用的算法实在优化的太离谱了。
要在几个压缩的可能方式里面选一个,那就要各自试着压一下看看疗效,然后 立即选择一个方式继续探索下去。
为了节省运算量当然要尽量少地在“试着压一下”阶段浪费时间,所以算法里有个“发现势头不对立即终止探索这个方向”的优化。
而GPU并不擅长算到一半重新改写控制流,它擅长的是蒙着眼睛算到底。
所以GPU用不了这种优化。
当然,在“取消所有小聪明…。