降低分布式训练通信的梯度稀疏压缩方法 |
|||||||||||||||||||||||||||||
陈世达,刘强,韩亮 | |||||||||||||||||||||||||||||
Gradient sparsification compression approach to reducing communication in distributed training |
|||||||||||||||||||||||||||||
Shi-da CHEN,Qiang LIU,Liang HAN | |||||||||||||||||||||||||||||
表 3 不同策略下模型达到相同精度的计算加速比 | |||||||||||||||||||||||||||||
Tab.3 Speedup of computation time for models with same accuracy under different strategies | |||||||||||||||||||||||||||||
|
|||||||||||||||||||||||||||||