降低分布式训练通信的梯度稀疏压缩方法 |
|||||||||||||||||||||||||||||
| 陈世达,刘强,韩亮 | |||||||||||||||||||||||||||||
|
Gradient sparsification compression approach to reducing communication in distributed training |
|||||||||||||||||||||||||||||
| Shi-da CHEN,Qiang LIU,Liang HAN | |||||||||||||||||||||||||||||
| 表 3 不同策略下模型达到相同精度的计算加速比 | |||||||||||||||||||||||||||||
| Tab.3 Speedup of computation time for models with same accuracy under different strategies | |||||||||||||||||||||||||||||
|
|||||||||||||||||||||||||||||