降低分布式训练通信的梯度稀疏压缩方法

陈世达,刘强,韩亮

Gradient sparsification compression approach to reducing communication in distributed training

Shi-da CHEN,Qiang LIU,Liang HAN

表 3 不同策略下模型达到相同精度的计算加速比

Tab.3 Speedup of computation time for models with same accuracy under different strategies