大点数FFT在“申威26010”上的并行优化
|
郭俊,刘鹏,杨昕遥,张鲁飞,吴东
|
Parallel optimization of large-point FFT on Sunway 26010
|
Jun GUO,Peng LIU,Xinyao YANG,Lufei ZHANG,Dong WU
|
|
表 2 并行FFT的加速测试结果 |
Tab.2 Accelerated test results of parallel FFT |
|
数据量 | CS | CP | SP | 32 768 | 8 063 390 | 589 862 | 13.67 | 65 536 | 32 225 901 | 1 004 552 | 32.08 | 131 072 | 83 236 162 | 1 930 484 | 43.12 | 262 144 | 190 366 763 | 3 690 079 | 51.59 | 524 288 | 418 159 392 | 7 138 959 | 58.57 | 1 048 576 | 855 418 759 | 13 790 789 | 62.03 | 2 097 152 | 1 801 385 481 | 27 709 105 | 65.01 | 4 194 304 | 3 717 210 028 | 63 708 120 | 58.35 |
|
|
|