大点数FFT在“申威26010”上的并行优化
|
|
郭俊,刘鹏,杨昕遥,张鲁飞,吴东
|
Parallel optimization of large-point FFT on Sunway 26010
|
|
Jun GUO,Peng LIU,Xinyao YANG,Lufei ZHANG,Dong WU
|
|
| 表 2 并行FFT的加速测试结果 |
| Tab.2 Accelerated test results of parallel FFT |
|
| 数据量 | CS | CP | SP | | 32 768 | 8 063 390 | 589 862 | 13.67 | | 65 536 | 32 225 901 | 1 004 552 | 32.08 | | 131 072 | 83 236 162 | 1 930 484 | 43.12 | | 262 144 | 190 366 763 | 3 690 079 | 51.59 | | 524 288 | 418 159 392 | 7 138 959 | 58.57 | | 1 048 576 | 855 418 759 | 13 790 789 | 62.03 | | 2 097 152 | 1 801 385 481 | 27 709 105 | 65.01 | | 4 194 304 | 3 717 210 028 | 63 708 120 | 58.35 |
|
|
|