大点数FFT在“申威26010”上的并行优化
郭俊,刘鹏,杨昕遥,张鲁飞,吴东

Parallel optimization of large-point FFT on Sunway 26010
Jun GUO,Peng LIU,Xinyao YANG,Lufei ZHANG,Dong WU
表 2 并行FFT的加速测试结果
Tab.2 Accelerated test results of parallel FFT
数据量 CS CP SP
32 768 8 063 390 589 862 13.67
65 536 32 225 901 1 004 552 32.08
131 072 83 236 162 1 930 484 43.12
262 144 190 366 763 3 690 079 51.59
524 288 418 159 392 7 138 959 58.57
1 048 576 855 418 759 13 790 789 62.03
2 097 152 1 801 385 481 27 709 105 65.01
4 194 304 3 717 210 028 63 708 120 58.35