设计了一个并行结构双精度浮点矩阵乘法器以提高矩阵乘法的计算性能,并在Xilinx Virtex-4 SX55 现场可编程门阵列(FPGA)上完成了方案的实现.乘法器中的处理单元采用阵列结构,在单个FPGA芯片中可集成25个处理单元,峰值计算性能达到3 000 MFLOPS.针对工程实际中大量存在的包含稀疏矩阵的乘法问题,增加了预处理模块以避免零元素块参与计算,从而缩短了计算时间.通过对不同维数的稠密矩阵乘法以及稀疏矩阵乘法实验结果的分析,证实了本设计达到了较高的计算性能.
美国通用电气公司中国研发中心资助项目.
田翔 周凡 陈耀武 刘莉 陈耀. 基于FPGA的实时双精度浮点矩阵乘法器设计[J]. J4, 2008, 42(9): 1611-1615.
TIAN Xiang, ZHOU Fan, CHEN Yao-Wu, LIU Chi, CHEN Yao. . J4, 2008, 42(9): 1611-1615.
http://www.zjujournals.com/xueshu/eng/CN/ 或 http://www.zjujournals.com/xueshu/eng/CN/Y2008/V42/I9/1611
Cited