Please wait a minute...
J4  2008, Vol. 42 Issue (9): 1611-1615    
论文     
基于FPGA的实时双精度浮点矩阵乘法器设计
1. 浙江大学 数字技术及仪器研究所,浙江 杭州 3100272. 通用电气中国研发中心,上海 201203
 全文: PDF 
摘要:

设计了一个并行结构双精度浮点矩阵乘法器以提高矩阵乘法的计算性能,并在Xilinx Virtex-4 SX55 现场可编程门阵列(FPGA)上完成了方案的实现.乘法器中的处理单元采用阵列结构,在单个FPGA芯片中可集成25个处理单元,峰值计算性能达到3 000 MFLOPS.针对工程实际中大量存在的包含稀疏矩阵的乘法问题,增加了预处理模块以避免零元素块参与计算,从而缩短了计算时间.通过对不同维数的稠密矩阵乘法以及稀疏矩阵乘法实验结果的分析,证实了本设计达到了较高的计算性能.

关键词: 矩阵乘法现场可编程门阵列双精度浮点矩阵并行结构稀疏矩阵    
出版日期: 2008-09-02
基金资助:

美国通用电气公司中国研发中心资助项目.

通讯作者: 陈耀武,男,教授,博导.E-mail: cyw@mail.bme.zju.edu.cn   
作者简介: 田翔(1979-),男,安徽蚌埠人,博士生,从事基于FPGA的高性能实时计算技术研究.
服务  
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章  
田翔
周凡
陈耀武
刘莉
陈耀

引用本文:

田翔 周凡 陈耀武 刘莉 陈耀. 基于FPGA的实时双精度浮点矩阵乘法器设计[J]. J4, 2008, 42(9): 1611-1615.

TIAN Xiang, ZHOU Fan, CHEN Yao-Wu, LIU Chi, CHEN Yao. . J4, 2008, 42(9): 1611-1615.

链接本文:

http://www.zjujournals.com/xueshu/eng/CN/        http://www.zjujournals.com/xueshu/eng/CN/Y2008/V42/I9/1611

[1] 周佳立, 陈以军, 武敏. 基于FPGA监听的图像采集与预处理方法[J]. 浙江大学学报(工学版), 2018, 52(2): 398-405.
[2] 叶学松,陆玲,蔡秀军,张宏,李赞,程李成. 基于FPGA和CMOS传感器的三维高清实时视频系统[J]. 浙江大学学报(工学版), 2015, 49(1): 47-53.
[3] 王跃,杨昆,杨华,陈国柱. 通用SPWM发生器的实现及脉冲竞争消除新方法[J]. 浙江大学学报(工学版), 2014, 48(6): 2-.
[4] 王一木, 潘赟, 龙彦辰, 严晓浪, 宦若虹. 基于自组织映射的手写数字识别的并行实现[J]. 浙江大学学报(工学版), 2014, 48(4): 742-747.
[5] 王跃,杨昆,杨华,陈国柱. 通用SPWM发生器的实现及脉冲竞争消除新方法[J]. 浙江大学学报(工学版), 2014, 48(11): 2087-2093.
[6] 徐彦泓 朱云芳 杜歆 刘济林. 非参数化立体匹配算法的FPGA实现[J]. J4, 2009, 43(2): 250-254.
[7] 赵备, 余锋, 胡璇, 等. 基于FPGA的光纤通道协议引擎的设计与实现[J]. J4, 2009, 43(09): 1604-1608.
[8] 曲亮 史治国 顾宇杰 陈抗生. 易于硬件实现的OFDM系统采样频率同步算法[J]. J4, 2007, 41(6): 935-940.
[9] 徐新民 吴晓波 严晓浪. 现场可编程门阵列动态重构下的低功耗研究[J]. J4, 2007, 41(2): 193-197.
[10] 严晓浪 季爱明 沈海斌. 性能优化的现场可编程门阵列快速编译方法[J]. J4, 2005, 39(10): 1481-1484.