数据去重与缩减技术的系统分类与性能分析
奎晓燕,张敏,肖伶,李钦松,陈立明,张文生,邹北骥

Systematic classification and performance analysis of data deduplication and reduction techniques
Xiaoyan KUI,Min ZHANG,Ling XIAO,Qinsong LI,Liming CHEN,Wensheng ZHANG,Beiji ZOU
表 3 基于数据去重率的方案比较
Tab.3 Comparison of schemes based on deduplication rate
方案关键点优点缺点
Jingwei[50]实现高效自适应的数据去重系统迁移提高存储空间利用率,促进服务适应性较高的计算成本和复杂性,依赖数据块分析和参数调整
DLDAFE[51]双层去重提升率,兼顾性能与块效应动态分块组合降低开销,平衡性能与时间,减弱硬分块影响复杂度增加,须调参数,第二层精确删除在大数据量下成瓶颈
Light-Dedup[52]哈希比对结合,优化I/O实现快速块去重提升I/O性能并节省存储开销,提高数据去重效率内存使用依赖服务器环境,伴随额外索引开销
FSDedup[53]纠错码辅助去重,指纹识别相似数据,消除高引用冗余减少相似比较读取开销,消除更多冗余数据依赖工作负载局部性,伴随额外计算开销
imDedup[54]I/O路径去重提升云主存储系统性能降低延迟影响,灵活阈值设置,优化内存缓存使用动态缓存调整复杂,依赖工作负载特性