数据去重与缩减技术的系统分类与性能分析
奎晓燕,张敏,肖伶,李钦松,陈立明,张文生,邹北骥

Systematic classification and performance analysis of data deduplication and reduction techniques
Xiaoyan KUI,Min ZHANG,Ling XIAO,Qinsong LI,Liming CHEN,Wensheng ZHANG,Beiji ZOU
表 6 基于系统开销的方案比较
Tab.6 Comparison of schemes based on system overhead
方案关键点优点缺点
HDS[67]
减少随机访问与并发元数据开销,降低碎片化,提升主存储性能减少元数据开销,提升存储效率,优化I/O性能去重覆盖有限,复杂性高,缓存管理难,扩展受限
FADD[68]利用文件的语义信息(如文件类型和大小)指导数据去重过程针对性强, 减少系统开销, 提升存储性能, 灵活性高初始投入成本及实现复杂度高, 存在安全性问题和隐私问题
BEDD[69]提出小规模平衡化边缘数据去重问题优化解法及大规模次优方案延迟约束下综合优化去重率、存储效益与资源平衡计算开销主要由云服务商承担
CA-Dedupe[70]按写请求内容分类,仅在特定类别中执行去重搜索减少写延迟及内存消耗, 节省存储空间软件复杂性增加, 性能依赖于文件类型