Loading...
机构名称:
¥ 1.0

摘要:随着信息数据的爆炸性增长,数据存储系统已进入云存储时代。尽管云存储系统的核心是在解决质量数据存储问题时分布式文件系统,但在所有存储系统中都存在大量重复数据。文件系统旨在控制文件的存储和检索方式。更少的研究重点关注云文件系统在应用级别上重复数据删除技术,尤其是对于Hadoop分布式文件系统。在本文中,我们在Hadoop分布式文件系统上为云应用程序开发人员设计了一个文件重复数据删除框架。建议的RFD-HDF和FD-HDFS两个数据删除解决方案在线处理数据重复数据删除,从而改善了存储空间利用率并降低了冗余。在论文的末尾,我们在RFD-HDFS和FD-HDF上测试磁盘利用率和文件上传性能,并将HDFS与两个系统框架的磁盘利用进行比较。结果表明,两系系统框架不仅实现了数据重复数据删除功能,还有效地降低了重复文件的磁盘利用率。因此,提出的框架确实可以通过消除冗余HDFS文件来减少存储空间。

云存储的数据重复数据删除技术

云存储的数据重复数据删除技术PDF文件第1页

云存储的数据重复数据删除技术PDF文件第2页

云存储的数据重复数据删除技术PDF文件第3页

云存储的数据重复数据删除技术PDF文件第4页

云存储的数据重复数据删除技术PDF文件第5页

相关文件推荐