如何提高磁盘空间利用率
——磁盘重复数据删除技术
文件服务器的维护过程中,经常会出现很多重复的数据,造成占用大量的空间,影响了磁盘利用率。当然利用NTFS分区的压缩特性,也是可以提升磁盘利用率。
可是重复性的数据依然存在,那么如何既压缩又能删除重复性数据呢?
这是本文所要讲述的技术:重复数据删除技术
一、技术信息
1.1 理论图示:
在图中A、B、C、D标示的是重复数据,E、F、H、I标示的是唯一性数据。重复数据检测机制会检索存储设备上的数据,他会把数据分为两个类型:唯一性数据域重复性数据。重复性数据是一些提供了共同属性的数据;重复性数据删除操作将会在一些任务中触发执行,比如计划任务,会以周期性的方式更新磁盘数据状态。
注意点:
重复数据删除技术,无法运行在Windows的引导分区与系统启动分区(C盘)。
1.2 重复删除数据技术的启用前提
序号 | 主题 | 内容 | 状态 |
1 | 启用重复数据删除技术前提 | 支持启用磁盘卷服务 | 支持 |
2 | 仅在Windows Server 2012操作系统的支持;暂不支持Windows 8客户端。 | 支持 | |
3 | 仅支持使用NTFS文件格式的卷 | 支持 | |
4 | 支持可在后台模式下运行,和可作为计划任务运行。根据配置时在I / O上的选择差异可达2倍的效果。 | 支持 | |
5 | 不支持加密文件 | 不支持 | |
6 | 不支持由群集共享卷(CSV)结构创建的Hyper-V | 不支持 |
1.3 环境信息:
序号 | 设备 | OS 类型 | 角色 |
1 | DC | WINDOWS server 2008 R2 SP1 Enterprise | DC/DNS |
2 | FILESERVER1 | WINDOWS server 2012 Datacenter | Fileserver |
3 | FILESERVER2 | WINDOWS server 2012 Datacenter | Fileserver |
二、实施流程
2.1 组成服务器组
2.2 安装Data Deduplication 功能
2.3 远程管理安装fileserver2的文件删除服务
2.4 安装功能之后,我们需要在文件服务器上部署的文件磁盘卷上激活此功能
我们初始化一块新磁盘
2.5 初始化磁盘
磁盘格式分为两类:
GPT:最大卷为 18 EB (exabytes) 并且每磁盘最多有 128 个分区
MBR:支持最大卷为 2 TB (terabytes) 并且每个磁盘最多有 4 个主分区(或 3 个主分区,1 个扩展分区和无限制的逻辑驱动器)
默认使用服务器管理GUI配置初始化磁盘时,只能转换为GPT,如果想转换为MBR,那么需要使用磁盘管理器初始化磁盘。
这边我们转换为GPT磁盘
转换完成后,新建卷
选择初始化的新磁盘
2.6 选择磁盘容量
有三种磁盘单位可供选择
2.7 分配磁盘盘符
2.8 选择分区类型
这里有两种选择:NTFS/reFS
ReFS(windows server 2012与windows 8支持)特性:
1带有校验和的元数据完整性
2提供可选用户数据完整性的完整性流。
3通过写入时分配事务模型实现可靠的磁盘更新(也称为写入时复制)
4支持超大规模的卷、文件和目录
5存储池和虚拟化使得文件系统可建立并易于管理
6通过数据条带化提高性能(带宽可管理)并通过备份提高容错性
7通过磁盘扫描防止潜在的磁盘错误
8借助“数据打捞”实现损坏还原,以便在任何情况下尽可能提高卷的可用性
9跨计算机共享存储池,以提供额外的容错性和负载平衡
在这里一定要选择NTFS,否则无法启用重复数据删除功能
在配置界面,可以设置删除间隔/排除文件扩展名/
2.9 设置删除重复计划
2.10 配置完成后,显示详情
配置删除数据功能完成
查看现在详情,因为没有数据所以都是0%
Ok,到这边我们就完成了新建磁盘的重复数据删除的配置。
那么如果我们已经在使用的磁盘是否也可以使用这个特性呢/
答案是:可以的
我们可以测试数据重复删除的磁盘对比:
已存在的文件:
启用前评估的效果
启用前空间显示
启用重复数据删除进程(如果要立即删除重复数据,就要把数据保留时间设为0)
查看重复数据删除效果:
已经节省了近1G的空间
查看数据节省率
查看重复数据删除的文件检索数量:
文件总数为3
实际文件特征为1
查看重复数据删除卷F的详情,可以看到数据最小保存时间为0
启用重复数据删除后的磁盘状态:
Ok,到这边就重复数据删除技术在文件服务器上面是有一定价值的,他可以有效的节省磁盘空间,而且也可以自定义排除不想被重复删除的文件夹或者文件后缀名;并且可以计划何时开始执行重复数据删除操作与何时删除这些重复数据,但是有一个事情是我们不能忽略的:那就是如果重复数据删除功能意外删除了重要文件,那怎么办?中午就要求在服务器上做好磁盘备份,那样如果意外删除文件的话,可以从磁盘备份文件中提取出来。