昨天發(fā)現(xiàn)公司的文件服務(wù)器(windows 2019 )上的磁盤(pán)空間快滿了,2T的空間只有200多G了,于是刪除了2020年12月31日前的所有文件,發(fā)現(xiàn)剩余空間居然一點(diǎn)都沒(méi)改變?。?/p> 這個(gè)問(wèn)題我曾在一個(gè)客戶那邊也出現(xiàn)過(guò),客戶使用的是存儲(chǔ),我理所當(dāng)然的就把問(wèn)題歸咎于存儲(chǔ)設(shè)備了,并要求客戶找存儲(chǔ)廠商解決,我也就沒(méi)再跟進(jìn)此事。 我自己的文件服務(wù)器并沒(méi)有用存儲(chǔ),這是怎么回事呢?我用Diskginus 打開(kāi)磁盤(pán)查看,發(fā)現(xiàn)System Volume Information\Dedup\ChunkStore下占用的空間與失去的空間一致,經(jīng)研究,這是因?yàn)樵谠摯疟P(pán)上啟用了重復(fù)數(shù)據(jù)刪除功能所致。 Data Deduplication是windows 2012開(kāi)始增加的新功能,可以大大優(yōu)化存儲(chǔ)空間。不過(guò)在使用的時(shí)候需要注意,我已經(jīng)經(jīng)歷了2起因?yàn)檫@個(gè)功能引發(fā)的小問(wèn)題了。 如下所示,Datadisk1上激活了Deduplication的功能,硬盤(pán)本身1.9T,但是實(shí)際保存了近乎3.5T的內(nèi)容,節(jié)省空間45%以上。 需要注意的是,這個(gè)功能激活以后,存儲(chǔ)文件的方式就和windows 2008 以前的方式不太一樣了。每個(gè)文件把自己的內(nèi)容分成了2個(gè)部分,自己所獨(dú)有的,以及和其他文件相同的部分。每個(gè)文件自己僅僅保留獨(dú)有的部分,比如名稱,屬性,創(chuàng)建時(shí)間等等,這些東西我們一般稱為metadata,另外占據(jù)90%以上的“真正內(nèi)容”,是保存在chunk store中,也就是每個(gè)磁盤(pán)對(duì)應(yīng)的隱藏文件夾 System Volume Information Store里面 (你如果打開(kāi)VSS,快照也是保存在這里面) 比如說(shuō),查看一下其中一個(gè)文件的屬性就可以看見(jiàn),該文件的Size,也就是邏輯大小應(yīng)該是21.6G,但是Size On Disk只有258K,這個(gè)其實(shí)僅僅是他的metadata的內(nèi)容。如果我刪掉這個(gè)文件夾,那么他僅僅會(huì)清空258K的文件??!我們還需要執(zhí)行一個(gè)Garbae collection(垃圾回收)的操作,才能將該文件關(guān)聯(lián)的內(nèi)容從Chunk Store中刪除。這就是為什么我最初刪除了不用的文件,但是我的剩余空間并沒(méi)有增加,因?yàn)槲也](méi)有刪除對(duì)應(yīng)的Chunk Data。 知道了工作原理,那么我們來(lái)看看如何刪除? 首先看看當(dāng)前的狀態(tài),這個(gè)可以通過(guò)GUI查看,也可以通過(guò)命令行,不過(guò)命令行可以獲取更多的信息,比如看看上一次的優(yōu)化,垃圾回收,和自我修復(fù)是什么時(shí)候執(zhí)行的?該磁盤(pán)總共多少個(gè)文件,有多少個(gè)已經(jīng)優(yōu)化了?這些具體的數(shù)據(jù)GUI里面都看不見(jiàn)的,所以Powershell的相關(guān)命令真的很重要。 也可以查看一下默認(rèn)的schedule task是什么時(shí)候,可以跟上一個(gè)結(jié)果進(jìn)行對(duì)比 這個(gè)計(jì)劃任務(wù)也可以通過(guò)GUI查看 當(dāng)我刪除了一個(gè)文件以后,為了釋放空間,我可以更改GarbeCollection schedule task的時(shí)間讓他執(zhí)行,也可以輸入以下命令強(qiáng)制立刻執(zhí)行磁盤(pán)清理 Start-DedupJob -Volume D: -Type GarbageCollection -full 總之,Data Deduplication是個(gè)很好的功能,他在windows傳統(tǒng)的文件壓縮功能上更進(jìn)了一步,和VSS類似,是直接執(zhí)行在Volume磁盤(pán)上,激活了Dedup的磁盤(pán)不能和文件壓縮功能混用。 |
|