一、現(xiàn)象
hdfs刪除后,3天了還不刪除,故排查排查問題
二、排查過程及原理
Trash機(jī)制,叫做回收站或者垃圾桶,默認(rèn)情況下是不開啟的。啟用 Trash 功能后,從 HDFS 中刪除某些內(nèi)容時(shí),文件或目錄不會(huì)立即被清除,它們將被移動(dòng)到回收站Current目錄中(/user/{username}/.Trash/current)。
Trash Checkpoint檢查點(diǎn)僅僅是用戶回收站下的一個(gè)目錄,用于
存儲(chǔ)在創(chuàng)建檢查點(diǎn)之前刪除的所有文件或目錄。如果你想查看回收站目錄,可以在
/user/{username}/.Trash/{timestamp_of_checkpoint_creation}處看到:
最近刪除的文件被移動(dòng)到回收站 Current 目錄,并且在fs.trash.interva時(shí)間間隔內(nèi),HDFS 會(huì)為在 Current 回收站目錄下的文件創(chuàng)建檢查點(diǎn)
/user/{username}/.Trash/<日期>,并在過期時(shí)刪除舊的檢查點(diǎn)。
在core-site.xml配置文件中存在相關(guān)配置文章來源:http://www.zghlxwxcb.cn/news/detail-513932.html
<property>
<name>fs.trash.interval</name>
<value>4320</value>
</property>
#fs.trash.interval:分鐘數(shù),當(dāng)超過這個(gè)分鐘數(shù)后檢查點(diǎn)會(huì)被刪除。如果為零,Trash 回收站功能將被禁用。
<property>
<name>fs.trash.checkpoint.interval</name>
<value>0</value>
</property>
#fs.trash.checkpoint.interval:檢查點(diǎn)創(chuàng)建的時(shí)間間隔(單位為分鐘)。其值應(yīng)該小于或等于fs.trash.interval。如果為零,則將該值設(shè)置為fs.trash.interval的值。每次運(yùn)行檢查點(diǎn)時(shí),它都會(huì)從當(dāng)前版本中創(chuàng)建一個(gè)新的檢查點(diǎn),并刪除在數(shù)分鐘之前創(chuàng)建的檢查點(diǎn)。
在2023-06-19刪除完的文件后,將刪除的文件移動(dòng)到/user/hadoop/.Trash/current文件夾下,3天后2023-06-22檢查點(diǎn)生成機(jī)制運(yùn)行,將回收站中的數(shù)據(jù)移動(dòng)到/user/hadoop/.Trash/20230622080017,此時(shí)也會(huì)刪除當(dāng)前時(shí)間三天前過期的檢查點(diǎn)數(shù)據(jù),在2023-06-25檢查點(diǎn)生成后,沒有把/user/hadoop/.Trash/20230622080017的原因,因?yàn)榛厥照緮?shù)據(jù)量比較大,時(shí)間戳?xí)r間稍晚20230622080017無法被正常刪除。文章來源地址http://www.zghlxwxcb.cn/news/detail-513932.html
到了這里,關(guān)于hdfs刪除后空間不是釋放,trash回收機(jī)制的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!