1.導(dǎo)入依賴
'''導(dǎo)入依賴'''
from pathlib import Path
import filecmp
2.函數(shù)說明
filecmp.cmp(path1, path2, shallow=True)
path1/path2:待比較的兩個文件路徑。文章來源:http://www.zghlxwxcb.cn/news/detail-786139.html
shallow :默認(rèn)為True,即只比較os.stat()獲取的元數(shù)據(jù)(創(chuàng)建時間,大小等信息)是否相同,
設(shè)置為False的話,在對比文件的時候還要比較文件內(nèi)容。文章來源地址http://www.zghlxwxcb.cn/news/detail-786139.html
3.提取待去重文件路徑
# 初始化文件路徑列表
path_files_list = []
# 遍歷
for path in Path(r'/usr/load/data').iterdir():
# 校驗(yàn)是否為文件
if path.is_file():
# 加入到待去重文件列表
path_files_list.append(path)
#學(xué)習(xí)中遇到問題沒人解答?小編創(chuàng)建了一個Python學(xué)習(xí)交流群:711312441
# 遍歷待去重文件
for file_index in range(len(path_files_list) - 1):
# 遍歷,兩輛比對
for later in range(file_index + 1, len(path_files_list)):
# 校驗(yàn)內(nèi)容是否相同
if filecmp.cmp(path_files_list[file_index],
path_files_list[later], shallow=False):
# 內(nèi)容相同、則刪除
path_files_list[file_index].unlink()
break
到了這里,關(guān)于十行python代碼實(shí)現(xiàn)文件去重,去除重復(fù)文件的腳本的文章就介紹完了。如果您還想了解更多內(nèi)容,請?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!