国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

十行python代碼實(shí)現(xiàn)文件去重,去除重復(fù)文件的腳本

這篇具有很好參考價值的文章主要介紹了十行python代碼實(shí)現(xiàn)文件去重,去除重復(fù)文件的腳本。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方,請大家不吝賜教,您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問。

1.導(dǎo)入依賴

'''導(dǎo)入依賴'''

from pathlib import Path

import filecmp

2.函數(shù)說明

filecmp.cmp(path1, path2, shallow=True)

path1/path2:待比較的兩個文件路徑。

shallow :默認(rèn)為True,即只比較os.stat()獲取的元數(shù)據(jù)(創(chuàng)建時間,大小等信息)是否相同,
設(shè)置為False的話,在對比文件的時候還要比較文件內(nèi)容。文章來源地址http://www.zghlxwxcb.cn/news/detail-786139.html

3.提取待去重文件路徑

# 初始化文件路徑列表
path_files_list = []

# 遍歷
for path in Path(r'/usr/load/data').iterdir():

    # 校驗(yàn)是否為文件
    if path.is_file():
        # 加入到待去重文件列表
        path_files_list.append(path)
#學(xué)習(xí)中遇到問題沒人解答?小編創(chuàng)建了一個Python學(xué)習(xí)交流群:711312441
# 遍歷待去重文件
for file_index in range(len(path_files_list) - 1):

    # 遍歷,兩輛比對
    for later in range(file_index + 1, len(path_files_list)):

        # 校驗(yàn)內(nèi)容是否相同
        if filecmp.cmp(path_files_list[file_index], 
path_files_list[later], shallow=False):

            # 內(nèi)容相同、則刪除
            path_files_list[file_index].unlink()
            break

到了這里,關(guān)于十行python代碼實(shí)現(xiàn)文件去重,去除重復(fù)文件的腳本的文章就介紹完了。如果您還想了解更多內(nèi)容,請?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點(diǎn)僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符,請點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋,一經(jīng)查實(shí),立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

相關(guān)文章

  • 八十行代碼實(shí)現(xiàn)開源的 Midjourney、Stable Diffusion “咒語”作圖工具

    八十行代碼實(shí)現(xiàn)開源的 Midjourney、Stable Diffusion “咒語”作圖工具

    本篇文章聊聊如何通過 Docker 和八十行左右的 Python 代碼,實(shí)現(xiàn)一款類似 Midjourney 官方圖片解析功能 Describe 的 Prompt 工具。 讓你在玩 Midjourney、Stable Diffusion 這類模型時,不再為生成 Prompt 描述撓頭。 本文將提供兩個版本的工具,分別支持 CPU 和 GPU 推理使用,如果你有一張大于

    2023年04月14日
    瀏覽(52)
  • bat腳本刪除文件夾下的重復(fù)文件

    需求:刪除某個文件夾下重復(fù)的文件。例如文件名后帶(1)(2)等等 腳本: 說明: 指定一個目錄(不能包含中文),生成兩個記錄文件,執(zhí)行刪除文件,最后2s后關(guān)閉 參考: bat腳本刪除文件夾下的重復(fù)文件

    2024年01月21日
    瀏覽(23)
  • 用python實(shí)現(xiàn)檢查一個文件夾中所有word文件內(nèi)容是否重復(fù)

    要檢查一個文件夾中所有Word文件的內(nèi)容是否重復(fù),你可以使用Python的 python-docx 庫來讀取Word文件的內(nèi)容,并使用Python的集合數(shù)據(jù)結(jié)構(gòu)來檢查重復(fù)項(xiàng)。 以下是一個示例代碼,演示如何實(shí)現(xiàn)這個功能: python復(fù)制代碼 import os from docx import Document def get_word_files(directory): \\\"\\\"\\\"獲取指定目

    2024年01月23日
    瀏覽(44)
  • java 集合去重、獲取、統(tǒng)計(jì)重復(fù)元素

    開發(fā)過程中常遇見的三種問題:集合去重、獲取重復(fù)元素、統(tǒng)計(jì)重復(fù)次數(shù)。 網(wǎng)上搜了下,實(shí)現(xiàn)過程五花八門,這里簡單匯總下我覺得比較常用的方式: 方法:List轉(zhuǎn)set;一行代碼即可; 前提是不需要獲取重復(fù)元素和統(tǒng)計(jì)重復(fù)次數(shù) ,最簡單的就是把List轉(zhuǎn)為Set,眾所周知,set的

    2024年02月16日
    瀏覽(52)
  • 十行代碼,就能真正讓你理解DMA(CPU的秘書)

    十行代碼,就能真正讓你理解DMA(CPU的秘書)

    下面的代碼是單片機(jī)串口發(fā)送數(shù)據(jù)的程序. 那我們定義的變量a的值存儲在哪里了呢?可以看下單片機(jī)的邏輯框圖。 變量其實(shí)都是存在一個叫SRAM的存儲器中,它是單片機(jī)的內(nèi)存。存儲變量的這個步驟,是由單片機(jī)的內(nèi)核通過總線來操作完成。 第二行代碼:它是把內(nèi)存里的數(shù)據(jù)

    2024年02月08日
    瀏覽(17)
  • php 去除二維數(shù)組重復(fù)

    在 PHP 中,我們常常需要對數(shù)組進(jìn)行處理和操作。有時候,我們需要去除數(shù)組中的重復(fù)元素,這里介紹一種針對二維數(shù)組的去重方法。 以下是列舉一些常見的方法: 方法一:使用 array_map 和 serialize 函數(shù) array_map 函數(shù)可以對數(shù)組中的每個元素應(yīng)用一個回調(diào)函數(shù),該回調(diào)函數(shù)返回

    2024年02月13日
    瀏覽(18)
  • leetcode 316. 去除重復(fù)字母

    給你一個字符串 s ,請你去除字符串中重復(fù)的字母,使得每個字母只出現(xiàn)一次。需保證 返回結(jié)果的字典序最小(要求不能打亂其他字符的相對位置)。 示例 1: 輸入:s = “bcabc” 輸出:“abc” 示例 2: 輸入:s = “cbacdcbc” 輸出:“acdb” 提示: 1 = s.length = 104 s 由小寫英文

    2024年02月16日
    瀏覽(26)
  • 錄制完視頻如何去除重復(fù)部分?

    錄制完視頻如何去除重復(fù)部分?

    在錄制視頻的過程中,有時會出現(xiàn)一些重復(fù)的部分,這給視頻的制作人員帶來了不小的困擾。如果不及時去除重復(fù)部分,不僅會影響觀眾的觀看體驗(yàn),還會浪費(fèi)觀眾的時間和從業(yè)者的精力。那錄制完的視頻如何去除重復(fù)部分呢?無須擔(dān)心,繼續(xù)閱讀下文,會有去除視頻重復(fù)部

    2024年02月03日
    瀏覽(18)
  • MySQL去除數(shù)據(jù)庫重復(fù)記錄

    要從MySQL數(shù)據(jù)庫中刪除重復(fù)的記錄,您可以使用 DELETE 語句結(jié)合 GROUP BY 和 HAVING 子句來實(shí)現(xiàn)。以下是一個示例: 在上述示例中,您需要將 your_table 替換為您的表名,并將 column1, column2, ... 替換為用于判斷重復(fù)的列名。這個查詢將刪除所有重復(fù)的記錄,只保留每組重復(fù)記錄中的一

    2024年02月11日
    瀏覽(71)
  • MATLAB 點(diǎn)云重復(fù)點(diǎn)去除(7)

    MATLAB 點(diǎn)云重復(fù)點(diǎn)去除(7)

    效果上看不出來,但實(shí)際上左邊的點(diǎn)云是右邊的兩倍 重復(fù)點(diǎn)的去除,是點(diǎn)云處理中常用的預(yù)處理方法,因?yàn)橹貜?fù)點(diǎn)的存在有時候會嚴(yán)重干擾后續(xù)算法的準(zhǔn)確性,甚至出現(xiàn)意想不到的錯誤,去除方法也比較簡單,即我們認(rèn)為0.01m以內(nèi)的點(diǎn)過于靠近,則可以將它們看作重復(fù)點(diǎn),此

    2024年02月03日
    瀏覽(37)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包