【Python】獲取指定目錄下的文件夾和文件
1. 介紹
我們經(jīng)常會有對文件做批量處理的需求,獲取指定目錄下的文件夾和文件(有時需要獲取所有文件,即子目錄下的文件也需要獲取)。Python 中掃描目錄有兩種方法:
- os.listdir()
- os.walk()
2. 舉例說明
建立項目框架如下:
其中,
- test:項目文件夾名稱,含有 aa子文件夾 和 main.py
- aa:文件夾,含有 bb子文件夾 、cc子文件夾 以及 一個 dd.txt文件
- bb:文件夾,含有一個 txt 文件
- ff.txt:txt文件
- cc:空文件夾
- dd.txt:txt文件夾
- bb:文件夾,含有一個 txt 文件
- main.py:進行代碼舉例使用
- aa:文件夾,含有 bb子文件夾 、cc子文件夾 以及 一個 dd.txt文件
2.1 os.listdir()
os.listdir() 方法用于返回指定的目錄下包含的文件或子目錄的名字的列表。
- 這個列表以字母順序。其得到的是僅當(dāng)前路徑下的文件名,不包括子目錄中的文件;
- 如果需要得到所有文件需要遞歸。 它也不包括 ‘.’ 和 ‘…’ 即使它在目錄中。
2.1.1 API
import os
os.listdir(path)
2.1.2 main.py 代碼如下,時
import os
def list_dir(file_dir):
'''
通過 listdir 得到的是僅當(dāng)前路徑下的文件名,不包括子目錄中的文件,如果需要得到所有文件需要遞歸
'''
dir_list = os.listdir(file_dir)
result_list = []
for cur_file in dir_list:
# 獲取文件的絕對路徑
path = os.path.join(file_dir, cur_file)
if os.path.isfile(path): # 判斷是否是文件還是目錄需要用絕對路徑
result_list.append(path)
if os.path.isdir(path):
result_list += list_dir(path) # 遞歸子目錄
return result_list
path = 'aa'
list1 = os.listdir(path)
list2 = list_dir(path)
print(list1)
print(list2)
輸出如下:
list1: ['bb', 'cc', 'dd.txt', 'ee.jpg']
list2: ['aa/bb/ff.txt', 'aa/dd.txt', 'aa/ee.jpg']
2.2 os.walk()
os.walk() 方法用于通過在目錄樹中游走輸出在目錄中的文件名,向上或者向下。是一個簡單易用的文件、目錄遍歷器,可以幫助我們高效的處理文件、目錄方面的事情。
2.2.1 API
import os
os.walk(top[, topdown=True[, onerror=None[, followlinks=False]]])
方法參數(shù)說明:
- top:要遍歷的目錄的路徑
- topdown:可選,如果為 True,則優(yōu)先遍歷 top 目錄,以及 top 目錄下的每一個子目錄,否則優(yōu)先遍歷 top 的子目錄,默認(rèn)為 True
- onerror: 可選, 需要一個 callable 對象,當(dāng) walk 異常時調(diào)用
- followlinks:可選, 如果為 True,則會遍歷目錄下的快捷方式(linux 下是 symbolic link)實際所指的目錄,默認(rèn)為 False
- args:包含那些沒有 ‘-’ 或 ‘–’ 的參數(shù)列表
返回值: 三元組 (root, dirs, files)
- root :所指的是當(dāng)前正在遍歷的目錄的地址
- dirs :當(dāng)前文件夾中所有目錄名字的 list (不包括子目錄)
- files :當(dāng)前文件夾中所有的文件 (不包括子目錄中的文件)
2.2.2 main.py 代碼如下,時
import os
path = 'aa'
a, b, c = os.walk(path)
print(a)
print(b)
print(c)
輸出如下:文章來源:http://www.zghlxwxcb.cn/news/detail-582254.html
a: ('aa', ['bb', 'cc'], ['dd.txt', 'ee.jpg'])
b: ('aa/bb', [], ['ff.txt'])
c: ('aa/cc', [], [])
2.2.3 main.py 代碼如下,時
import os
path = 'aa'
for root, dirs, files in os.walk(path):
for name in files:
print(os.path.join(root, name))
for name in dirs:
print(os.path.join(root, name))
輸出如下:文章來源地址http://www.zghlxwxcb.cn/news/detail-582254.html
aa/dd.txt
aa/ee.jpg
aa/nn
aa/bb
aa/cc
aa/bb/ff.txt
3. 其他常用方法
- os.path.splitext():分離文件名和擴展名
import os
file = "file_test.txt"
file_name = os.path.splitext(file)[0] # 輸出:file_test
file_suffix = os.path.splitext(file)[1] # 輸出:.txt
- os.path.exists():判斷文件或目錄是否存在
- os.path.isfile():判斷是否是文件
- os.path.isdir():判斷是否是目錄
- os.path.dirname():獲取當(dāng)前文件所在的目錄,即父目錄
- os.makedirs():創(chuàng)建多級目錄
- os.mkdir():創(chuàng)建單級目錄
- os.path.getsize():獲取文件大小
到了這里,關(guān)于【Python】獲取指定目錄下的文件夾和文件的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!