[python] 디렉토리의 모든 파일을 어떻게 나열합니까?

파이썬에서 디렉토리의 모든 파일을 어떻게 나열하고에 추가 할 수 list있습니까?



답변

os.listdir()디렉토리 파일디렉토리 에있는 모든 것을 얻을 수 있습니다 .

파일 원한다면 다음을 사용하여 필터링 할 수 있습니다 os.path.

from os import listdir
from os.path import isfile, join
onlyfiles = [f for f in listdir(mypath) if isfile(join(mypath, f))]

또는 당신은 사용할 수 os.walk()되는 두 개의리스트를 얻을 분할에 – 각 디렉토리 그것을 방문에 대한 파일DIRS 당신을 위해. 최상위 디렉토리 만 원한다면 처음으로 깨뜨릴 수 있습니다.

from os import walk

f = []
for (dirpath, dirnames, filenames) in walk(mypath):
    f.extend(filenames)
    break


답변

glob패턴 일치 및 확장을 수행 하므로 모듈을 사용하는 것이 좋습니다.

import glob
print(glob.glob("/home/adam/*.txt"))

쿼리 된 파일이있는 목록을 반환합니다.

['/home/adam/file1.txt', '/home/adam/file2.txt', .... ]


답변

Python 2 및 3으로 파일 목록 가져 오기


os.listdir()

현재 디렉토리의 모든 파일 및 디렉토리를 얻는 방법 (Python 3)

다음 은 Python 3에서 oslistdir()함수를 사용하여 현재 디렉토리의 파일 만 검색하는 간단한 방법입니다. 추가 탐색에서는 디렉토리의 폴더를 반환하는 방법을 보여 주지만 하위 디렉토리에는 파일이 없습니다. 걷기를 사용할 수 있습니다-나중에 설명).

 import os
 arr = os.listdir()
 print(arr)

 >>> ['$RECYCLE.BIN', 'work.txt', '3ebooks.txt', 'documents']

glob

같은 유형의 파일이나 공통된 파일을 선택하는 것이 더 쉽다는 것을 알았습니다. 다음 예를보십시오.

import glob

txtfiles = []
for file in glob.glob("*.txt"):
    txtfiles.append(file)

glob 목록 이해

import glob

mylist = [f for f in glob.glob("*.txt")]

glob 기능으로

이 함수는 인수에 주어진 확장자 (.txt, .docx 등)의 목록을 반환합니다.

import glob

def filebrowser(ext=""):
    "Returns files with an extension"
    return [f for f in glob.glob(f"*{ext}")]

x = filebrowser(".txt")
print(x)

>>> ['example.txt', 'fb.txt', 'intro.txt', 'help.txt']

glob 이전 코드 확장

함수는 이제 인수로 전달한 문자열과 일치하는 파일 목록을 반환합니다

import glob

def filesearch(word=""):
    """Returns a list with all files with the word/extension in it"""
    file = []
    for f in glob.glob("*"):
        if word[0] == ".":
            if f.endswith(word):
                file.append(f)
                return file
        elif word in f:
            file.append(f)
            return file
    return file

lookfor = "example", ".py"
for w in lookfor:
    print(f"{w:10} found => {filesearch(w)}")

산출

example    found => []
.py        found => ['search.py']

로 전체 경로 이름 얻기 os.path.abspath

알다시피, 위의 코드에는 파일의 전체 경로가 없습니다. 절대 경로가 필요하면 os.path이라는 모듈 의 다른 함수를 사용 _getfullpathname하여 얻은 파일을 os.listdir()인수로 사용할 수 있습니다. 나중에 확인할 것처럼 전체 경로를 갖는 다른 방법이 있습니다 (mexmex에서 제안한대로 _getfullpathname으로 대체했습니다 abspath).

 import os
 files_path = [os.path.abspath(x) for x in os.listdir()]
 print(files_path)

 >>> ['F:\\documenti\applications.txt', 'F:\\documenti\collections.txt']

파일 형식의 전체 경로 이름을 모든 하위 디렉토리로 가져옵니다. walk

많은 디렉토리에서 물건을 찾는 데 매우 유용하며 이름을 기억하지 못하는 파일을 찾는 데 도움이되었습니다.

import os

# Getting the current work directory (cwd)
thisdir = os.getcwd()

# r=root, d=directories, f = files
for r, d, f in os.walk(thisdir):
    for file in f:
        if file.endswith(".docx"):
            print(os.path.join(r, file))

os.listdir(): 현재 디렉토리에서 파일 가져 오기 (Python 2)

Python 2에서 현재 디렉토리에있는 파일 목록을 원하면 인수를 ‘.’로 지정해야합니다. 또는 os.listdir 메소드의 os.getcwd ().

 import os
 arr = os.listdir('.')
 print(arr)

 >>> ['$RECYCLE.BIN', 'work.txt', '3ebooks.txt', 'documents']

디렉토리 트리에서 위로 이동하려면

# Method 1
x = os.listdir('..')

# Method 2
x= os.listdir('/')

파일 가져 오기 : os.listdir()특정 디렉토리 (Python 2 및 3)

 import os
 arr = os.listdir('F:\\python')
 print(arr)

 >>> ['$RECYCLE.BIN', 'work.txt', '3ebooks.txt', 'documents']

다음과 같은 특정 하위 디렉토리의 파일을 가져옵니다. os.listdir()

import os

x = os.listdir("./content")

os.walk('.') -현재 디렉토리

 import os
 arr = next(os.walk('.'))[2]
 print(arr)

 >>> ['5bs_Turismo1.pdf', '5bs_Turismo1.pptx', 'esperienza.txt']

next(os.walk('.'))os.path.join('dir', 'file')

 import os
 arr = []
 for d,r,f in next(os.walk("F:\\_python")):
     for file in f:
         arr.append(os.path.join(r,file))

 for f in arr:
     print(files)

>>> F:\\_python\\dict_class.py
>>> F:\\_python\\programmi.txt

next(os.walk('F:\\') -전체 경로를 얻으십시오-목록 이해

 [os.path.join(r,file) for r,d,f in next(os.walk("F:\\_python")) for file in f]

 >>> ['F:\\_python\\dict_class.py', 'F:\\_python\\programmi.txt']

os.walk -전체 경로 가져 오기-하위 디렉토리의 모든 파일 **

x = [os.path.join(r,file) for r,d,f in os.walk("F:\\_python") for file in f]
print(x)

>>> ['F:\\_python\\dict.py', 'F:\\_python\\progr.txt', 'F:\\_python\\readl.py']

os.listdir() -txt 파일 만 가져옵니다

 arr_txt = [x for x in os.listdir() if x.endswith(".txt")]
 print(arr_txt)

 >>> ['work.txt', '3ebooks.txt']

사용 glob파일의 전체 경로를 얻는 데

파일의 절대 경로가 필요한 경우 :

from path import path
from glob import glob
x = [path(f).abspath() for f in glob("F:\\*.txt")]
for f in x:
    print(f)

>>> F:\acquistionline.txt
>>> F:\acquisti_2018.txt
>>> F:\bootstrap_jquery_ecc.txt

os.path.isfile목록에서 디렉토리를 피하기 위해 사용

import os.path
listOfFiles = [f for f in os.listdir() if os.path.isfile(f)]
print(listOfFiles)

>>> ['a simple game.py', 'data.txt', 'decorator.py']

pathlibPython 3.4에서 사용

import pathlib

flist = []
for p in pathlib.Path('.').iterdir():
    if p.is_file():
        print(p)
        flist.append(p)

 >>> error.PNG
 >>> exemaker.bat
 >>> guiprova.mp3
 >>> setup.py
 >>> speak_gui2.py
 >>> thumb.PNG

list comprehension:

flist = [p for p in pathlib.Path('.').iterdir() if p.is_file()]

또는 pathlib.Path()대신에 사용하십시오pathlib.Path(".")

pathlib.Path ()에서 glob 메소드 사용

import pathlib

py = pathlib.Path().glob("*.py")
for file in py:
    print(file)

>>> stack_overflow_list.py
>>> stack_overflow_list_tkinter.py

os.walk로 모든 파일 만 가져 오기

import os
x = [i[2] for i in os.walk('.')]
y=[]
for t in x:
    for f in t:
        y.append(f)
print(y)

>>> ['append_to_list.py', 'data.txt', 'data1.txt', 'data2.txt', 'data_180617', 'os_walk.py', 'READ2.py', 'read_data.py', 'somma_defaltdic.py', 'substitute_words.py', 'sum_data.py', 'data.txt', 'data1.txt', 'data_180617']

다음 파일 만 가져와 디렉토리로 이동

 import os
 x = next(os.walk('F://python'))[2]
 print(x)

 >>> ['calculator.bat','calculator.py']

다음 디렉토리 만 가져 와서 디렉토리로 이동

 import os
 next(os.walk('F://python'))[1] # for the current dir use ('.')

 >>> ['python3','others']

모든 하위 디렉토리 이름을 walk

for r,d,f in os.walk("F:\\_python"):
    for dirs in d:
        print(dirs)

>>> .vscode
>>> pyexcel
>>> pyschool.py
>>> subtitles
>>> _metaprogramming
>>> .ipynb_checkpoints

os.scandir() 파이썬 3.5 이상

import os
x = [f.name for f in os.scandir() if f.is_file()]
print(x)

>>> ['calculator.bat','calculator.py']

# Another example with scandir (a little variation from docs.python.org)
# This one is more efficient than os.listdir.
# In this case, it shows the files only in the current directory
# where the script is executed.

import os
with os.scandir() as i:
    for entry in i:
        if entry.is_file():
            print(entry.name)

>>> ebookmaker.py
>>> error.PNG
>>> exemaker.bat
>>> guiprova.mp3
>>> setup.py
>>> speakgui4.py
>>> speak_gui2.py
>>> speak_gui3.py
>>> thumb.PNG

예 :

전의. 1 : 서브 디렉토리에 몇 개의 파일이 있습니까?

이 예에서는 모든 디렉토리 및 해당 서브 디렉토리에 포함 된 파일 수를 찾습니다.

import os

def count(dir, counter=0):
    "returns number of files in dir and subdirs"
    for pack in os.walk(dir):
        for f in pack[2]:
            counter += 1
    return dir + " : " + str(counter) + "files"

print(count("F:\\python"))

>>> 'F:\\\python' : 12057 files'

예 2 : 디렉토리에서 다른 파일로 모든 파일을 복사하는 방법?

컴퓨터에서 형식을 가진 모든 파일 (기본값 : pptx)을 찾아서 새 폴더에 복사하는 명령입니다.

import os
import shutil
from path import path

destination = "F:\\file_copied"
# os.makedirs(destination)

def copyfile(dir, filetype='pptx', counter=0):
    "Searches for pptx (or other - pptx is the default) files and copies them"
    for pack in os.walk(dir):
        for f in pack[2]:
            if f.endswith(filetype):
                fullpath = pack[0] + "\\" + f
                print(fullpath)
                shutil.copy(fullpath, destination)
                counter += 1
    if counter > 0:
        print('-' * 30)
        print("\t==> Found in: `" + dir + "` : " + str(counter) + " files\n")

for dir in os.listdir():
    "searches for folders that starts with `_`"
    if dir[0] == '_':
        # copyfile(dir, filetype='pdf')
        copyfile(dir, filetype='txt')


>>> _compiti18\Compito Contabilità 1\conti.txt
>>> _compiti18\Compito Contabilità 1\modula4.txt
>>> _compiti18\Compito Contabilità 1\moduloa4.txt
>>> ------------------------
>>> ==> Found in: `_compiti18` : 3 files

전의. 3 : txt 파일의 모든 파일을 가져 오는 방법

모든 파일 이름으로 txt 파일을 작성하려는 경우 :

import os
mylist = ""
with open("filelist.txt", "w", encoding="utf-8") as file:
    for eachfile in os.listdir():
        mylist += eachfile + "\n"
    file.write(mylist)

예 : 하드 드라이브의 모든 파일이 포함 된 txt

"""
We are going to save a txt file with all the files in your directory.
We will use the function walk()
"""

import os

# see all the methods of os
# print(*dir(os), sep=", ")
listafile = []
percorso = []
with open("lista_file.txt", "w", encoding='utf-8') as testo:
    for root, dirs, files in os.walk("D:\\"):
        for file in files:
            listafile.append(file)
            percorso.append(root + "\\" + file)
            testo.write(file + "\n")
listafile.sort()
print("N. of files", len(listafile))
with open("lista_file_ordinata.txt", "w", encoding="utf-8") as testo_ordinato:
    for file in listafile:
        testo_ordinato.write(file + "\n")

with open("percorso.txt", "w", encoding="utf-8") as file_percorso:
    for file in percorso:
        file_percorso.write(file + "\n")

os.system("lista_file.txt")
os.system("lista_file_ordinata.txt")
os.system("percorso.txt")

하나의 텍스트 파일에있는 C : \의 모든 파일

이것은 이전 코드의 짧은 버전입니다. 다른 위치에서 시작해야하는 경우 파일 찾기를 시작할 폴더를 변경하십시오. 이 코드는 컴퓨터의 텍스트 파일에 50MB 미만의 완전한 경로를 가진 파일이있는 500.000 줄 이하를 생성합니다.

import os

with open("file.txt", "w", encoding="utf-8") as filewrite:
    for r, d, f in os.walk("C:\\"):
        for file in f:
            filewrite.write(f"{r + file}\n")

유형의 폴더에 모든 경로를 가진 파일을 작성하는 방법

이 기능을 사용하면 찾고자하는 파일 형식 (예 : pngfile.txt)의 이름을 가진 txt 파일을 해당 형식의 모든 파일의 전체 경로와 함께 만들 수 있습니다. 때로는 유용 할 수 있다고 생각합니다.

import os

def searchfiles(extension='.ttf', folder='H:\\'):
    "Create a txt file with all the file of a type"
    with open(extension[1:] + "file.txt", "w", encoding="utf-8") as filewrite:
        for r, d, f in os.walk(folder):
            for file in f:
                if file.endswith(extension):
                    filewrite.write(f"{r + file}\n")

# looking for png file (fonts) in the hard disk H:\
searchfiles('.png', 'H:\\')

>>> H:\4bs_18\Dolphins5.png
>>> H:\4bs_18\Dolphins6.png
>>> H:\4bs_18\Dolphins7.png
>>> H:\5_18\marketing html\assets\imageslogo2.png
>>> H:\7z001.png
>>> H:\7z002.png

(New) 모든 파일을 찾아 tkinter GUI로 열기

나는이 2019 년에 디렉토리에있는 모든 파일을 검색하고 목록에서 파일 이름을 두 번 클릭하여 열 수있는 작은 응용 프로그램을 추가하고 싶었습니다.
여기에 이미지 설명을 입력하십시오

import tkinter as tk
import os

def searchfiles(extension='.txt', folder='H:\\'):
    "insert all files in the listbox"
    for r, d, f in os.walk(folder):
        for file in f:
            if file.endswith(extension):
                lb.insert(0, r + "\\" + file)

def open_file():
    os.startfile(lb.get(lb.curselection()[0]))

root = tk.Tk()
root.geometry("400x400")
bt = tk.Button(root, text="Search", command=lambda:searchfiles('.png', 'H:\\'))
bt.pack()
lb = tk.Listbox(root)
lb.pack(fill="both", expand=1)
lb.bind("<Double-Button>", lambda x: open_file())
root.mainloop()


답변

import os
os.listdir("somedirectory")

“somedirectory”의 모든 파일 및 디렉토리 목록을 반환합니다.


답변

파일 목록 만 가져 오는 한 줄 솔루션 (하위 디렉토리 없음) :

filenames = next(os.walk(path))[2]

또는 절대 경로 이름 :

paths = [os.path.join(path, fn) for fn in next(os.walk(path))[2]]


답변

디렉토리 및 모든 서브 디렉토리에서 전체 파일 경로 가져 오기

import os

def get_filepaths(directory):
    """
    This function will generate the file names in a directory
    tree by walking the tree either top-down or bottom-up. For each
    directory in the tree rooted at directory top (including top itself),
    it yields a 3-tuple (dirpath, dirnames, filenames).
    """
    file_paths = []  # List which will store all of the full filepaths.

    # Walk the tree.
    for root, directories, files in os.walk(directory):
        for filename in files:
            # Join the two strings in order to form the full filepath.
            filepath = os.path.join(root, filename)
            file_paths.append(filepath)  # Add it to the list.

    return file_paths  # Self-explanatory.

# Run the above function and store its results in a variable.   
full_file_paths = get_filepaths("/Users/johnny/Desktop/TEST")

  • 위 함수에서 제공 한 경로에는 3 개의 파일이 포함되어 있습니다. 그 중 2 개는 루트 디렉토리에 있고 다른 하나는 “SUBFOLDER”라는 하위 폴더에 있습니다. 이제 다음과 같은 작업을 수행 할 수 있습니다.
  • print full_file_paths 목록이 인쇄됩니다.

    • ['/Users/johnny/Desktop/TEST/file1.txt', '/Users/johnny/Desktop/TEST/file2.txt', '/Users/johnny/Desktop/TEST/SUBFOLDER/file3.dat']

원하는 경우 내용을 열고 읽거나 아래 코드와 같이 확장자가 “.dat”인 파일에만 집중할 수 있습니다.

for f in full_file_paths:
  if f.endswith(".dat"):
    print f

/Users/johnny/Desktop/TEST/SUBFOLDER/file3.dat


답변

버전 3.4부터는 다음 보다 훨씬 효율적인 내장 반복기 가 있습니다 os.listdir().

pathlib: 버전 3.4의 새로운 기능.

>>> import pathlib
>>> [p for p in pathlib.Path('.').iterdir() if p.is_file()]

PEP 428 에 따르면 이 pathlib라이브러리 의 목적은 파일 시스템 경로와 사용자가 수행하는 일반적인 작업을 처리 할 수있는 간단한 클래스 계층을 제공하는 것입니다.

os.scandir(): 버전 3.5의 새로운 기능.

>>> import os
>>> [entry for entry in os.scandir('.') if entry.is_file()]

참고 os.walk()사용하는 os.scandir()대신 os.listdir()버전 3.5에서, 그 속도에 따라 2-20 배 증가되었다 PEP 471 .

아래 ShadowRanger의 의견을 읽는 것이 좋습니다.