[python] 텍스트 파일을 수정하는 방법?

Python을 사용하고 있으며 파일을 삭제하거나 복사하지 않고 텍스트 파일에 문자열을 삽입하고 싶습니다. 어떻게해야합니까?



답변

불행히도 파일을 다시 쓰지 않고 파일 중간에 삽입하는 방법은 없습니다. 이전 포스터에서 알 수 있듯이, 파일을 추가하거나 찾기를 사용하여 파일의 일부를 덮어 쓸 수 있지만 처음이나 중간에 물건을 추가하려면 다시 써야합니다.

이것은 파이썬이 아닌 운영 체제입니다. 모든 언어에서 동일합니다.

내가 일반적으로하는 일은 파일에서 읽고 수정하고 myfile.txt.tmp라는 새 파일 또는 이와 비슷한 파일에 쓰는 것입니다. 파일이 너무 커서 전체 파일을 메모리로 읽는 것보다 낫습니다. 임시 파일이 완성되면 원본 파일과 동일하게 이름을 바꿉니다.

파일 쓰기가 중단되거나 어떤 이유로 든 중단 된 경우에도 원본 파일은 그대로 유지되므로이 방법을 사용하는 것이 안전합니다.


답변

당신이하고 싶은 일에 달려 있습니다. 추가하려면 “a”로 열 수 있습니다.

 with open("foo.txt", "a") as f:
     f.write("new line\n")

무언가를 미리 표현하려면 먼저 파일에서 읽어야합니다.

with open("foo.txt", "r+") as f:
     old = f.read() # read everything in the file
     f.seek(0) # rewind
     f.write("new line\n" + old) # write the new line before


답변

fileinputinplace = 1 매개 변수를 사용하면 Python 표준 라이브러리 의 모듈이 파일을 그대로 다시 작성합니다.

import sys
import fileinput

# replace all occurrences of 'sit' with 'SIT' and insert a line after the 5th
for i, line in enumerate(fileinput.input('lorem_ipsum.txt', inplace=1)):
    sys.stdout.write(line.replace('sit', 'SIT'))  # replace 'sit' and write
    if i == 4: sys.stdout.write('\n')  # write a blank line after the 5th line


답변

파일을 제자리에 다시 쓰려면 종종 기존 사본을 수정 된 이름으로 저장해야합니다. 유닉스 사람들 ~은 오래된 것을 표시하기 위해를 추가합니다 . Windows 사용자는 .bak 또는 .old를 추가하거나 파일 이름을 바꾸거나 이름 앞에 ~를 두는 모든 종류의 작업을 수행합니다.

import shutil
shutil.move( afile, afile+"~" )

destination= open( aFile, "w" )
source= open( aFile+"~", "r" )
for line in source:
    destination.write( line )
    if <some condition>:
        destination.write( >some additional line> + "\n" )
source.close()
destination.close()

대신 shutil다음을 사용할 수 있습니다.

import os
os.rename( aFile, aFile+"~" )


답변

파이썬의 mmap 모듈을 사용하면 파일에 삽입 할 수 있습니다. 다음 샘플은 Unix에서 수행 할 수있는 방법을 보여줍니다 (Windows mmap은 다를 수 있음). 모든 오류 조건을 처리하는 것은 아니며 원본 파일이 손상되거나 손실 될 수 있습니다. 또한 유니 코드 문자열을 처리하지 않습니다.

import os
from mmap import mmap

def insert(filename, str, pos):
    if len(str) < 1:
        # nothing to insert
        return

    f = open(filename, 'r+')
    m = mmap(f.fileno(), os.path.getsize(filename))
    origSize = m.size()

    # or this could be an error
    if pos > origSize:
        pos = origSize
    elif pos < 0:
        pos = 0

    m.resize(origSize + len(str))
    m[pos+len(str):] = m[pos:origSize]
    m[pos:pos+len(str)] = str
    m.close()
    f.close()

‘r +’모드에서 열린 파일을 사용하여 mmap없이이 작업을 수행 할 수도 있지만 삽입 위치에서 EOF에 이르기까지 파일의 내용을 읽고 임시 저장해야하므로 덜 편리하고 덜 효율적입니다. 거대하다.


답변

Adam이 언급했듯이 시스템 메모리의 일부를 교체하고 다시 쓸 수있는 충분한 메모리가 있는지에 대한 접근 방식을 결정하기 전에 시스템 제한을 고려해야합니다.

작은 파일을 다루거나 메모리 문제가없는 경우 다음과 같은 도움이 될 수 있습니다.

옵션 1)
전체 파일을 메모리로 읽고 행의 전체 또는 일부에 정규식 대체를 수행하고 해당 행에 추가 행을 추가하십시오. ‘중간 라인’이 파일에서 고유한지 확인해야하거나 각 라인에 타임 스탬프가있는 경우 이는 매우 안정적이어야합니다.

# open file with r+b (allow write and binary mode)
f = open("file.log", 'r+b')
# read entire content of file into memory
f_content = f.read()
# basically match middle line and replace it with itself and the extra line
f_content = re.sub(r'(middle line)', r'\1\nnew line', f_content)
# return pointer to top of file so we can re-write the content with replaced string
f.seek(0)
# clear file content 
f.truncate()
# re-write the content with the updated content
f.write(f_content)
# close file
f.close()

옵션 2)
가운데 줄을 찾아 해당 줄과 추가 줄로 바꿉니다.

# open file with r+b (allow write and binary mode)
f = open("file.log" , 'r+b')
# get array of lines
f_content = f.readlines()
# get middle line
middle_line = len(f_content)/2
# overwrite middle line
f_content[middle_line] += "\nnew line"
# return pointer to top of file so we can re-write the content with replaced string
f.seek(0)
# clear file content 
f.truncate()
# re-write the content with the updated content
f.write(''.join(f_content))
# close file
f.close()


답변

이것을 깨끗하게하기 위해 작은 수업을 썼습니다.

import tempfile

class FileModifierError(Exception):
    pass

class FileModifier(object):

    def __init__(self, fname):
        self.__write_dict = {}
        self.__filename = fname
        self.__tempfile = tempfile.TemporaryFile()
        with open(fname, 'rb') as fp:
            for line in fp:
                self.__tempfile.write(line)
        self.__tempfile.seek(0)

    def write(self, s, line_number = 'END'):
        if line_number != 'END' and not isinstance(line_number, (int, float)):
            raise FileModifierError("Line number %s is not a valid number" % line_number)
        try:
            self.__write_dict[line_number].append(s)
        except KeyError:
            self.__write_dict[line_number] = [s]

    def writeline(self, s, line_number = 'END'):
        self.write('%s\n' % s, line_number)

    def writelines(self, s, line_number = 'END'):
        for ln in s:
            self.writeline(s, line_number)

    def __popline(self, index, fp):
        try:
            ilines = self.__write_dict.pop(index)
            for line in ilines:
                fp.write(line)
        except KeyError:
            pass

    def close(self):
        self.__exit__(None, None, None)

    def __enter__(self):
        return self

    def __exit__(self, type, value, traceback):
        with open(self.__filename,'w') as fp:
            for index, line in enumerate(self.__tempfile.readlines()):
                self.__popline(index, fp)
                fp.write(line)
            for index in sorted(self.__write_dict):
                for line in self.__write_dict[index]:
                    fp.write(line)
        self.__tempfile.close()

그런 다음 다음과 같이 사용할 수 있습니다.

with FileModifier(filename) as fp:
    fp.writeline("String 1", 0)
    fp.writeline("String 2", 20)
    fp.writeline("String 3")  # To write at the end of the file