[python] 파이썬의 file.flush ()는 정확히 무엇을합니까?

File Objects 에 대한 Python 설명서 에서 이것을 발견했습니다 .

flush ()는 반드시 파일의 데이터를 디스크에 쓸 필요는 없습니다. flush () 다음에 os.fsync ()를 사용하여이 동작을 확인하십시오.

그래서 내 질문은 : 파이썬이 정확히 무엇을 flush하고 있습니까? 디스크에 데이터를 쓰도록 강요했지만 지금은 그렇지 않습니다. 왜?

답변

일반적으로 두 가지 레벨의 버퍼링이 관련됩니다.

내부 버퍼
운영 체제 버퍼

내부 버퍼는 프로그래밍중인 런타임 / 라이브러리 / 언어에 의해 생성 된 버퍼이며 모든 쓰기에 대한 시스템 호출을 피함으로써 작업 속도를 향상시킵니다. 대신 파일 객체에 쓸 때 해당 버퍼에 쓴 다음 버퍼가 채워질 때마다 시스템 호출을 사용하여 데이터가 실제 파일에 기록됩니다.

그러나 운영 체제 버퍼로 인해 데이터가 디스크에 기록 되는 것은 아닙니다 . 데이터가 런타임에 의해 유지 관리되는 버퍼에서 운영 체제가 유지 관리하는 버퍼로 복사된다는 의미 일 수도 있습니다.

무언가를 쓰면 버퍼에서 끝나고 (머신) 전원이 꺼지면 머신이 꺼질 때 해당 데이터가 디스크에 있지 않습니다.

그와 함께 그래서, 도움을 위해 당신이 가지고있는 flush및fsync 위해 각각의 객체에 메소드가 있습니다.

첫 번째 flush는 프로그램 버퍼에 남아있는 데이터를 실제 파일에 기록합니다. 일반적으로 이는 데이터가 프로그램 버퍼에서 운영 체제 버퍼로 복사됨을 의미합니다.

특히 이것은 다른 프로세스가 동일한 파일을 읽기 위해 열려있는 경우 방금 파일로 플러시 한 데이터에 액세스 할 수 있다는 것입니다. 그러나 반드시 “영구적으로”디스크에 저장되었다는 의미는 아닙니다.

그렇게하려면 os.fsync 모든 운영 체제 버퍼가 저장 장치와 동기화되도록 메소드 즉,이 메소드는 운영 체제 버퍼에서 디스크로 데이터를 복사합니다.

일반적으로 두 방법 중 하나를 신경 쓸 필요는 없지만 실제로 디스크에서 끝나는 것에 대한 편집증이 좋은 시나리오 인 경우 지시에 따라 두 호출을 모두 수행해야합니다.

2018 년 부록.

캐시 메커니즘이있는 디스크는 이제 2013 년보다 훨씬 일반적이므로 이제 더 많은 수준의 캐싱 및 버퍼가 필요합니다. 나는 가정 이 버퍼뿐만 아니라 동기화 / 플러시 호출에 의해 처리됩니다,하지만 난 정말 모르겠어요.

답변

운영 체제가 그렇지 않을 수 있기 때문입니다. 플러시 작업은 파일 데이터를 RAM의 파일 캐시에 저장하며, 실제로 디스크에서 파일을 전송하는 것은 OS의 작업입니다.

답변

내부 버퍼를 플러시하여 OS가 버퍼를 파일에 씁니다. [1] Python은 달리 구성하지 않는 한 OS의 기본 버퍼링을 사용합니다.

그러나 때때로 OS는 여전히 협력하지 않기로 선택합니다. 특히 Windows / NTFS의 쓰기 지연과 같은 멋진 기능이 있습니다. 기본적으로 내부 버퍼는 플러시되지만 OS 버퍼는 계속 유지합니다. 따라서 OS에 디스크에 쓰도록 지시해야합니다 os.fsync().

[1] http://docs.python.org/library/stdtypes.html

답변

flush ()는 기본적으로 RAM 버퍼를 정리합니다. 실제로 나중에 나중에 계속 쓸 수는 있지만 파일에 대한 가장 안전하고 안전한 쓰기 기능으로 생각해서는 안됩니다. 더 많은 데이터를 얻기 위해 RAM을 비우는 것입니다. 데이터가 파일에 안전하게 기록되도록하려면 close ()를 대신 사용하십시오.