크고 작은 텍스트 파일 세트가 있으며 모두 100 바이트 미만입니다. 가능한 한 쌍의 파일을 비교하고 중복되는 것을 기록하고 싶습니다. 이를 위해 Python 스크립트를 작성할 수는 있지만 기존 Linux 명령 줄 도구 (또는 간단한 도구 조합)가 있는지 궁금합니다.
업데이트 ( mfinni 주석 에 대한 응답 ) : 파일이 모두 단일 디렉토리에 있으므로 파일 이름이 다릅니다. 그러나 파일 이름 확장자는 공통이므로 와일드 카드로 쉽게 선택할 수 있습니다.
답변
있다 fdupes은 . 하지만 보통은find . -type f -exec md5sum '{}' \; | sort | uniq -d -w 36
답변
FSlint가 있습니다-이 특별한 경우에는 사용하지 않았지만 처리 할 수 있습니다 :
http://en.flossmanuals.net/FSlint/Introduction
답변
거의 확실하게 각 파일 쌍을 서로 나누고 싶지 않습니다. md5sums와 같은 것을 사용하여 모든 파일의 모든 체크섬을 가져 와서 중복 체크섬 만 다시보고하는 다른 도구로 파이프를 파이프하고 싶을 것입니다.