[linux] 텍스트 파일에서 줄 끝을 찾는 방법은 무엇입니까?

bash에서 무언가를 사용하여 해석되지 않고 인쇄 된 파일의 줄 끝을 표시하려고합니다. 이 파일은 처리를 위해 Linux 시스템에서 읽고있는 SSIS / SQL Server의 덤프입니다.

  • 내 모든 스위치가 있습니까 vi, less, more, 등?

  • 줄 끝을 보는 것 외에도 줄 끝의 유형이 ( CRLF또는 LF) 인지 알아야합니다 . 어떻게 알 수 있습니까?



답변

file유틸리티를 사용하여 줄 끝 유형을 표시 할 수 있습니다 .

유닉스 :

$ file testfile1.txt
testfile.txt: ASCII text

“DOS”:

$ file testfile2.txt
testfile2.txt: ASCII text, with CRLF line terminators

“DOS”를 Unix로 변환하려면 :

$ dos2unix testfile2.txt

유닉스에서 “DOS”로 변환하기 :

$ unix2dos testfile1.txt

이미 변환 된 파일을 변환해도 아무런 효과가 없으므로 일반적인 고지 사항이 항상 적용되지만 맹목적으로 실행하는 것이 안전합니다 (즉, 먼저 형식을 테스트하지 않고).


답변

에서 vi

:set list 줄 끝을 볼 수 있습니다.

:set nolist 정상으로 돌아갑니다.

나는 당신이 \n또는 \r\nin을 볼 수 없다고 생각하지만 vi, 어떤 줄 끝을 가지고 있는지 유추하기 위해 어떤 유형의 파일 (UNIX, DOS 등)을 볼 수 있습니다 …

:set ff

또는에서 bash당신이 사용 od -t c <filename>하거나 od -c <filename>수익을 표시합니다.


답변

우분투 14.04 :

간단하게 cat -e <filename>작동합니다.

그러면 Unix 줄 끝 ( \n또는 LF) 이 표시 $되고 Windows 줄 끝 ( \r\n또는 CRLF)이 표시됩니다 ^M$.


답변

bash 쉘에서을 시도하십시오 cat -v <filename>. Windows 파일에 대한 캐리지 리턴이 표시되어야합니다.

(이것은 Windows XP의 Cygwin을 통해 rxvt에서 나에게 도움이되었습니다).

편집자 주 : (CR) 문자를 cat -v시각화 \r합니다. 로 ^M. 따라서 줄 끝\r\n 시퀀스는 ^M각 출력 줄의 끝에서와 같이 표시됩니다 . cat -e부가 적으로 시각화 할 \n즉 같이 $. ( cat -et탭 문자를 추가로 시각화합니다 ^I.)


답변

^M적은 양을 사용하는 것처럼 CR을 표시 less -u하거나 -u적은 양을 열면 열 수 있습니다.

man less 말한다 :

-u or --underline-special

      Causes backspaces and carriage returns to be treated  as  print-
      able  characters;  that  is,  they are sent to the terminal when
      they appear in the input.

답변

file그런 file -k다음 시도하십시오dos2unix -ih

file일반적으로 충분합니다. 그러나 어려운 경우에는 file -k또는을 시도하십시오 dosunix -ih.

자세한 내용은 아래를 참조하십시오.


시험 file -k

짧은 버전 : file -k somefile.txt 당신에게 말할 것입니다.

  • with CRLF line endingsDOS / Windows 줄 끝 을 출력 합니다.
  • with LF line endingsMAC 줄 끝을 출력 합니다.
  • 그리고 Linux / Unix 라인 “CR”의 경우 출력 text됩니다. (따라서 명시 적으로 언급하지 않으면 “CR 줄 끝”line endings 이라는 의미가 암시 적으로 나타납니다 .

긴 버전 은 아래를 참조하십시오.


실제 예 : 인증서 인코딩

때로는 PEM 인증서 파일을 확인해야합니다.

정규 문제 file 는 이것입니다. 때로는 너무 똑똑하거나 너무 구체적이려고합니다.

약간의 퀴즈를 시도해 봅시다 : 파일이 있습니다. 그리고이 파일들 중 하나는 줄 끝이 다릅니다. 어느 것?

(이것은 내 일반적인 “인증서 작업”디렉토리 중 하나입니다.)

정기적으로 시도해 봅시다 file.

$ file -- *
0.example.end.cer:         PEM certificate
0.example.end.key:         PEM RSA private key
1.example.int.cer:         PEM certificate
2.example.root.cer:        PEM certificate
example.opensslconfig.ini: ASCII text
example.req:               PEM certificate request

허. 줄 끝을 알려주지 않습니다. 그리고 나는 그것이 인증서 파일이라는 것을 이미 알고있었습니다 . 그 말을하기 위해 “파일”이 필요하지 않았습니다.

다른 무엇을 시도 할 수 있습니까?

다음 dos2unix과 같이 --info스위치를 사용해보십시오 .

$ dos2unix --info -- *
  37       0       0  no_bom    text    0.example.end.cer
   0      27       0  no_bom    text    0.example.end.key
   0      28       0  no_bom    text    1.example.int.cer
   0      25       0  no_bom    text    2.example.root.cer
   0      35       0  no_bom    text    example.opensslconfig.ini
   0      19       0  no_bom    text    example.req

yup, “0.example.end.cer”는 이상한 사람이어야합니다. 그러나 어떤 종류의 줄 끝이 있습니까? 수행 마음에 의해 DOS2UNIX 출력 형식을 알아? (아니요)

그러나 다행히도 --keep-going(또는 -k짧은) 옵션이 있습니다 file.

$ file --keep-going -- *
0.example.end.cer:         PEM certificate\012- , ASCII text, with CRLF line terminators\012- data
0.example.end.key:         PEM RSA private key\012- , ASCII text\012- data
1.example.int.cer:         PEM certificate\012- , ASCII text\012- data
2.example.root.cer:        PEM certificate\012- , ASCII text\012- data
example.opensslconfig.ini: ASCII text\012- data
example.req:               PEM certificate request\012- , ASCII text\012- data

우수한! 이제 홀수 파일에 DOS ( CRLF) 줄 끝 이 있음을 알았습니다 . (그리고 다른 파일은 Unix ( LF) 줄 끝이 있습니다. 이것은이 출력에서 ​​명시 적이 지 않습니다. 암시 적입니다. file“일반적인”텍스트 파일을 기대하는 방식 일뿐 입니다.)

(내 니모닉을 공유하려면 “L”은 “Linux”및 “LF”입니다.)

이제 범인을 변환하고 다시 시도해 보겠습니다.

$ dos2unix -- 0.example.end.cer

$ file --keep-going -- *
0.example.end.cer:         PEM certificate\012- , ASCII text\012- data
0.example.end.key:         PEM RSA private key\012- , ASCII text\012- data
1.example.int.cer:         PEM certificate\012- , ASCII text\012- data
2.example.root.cer:        PEM certificate\012- , ASCII text\012- data
example.opensslconfig.ini: ASCII text\012- data
example.req:               PEM certificate request\012- , ASCII text\012- data  

좋은. 이제 모든 인증서에는 유닉스 라인 엔딩이 있습니다.

시험 dos2unix -ih

위의 예를 작성할 때 이것을 알지 못했지만 다음과 같습니다.

실제로 dos2unix는 -ih(short --info=h)를 다음과 같이 사용하면 헤더 행을 제공합니다 .

$ dos2unix -ih -- *
 DOS    UNIX     MAC  BOM       TXTBIN  FILE
   0      37       0  no_bom    text    0.example.end.cer
   0      27       0  no_bom    text    0.example.end.key
   0      28       0  no_bom    text    1.example.int.cer
   0      25       0  no_bom    text    2.example.root.cer
   0      35       0  no_bom    text    example.opensslconfig.ini
   0      19       0  no_bom    text    example.req

또 다른 “실제로”순간 : 헤더 형식은 정말 기억하기 쉽습니다. 다음 두 가지 니모닉이 있습니다.

  1. DUMB입니다 (왼쪽에서 오른쪽으로 : Dos, d는 Unix, m은 Mac, b는 BOM).
  2. 또한 “DUM”은 D, U 및 M의 알파벳 순서입니다.

추가 자료


답변

당신이 사용할 수있는 xxd파일의 16 진 덤프를 표시하고 “0d0a”또는 “0a”문자를 찾는 데 .

cat -v <filename>@warriorpostman이 제안한대로 사용할 수 있습니다 .