아래 awk
명령은 여기에 설명 된 대로 모든 중복 행 을 제거합니다 .
awk '!seen[$0]++'
텍스트에 빈 줄이 포함되어 있으면 빈 줄을 하나만 제외하고 모두 삭제됩니다.
비어 있지 않은 모든 중복 줄을 삭제하면서 빈 줄 을 모두 유지하려면 어떻게해야awk
합니까? 간단한 설명도 포함하십시오.
답변
다른 옵션은 다음을 확인하는 것입니다 NF
. 예 :
awk '!NF || !seen[$0]++'
답변
대안 적으로
awk '!/./ || !seen[$0]++' file
주요 요령은 동일 seen[$0]++
하며, seen
연관 배열에서 키가 현재 줄 ( $0
) 인 항목을 만듭니다 . 따라서이 !seen[$0]++
줄이 이미 보이면 거짓이됩니다. 는 /./
그래서 라인이 아닌 공백 문자가 포함되어 있는지 여부를 확인하고 있습니다 !/./
비 빈 라인을 일치합니다. 이것과 결합 || !seen[$0]++
하면 빈 줄을 제외한 모든 중복 줄을 무시하고 나머지 줄을 인쇄합니다.
답변
awk '/^[[:blank:]]*$/ { print; next; }; !seen[$0]++'
비어있는 (실제로 비어 있거나 비어있는) 줄을 먼저 확인하기 만하면됩니다.
답변
awk
@Thor의 답변과 유사하지만 덜 간결하지만 더 효율적인 또 다른 솔루션이 있습니다.
awk '!NF {print;next}; !($0 in a) {a[$0];print}' file
이것으로, 우리는 단지 a[$0]
존재 여부를 확인 합니다. 그렇지 않은 경우 초기화 한 다음 인쇄하십시오. 이 경우 참조 a[$0]
가 존재 하지 않을 경우 할당되지 않습니다 .