리눅스 쉘 텍스트 문서 출력시 문자열 다루기

|

cat 명령어로 문서 출력시 문자열을 가공하고 추출하는 방법 
( 꼭 cat 명령어뿐만 아니라 ls 등 화면상으로 출력되는 모든 결과물에에 적용된다. )

1. 출력

cat 문서명

 

2. 특정 문자열이 포함된 라인만 출력

cat 문서명 | grep 포함문자열

 

3. 특정 문자열이 없는 라인만 출력

cat 문서명 | grep -v 제외문자열

 

4. 문자열 구분자로 잘라서 부분 출력

cat 문서명 | cut -f 2 -d " "    <= 공백을 구분자로 잘라서 2번째 부분을 출력

 

5. 문자열을 정렬

cat 문서명 | sort -n

 

6. 같은 문자열 끼리 그룹하여 출력 (출력시 같은 문자열이 연속될 경우에만 합쳐짐으로 정렬후 그룹하는게 정확하다 )

cat 문서명 | uniq  <= 그룹된 문자열을 갯수를 알고 싶다면 uniq -c

 

예)  aaa.txt 문서에서 

insert 라는 문자가 포함되고, 

uuid 라는 문자는 포함되지 않은 문자열만 추출하여

(/) 문자로 분리하고,

분리된 내용중 5번째 단어만 추출한뒤,

정렬하고,

같은 문자열은 반복 출력하지 않고, 중복된 수만 표시 하려면

cat aaa.txt | grep insert | grep -v uuid | cut -f 5 -d "/" | sort -n | uniq -c

 

라고 입력하면된다.

And