아래의 튜토리얼을 진행하였다.
http://zvon.org/comp/r/tut-Regexp.html#Pages~Contents
1. 정규표현식은 대소문자를 구분한다.
2. 정규표현식은 공백을 구분한다.
3. ^은 시작 $는 끝을 의미한다.
ex)
^WHO -> WHO로 시작하는 문자열을 찾는다
WHO$ -> WHO로 끝나는 문자열을 찾는다.
4. ^, $, \가 포함된 검색하고 싶을 때는 앞에 \을 붙인다.
ex)
\^, \$, \\
5. .은 모든 문자를 의미한다.
ex)
...... -> 문자 6개
6. . 문자를 검색하고 싶다면 \.
7. [ ] 안에는 문자 하나를 의미한다.
ex)
[oyu] -> o 또는 y 또는 u
8. - 는 범위를 나타낸다.
ex)
[C-K] -> [CDEFGHIJK],
[2-6C-K] -> [23456CDEFGHIJK]
9. [ ] 안에 있는 ^은 not의 의미이다.
ex)
[^CD123] -> CD123이 아닌 문자
[^W-Z] -> WXYZ가 아닌 문자
10. ( ) 안의 | 는 단어를 구분한다.
ex)
(on|ues|rida) -> on 또는 ues 또는 rida
(Mon|Tues|Fri)Day -> MonDay 또는 TuesDay 또는 FriDay
11. 수량자
1)특정 문자 뒤의 * : 특정 문자가 0개 이상 올 수 있다.
ex)
a*b -> b, ab, aab, aaab ...
2) 특정 문자 뒤의 + : 특정 문자가 1개 이상 올 수 있다.
ex)
a+b -> ab, aab, aaab ...
3) 특정 문자 뒤의 ? : 특정 문자가 없거나 1개 올 수 있다
ex)
a?b -> b, ab
4) 특정 문자 뒤의 * : 특정 문자가 0개 이상 올 수 있다.
ex)
-A*- -> --, -A-, -AA- ...
[-@]* -> -, --, -@- ...
15. { } 안의 값은 몇 번 반복 되는 지를 나타낸다.
ex)
a{5} -> aaaaa
[els]{1,3} -> e, l, s, els, eee, ell, sse ...
[a-z]{3,} -> abc, bgzsd, qweqeasdadasd ...
16. *={0,}, +={1,}, ?={0,1}
17. 수량자 뒤에 ? 가 오면 최솟값을 의미함 ( *?=0 ,+?=1, ??=0 ) 게으른 선택자
ex)
r.*? -> r
r.+? -> ra, rb, rc . ..
r.?? -> r
18. \w -> 알파벳, 숫자, _ ( \w = [A-z0-9_] )
19. \W -> \w에 해당하지 않는 문자 (\W =[^A-z0-9_] )
20. \s -> 공백, \S -> 공백이 아닌 문자
21. \d -> 숫자, \D -> 숫자가 아닌 문자
22. \b -> word식별
ex)
\b\n -> ABC DEF GHI
\n\b -> ABC DEF GHI
\b\n+\b
\bcat -> cat concat
cat\b -> cat concat
23. \B -> \b의 반대
24. /A -> 맨 처음 시작을 의미, /Z -> 맨 끝을 의미
ex)
\A... -> 맨 처음이 3글자인지
...\Z -> 맨 처음이 3글자이지
25. ?= -> 검색할 땐 사용하지만 선택에는 사용하지 않음
ex)
\w+(?=X) -> AAAX ---aaax -aaaX
'잡지식' 카테고리의 다른 글
Daemon(데몬) 이란? (0) | 2021.09.11 |
---|---|
LTS, apt , sudo (0) | 2021.09.06 |
댓글