데이터 분석/웹 스크래핑
09. 정규 표현식 - 2
알파고제로
2023. 10. 27. 09:17
■ Dot(.)
- Dot(.) 메타 문자는 줄바꿈 문자인 \n을 제외한 모든 문자와 매치됨을 의미한다.
- [] 사이에 . 을 사용할 경우 문자 원래의 의미인 마침표가 된다.
정규식 | 문자열 | 매치 여부 |
a.b | aab | Yes |
aOb | Yes | |
abc | No |
■ 반복(*)
- *은 *바로 앞에 있는 문자가 0부터 무한대로 반복될 수 있다는 의미이다.
정규식 | 문자열 | 매치 여부 |
ca*t | ct | Yes |
cat | Yes | |
caaat | Yes |
■ 반복(+)
- +는 최소 1번 이상 반복될 때 사용한다.
정규식 | 문자열 | 매치 여부 |
ca+t | ct | No |
cat | Yes | |
caaat | Yes |
■ 반복 횟수 지정 ({m,n})
- {} 메타 문자는 반복 횟수를 지정할 수 있다. {m,n} 정규식을 사용하면 반복 횟수가 m부터 n까지 매치할 수 있다. m 또는 n을 생략하거나 정수 한 개만 쓸 수도 있다. {m,} 이면 반복 횟수가 m이상인 경우이고, {,n}이면 반복 횟수가 n이하를 의미한다.
정규식 | 문자열 | 매치 여부 |
ca{2}t | cat | No |
caat | Yes |
정규식 | 문자열 | 매치 여부 |
ca{2,5}t | cat | No |
caat | Yes | |
caaaaat | Yes |
■ ?
- ? 앞에 문자가 하나 있거나 없을 때 매치된다.
정규식 | 문자열 | 매치 여부 |
go?d | gd | Yes |
god | Yes | |
good | No |
■ $
- $ 앞에 있는 문자로 끝나면 매치된다. 여러 줄의 문자열일 경우 마지막 줄만 적용된다.
정규식 | 문자열 | 매치 여부 |
a$ | a | Yes |
baa | Yes | |
aabb | No |
■ ^
- ^ 다음에 있는 문자로 시작하면 매치된다.
정규식 | 문자열 | 매치 여부 |
^a | aaa | Yes |
abc | Yes | |
good | No |