상세 컨텐츠

본문 제목

09. 정규 표현식 - 2

데이터 분석/웹 스크래핑

by 알파고제로 2023. 10. 27. 09:17

본문

■ Dot(.)

  • Dot(.) 메타 문자는 줄바꿈 문자인 \n을 제외한 모든 문자와 매치됨을 의미한다.
  • [] 사이에 . 을 사용할 경우 문자 원래의 의미인 마침표가 된다.
정규식 문자열 매치 여부
a.b aab Yes
aOb Yes
abc No

 

 반복(*)

  • *은 *바로 앞에 있는 문자가 0부터 무한대로 반복될 수 있다는 의미이다.
정규식 문자열 매치 여부
ca*t ct Yes
cat Yes
caaat Yes

 

 반복(+)

  • +는 최소 1번 이상 반복될 때 사용한다.
정규식 문자열 매치 여부
ca+t ct No
cat Yes
caaat Yes

 

 반복 횟수 지정 ({m,n})

  • {} 메타 문자는 반복 횟수를 지정할 수 있다. {m,n} 정규식을 사용하면 반복 횟수가 m부터 n까지 매치할 수 있다. m 또는 n을 생략하거나 정수 한 개만 쓸 수도 있다. {m,} 이면 반복 횟수가 m이상인 경우이고, {,n}이면 반복 횟수가 n이하를 의미한다.
정규식 문자열 매치 여부
ca{2}t cat No
caat Yes
정규식 문자열 매치 여부
ca{2,5}t cat No
caat Yes
caaaaat Yes

 

 ?

  • ? 앞에 문자가 하나 있거나 없을 때 매치된다.
정규식 문자열 매치 여부
go?d gd Yes
god Yes
good No

 

■ $

  • $ 앞에 있는 문자로 끝나면 매치된다. 여러 줄의 문자열일 경우 마지막 줄만 적용된다.
정규식 문자열 매치 여부
a$ a Yes
baa Yes
aabb No

 

■ ^

  • ^ 다음에 있는 문자로 시작하면 매치된다.
정규식 문자열 매치 여부
^a aaa Yes
abc Yes
good No

'데이터 분석 > 웹 스크래핑' 카테고리의 다른 글

10. 정규 표현식 - 3  (0) 2023.10.30
08. 정규 표현식 - 1  (0) 2023.10.26
07. Web Scrapping  (0) 2023.10.26

관련글 더보기

댓글 영역