상세 컨텐츠

본문 제목

05. DOM(Document Object Model)

데이터 분석/웹 스크래핑

by 알파고제로 2023. 10. 25. 08:53

본문

■ DOM의 개념

  • DOM은 HTML, XML 문서의 모든 요소의 속성, 텍스트를 각각의 객체로 만들고 이 객체 들을 부모 자식 관계로 표현할 수 있는 트리 구조로 구성한 것
  • 개발자가 정적인 HTML문서와 동적으로 만들어서 생성되는 문서 등이 웹 브라우저에서 Parsing(구문 분석)되어 컴파일된 결과가 화면에 출력되는데 이렇게 빌드 처리를 거치고 난 후 화면에 출력되는 최종 결과물이 DOM이다.

 

 DOM의 노드 트리

  • DOM은 하나의 요소가 다른 요소를 포함하는 형태로 표현되는데 이러한 구조를 트리구조라고 한다.
  • DOM은 최상위에 html 요소를 root로 하여 여러 자식요소를 포함하는 형태를 띈다.
  • 포함하는 요소를 부모요소(parent), 포함되는 요소를 자식요소(child), 부모가 같은 요소들을 형제 요소(sibling)라고 한다.
  • 웹 브라우저는 개발자가 의도치 않게 빠트린 DOM 요소를 자동으로 삽입해준다 (ex. tbody)
<!DOCTYPE html>
<html>
<head>
    <meta charset="UTF-8">
    <meta name="viewport" content="width=device-width, initial-scale=1.0">
    <title>문서의 타이틀</title>
</head>
<body>
    <h1>청산별곡</h1>
    <div>살어리 살어리랏다. <b>청산<b>에 살어리랏다 <i>멀위</i>랑 다래랑 먹고
          <em>청산</em>에 살어리랏다.
    </div>
</body>
</html>

'데이터 분석 > 웹 스크래핑' 카테고리의 다른 글

06. HTTP 요청/응답  (0) 2023.10.25
04. Web 구성 요소 - 3  (0) 2023.10.25
03. Web 구성 요소 - 2  (0) 2023.10.24

관련글 더보기

댓글 영역