728x90
XML 및 lxml이란?
-XML이란 단순한 문자열을 넘어서서, 내부적으로 트리 구조를 가지고 있는 파일을 표현하기 위해 사용하는 마크업 언어입니다.
-웹페이지를 보여주기 위해 사용되는 html 파일이 XML의 가장 대표적인 예시입니다.
-우리가 친숙하게 사용하는 MS Office의 워드, 엑셀, 파워포인트 파일(docx, xlsx, pptx)도 XML의 일종입니다.
-따라서 XML을 해석하는 프로그램(parser라고 부릅니다.)을 미리 준비해야 html, docx, xlsx, pptx와 같이 우리가 흔히 다루는 파일을 처리할 수 있습니다.
-Python에서 XML parser로서 주로 이용되는 패키지는 lxml입니다.
lxml다운로드 사이트
다운로드 위치: 각자 설정에 따라 다르겠지만 보통
C:\Users\사용자이름\PycharmProjects\jumptopython\venv\Scripts 처럼 가상환경(venv)밑의 scripts 디렉토리에 설치
출처(참조):
728x90
'language > Python' 카테고리의 다른 글
python 2 vs python 3 주요 차이점 (0) | 2021.08.19 |
---|---|
[Python] 조건문(if)-제어문,분기문과 차이, 반복문(while문,for문), 예외처리(try, except, else, finally) 개념과 예제 (0) | 2021.01.13 |
[Python] 파이썬의 자료형과 예제 (0) | 2021.01.12 |
[Python] (Web Scraping, 데이터 크롤링) Selenium vs Scrapy vs Beautiful Soup (0) | 2021.01.12 |
[python]파이썬이란? 파이썬으로 할 수 있는 것들과 할 수 없는 것들 (0) | 2021.01.03 |
댓글