본문 바로가기
language/Python

[Python] lxml이란?

by 스파이디웹 2021. 1. 12.
728x90

XML 및 lxml이란?

-XML이란 단순한 문자열을 넘어서서, 내부적으로 트리 구조를 가지고 있는 파일을 표현하기 위해 사용하는 마크업 언어입니다.

 

-웹페이지를 보여주기 위해 사용되는 html 파일이 XML의 가장 대표적인 예시입니다.

 

-우리가 친숙하게 사용하는 MS Office의 워드, 엑셀, 파워포인트 파일(docx, xlsx, pptx)도 XML의 일종입니다.

 

-따라서 XML을 해석하는 프로그램(parser라고 부릅니다.)을 미리 준비해야 html, docx, xlsx, pptx와 같이 우리가 흔히 다루는 파일을 처리할 수 있습니다.

 

-Python에서 XML parser로서 주로 이용되는 패키지는 lxml입니다.

 

lxml다운로드 사이트

pypi.org/project/lxml/

 

lxml

Powerful and Pythonic XML processing library combining libxml2/libxslt with the ElementTree API.

pypi.org

다운로드 위치: 각자 설정에 따라 다르겠지만 보통

C:\Users\사용자이름\PycharmProjects\jumptopython\venv\Scripts 처럼 가상환경(venv)밑의 scripts 디렉토리에 설치

 

출처(참조):

pasta.tistory.com/6

728x90

댓글