본문 바로가기
728x90

language/Python34

[Python] PIP란? Virtualenv란? 개념,활용 이번 포스트는 Python 에서 중요한 부분인 패키징에 대해서 그 중에서도 PIP와 virtualenv가 무엇이고 어떻게 활용 하게 되는지에 대해 알아보겠습니다. 1. PIP란? pip는 Python Package Index (PyPI) 저장소로부터 파이썬 패키지를 받아 설치하는 패키지 관리 도구 PyPI는 third-party 파이썬 오픈소스 패키지들을 위한 저장소 PIP와 대응되는 개념은 Ruby(RubyGems), PHP(Packagist), Perl(CPAN), Node.js(NPM) 보통의 pip install (package)를 통해 package를 설치하게 되면, 아나콘다의 경우, C:\Users\유저\Anaconda3\Lib\site-packages/package 와 같은 형태로 설치가 된.. 2021. 9. 24.
python 2 vs python 3 주요 차이점 프로젝트를 하면서 python2 version과 python3 version의 차이 때문에 생긴 에러가 있었는데, 그에 따라 python version 별 차이점을 간단하게 정리해보려고 합니다. 1. 프로젝트에서 발생한 에러 spark 프로젝트를 하면서 L 즉 LongType의 데이터를 다루게 되었습니다. 해당 코드도 그에 맞게 작성 했는데, python 2 version로 script를 돌릴 때는 문제없이 돌 던 것이 default로 설정 되어있던 python 3 version에서는 에러가 발생했습니다. log를 살펴보니,,, LongType에 관한 에러라고 나왔고. python 2 와 3의 차이점을 살펴 보았습니다. PYTHON 2 PYTHON 3 PRINT PRINT가 함수가 아니라 ()없이 ""만.. 2021. 8. 19.
[Python] 조건문(if)-제어문,분기문과 차이, 반복문(while문,for문), 예외처리(try, except, else, finally) 개념과 예제 1. if문 조건문이란? 주어진 조건이 참이나 거짓이냐를 판별하고 판별에 따라 특정 명령을 수행하는 수행문 제어문이란? 제어문은 프로그램의 순차적인 흐름(위->아래)을 인위적으로 제어해야 할 때 사용하는 실행문 제어문에 포함된 것이 바로 조건문, 반복문 분기문이란? 프로그램 중 참(True) 또는 거짓(False)을 반환하는 조건식의 결과에 따라 프로그램을 어떠한 경로로 실행할지 를 결정하는 문 0이 아니거나, null이 아닐 경우에 참(True)값으로 판단하며, 그 반대의 경우에는 거짓(False)값으로 판단 if문의 기본 구조 """ if 조건문: 수행할 문장1 #들여쓰기 space4칸 or tab 수행할 문장2 #들여쓰기 space4칸 or tab ... else: 수행할 문장1 #들여쓰기 spac.. 2021. 1. 13.
[Python] 파이썬의 자료형과 예제 1. 숫자형(number) 항목 파이썬 사용 예 정수(integer) 123,-345,0 실수(floating-number) 123.45,-1234.5,3.4e10 8진수(octal) 0o34,0o25 16진수(hexadecimal) 0x2A,0xFF x의 y제곱을 나타내는 ** 연산자 ex) x = 3 y = 4 x ** y = 81(3의 4제곱) 나눗셈 후 나머지를 반환하는 % 연산자 ex) 7 % 3 == 1 3 % 7 == 3 나눗셈 후 몫을 반환하는 // 연산자 ex) 7 / 4 == 1.75 (몫과 나머지) 7 // 4 == 1(몫) 2. 문자열 자료형(string) 문자열(string)이란 문자,단어 등으로 구성된 문자들의 집합 ex) "life is short, You need python.. 2021. 1. 12.
[Python] (Web Scraping, 데이터 크롤링) Selenium vs Scrapy vs Beautiful Soup scraping이란? crawling이란? 의미적으론 컴퓨터 소프트웨어 기술로 웹 사이트들에서 원하는 정보를 추출하는 것 원하는 데이터를 추출하다, 원하는 데이터를 긁어오다의 의미 차이로는 web crawling 수많은 웹사이트들을 체계적으로 돌아다니면서 URL, 키워드 등을 수집하는 것 (보통 검색 엔진이 웹사이트를 인덱싱하기 위해서 사용됨.) web scraping 웹사이트에서 필요한 데이터를 긁어오는 것 Beautifulsoup HTML, XML파일의 정보를 추출해내는 python library python 내장 모듈인 request나 urllib을 이용해 HTML을 다운 받고, beautifulsoup으로 데이터를 추출 REST API에서 데이터를 가져올 때에도 사용됨 서버에서 HTML을 다운받음.. 2021. 1. 12.
[Python] lxml이란? XML 및 lxml이란? -XML이란 단순한 문자열을 넘어서서, 내부적으로 트리 구조를 가지고 있는 파일을 표현하기 위해 사용하는 마크업 언어입니다. -웹페이지를 보여주기 위해 사용되는 html 파일이 XML의 가장 대표적인 예시입니다. -우리가 친숙하게 사용하는 MS Office의 워드, 엑셀, 파워포인트 파일(docx, xlsx, pptx)도 XML의 일종입니다. -따라서 XML을 해석하는 프로그램(parser라고 부릅니다.)을 미리 준비해야 html, docx, xlsx, pptx와 같이 우리가 흔히 다루는 파일을 처리할 수 있습니다. -Python에서 XML parser로서 주로 이용되는 패키지는 lxml입니다. lxml다운로드 사이트 pypi.org/project/lxml/ lxml Powerf.. 2021. 1. 12.
[python]파이썬이란? 파이썬으로 할 수 있는 것들과 할 수 없는 것들 파이썬이란 인터프리터 언어이다.(한 줄 씩 소스 코드를 해석해서 그때그때 실행해 결과를 바로 확인할 수 있는 언어.) (컴파일 언어,C언어 java) 파이썬의 특징 1. 인간다운(인간의 생각방식에 가까운)언어이다. ex) if 4 in [1,2,3,4]: print("4가 있다.") 2. 문법이 쉽다. 3. 무료이고, 강력하다. 시스템 프로그밍이나 하드웨어 제어와 같은 복잡하고 반복 연산이 많은 프로그램은 파이썬과 안 어울린다. 그래서 이러한 약점을 극복할 수 있게끔 다른 언어로 만든 프로그램을 파이썬 프로그램에 포함시킬 수 있다. (C와 찰떡궁합) 4. 간결하다. 의도적으로 간결하게 만들었기 때문에 파이썬은 가장 좋은 방법 1가지만 사용하는 것을 선호한다. ex) languages = ['python'.. 2021. 1. 3.
728x90