본문 바로가기
728x90

전체 글334

[git,github] 2) git, github(깃,깃허브) 실습하기 (로컬 저장소, 원격 저장소에 저장 및 형상 관리 방법) 이번 시리즈는 총 3개의 시리즈로 이뤄져 있습니다. 1. git,git hub의 개념, 명령어, 설치와 가입 및 리포지토리를 생성하기 2. git, git hub 실습 3. git, github을 이용한 협업 그 중 이번 포스트는git, git hub 실습을 해보겠습니다. 1편 개념, 명령어, 다운로드, 가입, 리포지토리 생성 https://spidyweb.tistory.com/210 [git,github] 1) git, github(깃,깃허브) 개념,명령어,다운로드, 가입 총 정리 이번 시리즈는 총 3개의 시리즈로 이뤄져 있습니다. 1. git,git hub의 개념, 명령어, 설치와 가입 및 리포지토리를 생성하기 2. git, git hub 실습 3. source tree(형상관리 GUI 도구) 사용법.. 2021. 10. 26.
[Python] (.ipynb) jupyter notebook 파일 형식 -> (.py) 파이썬 스크립트 변환하기 .ipynb 파일은 jupyter notebook에 사용되는 파일 형식으로써 key:value 형식인 json파일 형식으로 표현됩니다. 따라서 git hub 에 올리게 될 경우 다음 사진과 같이 표현되어 python code를 알아보기 힘듭니다. 그럼 .ipynb를 .py로 변환 해보겠습니다. 1. nbconverter 다운받기 1) pip를 사용할 수 있는 jupyter notebook 내의 터미널로 접속 2) pip install nbconvert 2. .py로 변환하기 1) 디렉토리 이동 변환하기 전에 터미널에서 cd (ipynb가 있는 디렉토리) 를 통해 변환할 .ipynb파일이 있는 디렉토리로 이동 2) 변환하기 jupyter nbconvert --to script gittest.ipynb 파일.. 2021. 10. 26.
[BigData] Apache Airflow 설치 및 실습 하기 series (1) Airflow란? DAG란? 안녕하세요 이번 포스트에는 Airflow의 개념에 대해서 알아보고 어떤 역할을 하는지, 그리고 핵심인 DAG파일에 대해서 알아보겠습니다. 1. Apahce Airflow란? 에어비앤비에서 python기반으로 개발한 워크플로우 스케줄링, 모니터링 플랫폼 workflow management tool oozie와 luigi와 같이 데이터파이프라인을 구성할 때 사용된다. 2. airflow 의 특징 및 장점 airflow 파이프라인(동작순서, 방식)을 파이썬 코드를 이용하여 DAG를 구성하기 때문에 동적인 구성이 가능 oozie와 같은 ui로 구성하는 것에 비해 비교적 큰 파이프라인을 코드로써 편하게 구성할 수 있다. airflow webserver가 있어 웹 UI를 표현하고, workflow 상태를 표시,실행.. 2021. 10. 17.
[BigData] Apache Airflow 설치 및 실습하기 series (2) Airflow 2.1 ubuntu 20.04에 설치하기 안녕하세요 이번 포스트에는 Airflow만 독단적으로 설치해보겠습니다. 다음포스트에는 DAG파일을 집중분석하여 실습해보도록 하겠습니다. 준비사항 우분투 20.04 LTS 서버와 충분한 디스크 공간 sudo 와 root접근 권한이 있는 계정 Python:3.6,3.7,3.8 버전(3.9는 지원안한다) PostgreSQL(9.6,10,11,12,13), MySQL(5.7,8), SQLite(3.15.0+) *우리는 Apache Airflow에 MySQL 5.7버전을 사용할 것입니다. 혹시 ubuntu가 깔려있지 않으시다면 아래의 글을 참고해주세요. 2021.04.26 - [BigData] - [Hadoop] virtual box linux [ubuntu 18.04]에 하둡 설치,다운로드 1.virtualbo.. 2021. 10. 17.
[BigData] 완전 분산 하둡 클러스터(hadoop cluster)(4개 노드) 에 "Hive" 설치 및 실습 하기 저번 포스트까지는 하둡 클러스터를 구성해보았습니다. 이번 포스트에는 구성된 하둡 클러스터에 Hive를 설치해보겠습니다. 아직 hadoop cluster 구축이 안되신 분은 아래의 링크를 참고해주세요. https://spidyweb.tistory.com/266 [BigData] Centos-7 fully distributed hadoop cluster 구성하기(하둡 클러스터) 1. 4개의 가상 노드 띄우기 이번 포스트에는 하둡 fully-distributed mode 구축을 해보도록 하겠습니다. 하둡 구성 스펙 호스트OS - windows10 home 게스트OS들 - centOS7 Hadoop - 3.1.0 Zookeeper - 3.4.10 jdk - 1.8.0_191 호스트OS는 공.. spidyweb... 2021. 10. 11.
[Hive] Hive의 성능(테이블) (3) bucketing(버켓팅),skew(스큐), serde(서데), join type(맵 조인, 셔플 조인, 정렬-병합 조인)정리 이번 포스트에는 이전 포스트에서 전부 다루지는 못했던, Hive의 성능에 관한 것들을 위주로 다루어 보겠습니다. *Hive의 개념을 모르신다면 아래를 참조해주세요 2021.07.12 - [BigData] - [Hive] Hive란?(1) 개념, 구성요소, 등장배경, 버전 [Hive] Hive란?(1) 개념, 구성요소, 등장배경, 버전 1. Hive란? -하이브는 하둡 에코시스템 중에서 데이터를 모델링하고 프로세싱하는 경우 가장 많이 사용하는 데이터 웨어하우징용 솔루션입니다. -RDB의 데이터베이스, 테이블과 같은 형태로 HDFS에 spidyweb.tistory.com *Hive의 메타스토어, Partition에 대해서 모르신다면 아래를 참조해주세요. 2021.06.27 - [BigData] - [Hive.. 2021. 10. 5.
[Python] PIP란? Virtualenv란? 개념,활용 이번 포스트는 Python 에서 중요한 부분인 패키징에 대해서 그 중에서도 PIP와 virtualenv가 무엇이고 어떻게 활용 하게 되는지에 대해 알아보겠습니다. 1. PIP란? pip는 Python Package Index (PyPI) 저장소로부터 파이썬 패키지를 받아 설치하는 패키지 관리 도구 PyPI는 third-party 파이썬 오픈소스 패키지들을 위한 저장소 PIP와 대응되는 개념은 Ruby(RubyGems), PHP(Packagist), Perl(CPAN), Node.js(NPM) 보통의 pip install (package)를 통해 package를 설치하게 되면, 아나콘다의 경우, C:\Users\유저\Anaconda3\Lib\site-packages/package 와 같은 형태로 설치가 된.. 2021. 9. 24.
[Docker] docker file로 image build하기 (ubuntu:18.04 image에 git설치 실습) 이번 포스트에는 docker file로 image를 빌드 해보겠습니다. 도커 환경 설치에 대해 모르신다면 아래의 링크를 참조 https://spidyweb.tistory.com/277 [Linux] Docker란? ubuntu 18.04 에서 도커 설치하기, centos-7 에서 도커 설치하기 이번 포스트에는 docker에 대해 설명하고, ubuntu와 centos에 설치해보도록 하겠습니다. 1. Docker란 Docker는 응용 프로그램들을 소프트웨어 컨테이너 안에 배치시키는 일을 자동화하는 오픈 소스 프로 spidyweb.tistory.com 도커 이미지, 컨테이너 개념에 대해 모르신다면 아래의 링크를 참조 https://spidyweb.tistory.com/278 [Docker] docker 이미지.. 2021. 9. 15.
[Docker] docker 이미지 저장(commit), docker hub에 이미지 올리기, docker hub에서 이미지 받아오기 이번 포스트에는 docker 이미지를 저장하는법, 그리고 docker hub사용법에 대해 알아보겠습니다. 도커 환경 설치에 대해 모르신다면 아래의 링크를 참조 https://spidyweb.tistory.com/277 [Linux] Docker란? ubuntu 18.04 에서 도커 설치하기, centos-7 에서 도커 설치하기 이번 포스트에는 docker에 대해 설명하고, ubuntu와 centos에 설치해보도록 하겠습니다. 1. Docker란 Docker는 응용 프로그램들을 소프트웨어 컨테이너 안에 배치시키는 일을 자동화하는 오픈 소스 프로 spidyweb.tistory.com 도커 이미지, 컨테이너 개념에 대해 모르신다면 아래의 링크를 참조 https://spidyweb.tistory.com/278 .. 2021. 9. 14.
728x90