본문 바로가기
728x90

전체 글334

[BigData] 완전 분산 하둡 클러스터(hadoop cluster)구축하기(4개 노드) 7. 하둡 설치, 배포, 환경설정, 실행하기 이번 포스트에는 hadoop 설치, 배포, 환경설정, 실행하기를 해보겠습니다. 아직 zookeeper 설치,환경설정,실행을 완료해보지 못했다면 아래의 링크를 참고해주세요. https://spidyweb.tistory.com/271 [BigData] Centos-7 fully distributed hadoop cluster 구성하기(하둡 클러스터) 6. Zookeeper 설치, 환경설정, 실행 이번 포스트에는 zookeeper 를 설치하고, 환경설정하여 실행 해보겠습니다. 아직 zookeeper 및 hadoop 계정 생성과 권한 설정을 완료하지 못했다면 아래의 링크를 참고해주세요. https://spidyweb.tistory.com/27 spidyweb.tistory.com 하둡 구성 스펙 호스트OS - .. 2021. 8. 12.
[BigData] 완전 분산 하둡 클러스터(hadoop cluster)구축하기(4개 노드) 6. Zookeeper 설치, 환경설정, 실행 이번 포스트에는 zookeeper 를 설치하고, 환경설정하여 실행 해보겠습니다. 아직 zookeeper 및 hadoop 계정 생성과 권한 설정을 완료하지 못했다면 아래의 링크를 참고해주세요. https://spidyweb.tistory.com/270 [BigData] Centos-7 fully distributed hadoop cluster 구성하기(하둡 클러스터) 5. Zookeeper, hadoop 계정 생성 및 이번 포스트에는 Zookeeper, hadoop 계정을 생성 하고 권한 설정 및 SSH 통신 설정을 해보겠습니다. 아직 JAVA 설치 및 환경 설정을 하지 못했다면 아래의 링크를 참고해주세요. https://spidyweb.tistory.com/269 spidyweb.tistory.com 하.. 2021. 8. 11.
[BigData] 완전 분산 하둡 클러스터(hadoop cluster)구축하기(4개 노드) 5. Zookeeper, hadoop 계정 생성 및 이번 포스트에는 Zookeeper, hadoop 계정을 생성 하고 권한 설정 및 SSH 통신 설정을 해보겠습니다. 아직 JAVA 설치 및 환경 설정을 하지 못했다면 아래의 링크를 참고해주세요. https://spidyweb.tistory.com/269 [BigData] Centos-7 fully distributed hadoop cluster 구성하기(하둡 클러스터) 4. JAVA 설치 및 환경 설정 안녕하세요 이번 포스트에는 Java 설치 및 환경 설정을 해보도록 하겠습니다. 아직 SSH 설정 방화벽 및 SELINUX 설정을 완료 못하셨으면 아래의 링크를 참고해주세요. https://spidyweb.tistory.com/268 [BigData spidyweb.tistory.com 하둡 구성 스펙 호스트.. 2021. 8. 11.
[BigData] 완전 분산 하둡 클러스터(hadoop cluster)구축하기(4개 노드) 4. JAVA 설치 및 환경 설정 안녕하세요 이번 포스트에는 Java 설치 및 환경 설정을 해보도록 하겠습니다. 아직 SSH 설정 방화벽 및 SELINUX 설정을 완료 못하셨으면 아래의 링크를 참고해주세요. https://spidyweb.tistory.com/268 [BigData] Centos-7 fully distributed hadoop cluster(하둡 클러스터) 구성하기 3. SELINUX, 방화벽, SSH 설정하기 이번 포스트에는 SELINUX, 방화벽, SSH설정을 해보겠습니다. 아직 고정ip할당 및 hostname 변경을 하지 못하셨다면 아래의 링크를 참고해주세요. https://spidyweb.tistory.com/267 [BigData] Centos-7 fully dist.. spidyweb.tistory.com 하둡.. 2021. 8. 11.
[BigData] 완전 분산 하둡 클러스터(hadoop cluster)구축하기(4개 노드) 3. SELINUX, 방화벽, SSH 설정하기 이번 포스트에는 SELINUX, 방화벽, SSH설정을 해보겠습니다. 아직 고정ip할당 및 hostname 변경을 하지 못하셨다면 아래의 링크를 참고해주세요. https://spidyweb.tistory.com/267 [BigData] Centos-7 fully distributed hadoop cluster(하둡 클러스터) 구성하기 2. Hostname, 고정ip할당하기 이번 포스트에는 각 노드에 hostname 변경 및 고정 ip할당하도록 하겠습니다. 아직 4개의 노드를 띄우지 못하신 분은 아래의 링크를 참고해주세요. https://spidyweb.tistory.com/266 [BigData] Centos-7 fully di.. spidyweb.tistory.com 하둡 구성 스펙 호스트OS - win.. 2021. 8. 9.
[BigData] 완전 분산 하둡 클러스터(hadoop cluster)구축하기(4개 노드) 2. Hostname, 고정ip할당하기 이번 포스트에는 각 노드에 hostname 변경 및 고정 ip할당하도록 하겠습니다. 아직 4개의 노드를 띄우지 못하신 분은 아래의 링크를 참고해주세요. https://spidyweb.tistory.com/266 [BigData] Centos-7 fully distributed hadoop cluster 구성하기(하둡 클러스터) 1. 4개의 가상 노드 띄우기 이번 포스트에는 하둡 fully-distributed mode 구축을 해보도록 하겠습니다. 하둡 구성 스펙 호스트OS - windows10 home 게스트OS들 - centOS7 Hadoop - 3.1.0 Zookeeper - 3.4.10 jdk - 1.8.0_191 호스트OS는 공.. spidyweb.tistory.com 하둡 구성 스펙 호스트OS .. 2021. 8. 9.
[BigData] 완전 분산 하둡 클러스터(hadoop cluster)구축하기(4개 노드) 1. 4개의 가상 노드 띄우기 이번 포스트에는 하둡 fully-distributed mode 구축을 해보도록 하겠습니다. 하둡 구성 스펙 호스트OS - windows10 home 게스트OS들 - centOS7 Hadoop - 3.1.0 Zookeeper - 3.4.10 jdk - 1.8.0_191 호스트OS는 공유기(WI-FI) 연결 환경 서버 4대를 활용한 하둡 HA 구성: namenode1: 액티브 네임노드, 저널노드 역할 rmnode1: 스탠바이 네임노드, 리소스 매니저, 저널노드 역할, 데이터 노드 역할 datanode1: 저널노드 역할, 데이터 노드 역할 datanode2: 데이터 노드 역할 총 4개의 노드를 이용하여 HA(고가용성)구성을 한 하둡 클러스터를 구성 해보겠습니다. 1. VirtualBox Host Only Ne.. 2021. 8. 8.
[Data] 데이터 마트의 구축(치환, 추가, 스냅샷 테이블, 이력테이블) 이번 포스트에서는 '시각화를 위해 데이터 마트를 만드는 절차'에 대해서 포스트 하겠습니다. 팩트 테이블 -팩트 테이블의 작성에는 추가(append)와 치환(replace) 가 있다. -추가: 새로 도착한 데이터만을 증분으로 추가 INSERT INTO 를 통해 기존의 테이블에 데이터가 추가되는 형태 -치환: 과거의 데이터를 포함하여 테이블 전체를 치환한다. DROP TABLE IF EXISTS tablename 을 통해 삭제 후, CREATE TABLE IF NOT EXISTS tablename을 통해 다시 만드는 과정이 '치환' 테이블 파티셔닝(table partitioning) -효율만을 생각 했을 때는 추가가 압도적으로 유리, 하지만 단점 또한 존재 단점 1. 추가에 실패한 것을 알아채지 못하면 팩트.. 2021. 8. 8.
[Data] 마스터 데이터 vs 트랜잭션 데이터, fact테이블 vs dimension 테이블, 시계열 데이터란? 마스터 데이터란? 트랜잭션 데이터란? 트랜잭션 데이터(transaction data): 시간과 함께 생성되는 데이터를 기록한 것 한 번 기록하면 시간과 함께 생성되기에 변화하지 않는다. 트랜잭션 데이터 는 트랜잭션에서 수집한 정보입니다. 거래가 진행된 시간, 발생한 장소, 구매한 항목의 기준 소매 가격, 사용된 지불 방법, 할인(있는 경우), 거래와 관련된 기타 수량 및 품질이 기록 트랜잭션 데이터는 일반적으로 정형 데이터 범주에 속합니다. 몇 가지 예는 다음과 같습니다. 금융 트랜잭션 데이터: 보험 비용 및 청구 데이터, 또는 구매 또는 판매 데이터, 은행의 경우 입출금 데이터물류 트랜잭션 데이터: 배송 상태 데이터, 배송 파트너 데이터업무 관련 트랜잭션 데이터: 직원 시간 추적 ex) 판매 이력 마스.. 2021. 8. 6.
728x90