본문 바로가기
728x90

전체 글334

[Data]데이터 수집 절차 프로젝트의 프로세스 정의 일반적인 프로젝트와 데이터 수집이 포함된 프로젝트의 프로세스를 일반화하기 어려우므로 세 가지 부분으로 나누어 일반화 시켜보자. 여기서는 데이터 입력, 데이터 처리, 서비스 제공으로 나누어 보았다. -데이터입력 일반 프로젝트 사용자가 데이터 발생의 주체가 되며 데이터 입력자가 데이터에 대한 오너십을 가진다. 데이터는 트랜잭셕 하나에 한 건씩 발생시킨다. 수집관련 프로젝트 수집 프로세스 자체가 데이터 발생의 주체가 되며 수집 정책에 관련된 기술에 대한 데이터 오너십이 존재한다. 데이터는 프로세스 하나에서 여러건 발생 할 수 있다. -데이터처리 일반 프로젝트 입력된 데이터의 사전처리 및 사후처리 과정이 거의 존재하지 않으며 원본 데이터의 변경이 이뤄지지 않는다. 수집관련 프로젝트 대부.. 2021. 1. 5.
[Data]데이터의 특징과 종류, 수집 일반적인 데이터의 특징구분정성적 데이터정량적 데이터형태비정형 데이터정형ㆍ반정형 데이터특징객체 하나에 함의된 정보를 갖고 있다.속성이 모여 객체를 이룬다.구성언어, 문자 등으로 이루어짐수치, 도형, 기호 등으로 이루어짐저장 형태파일, 웹데이터베이스, 스프레드시트소스 위치외부 시스템(주로 소셜 데이터)내부 시스템(주로 DBMS)수집활동에서 데이터의 특징구분가역적 데이터불가역적 데이터환원 가능성의존성원본 데이터와의 관계처리 과정활용 분야구분가역적 데이터불가역적 데이터환원 가능성가능하다불가능하다의존성원본 데이터에 의존적원본 데이터에 독립적원본 데이터와의 관계1:1 관계1:N 혹은 N:1처리 과정탐색병합활용 분야데이터 웨어하우징, 로그 수집소셜 분석, 텍스트 마이닝데이터 수집을 위해 가장 먼저 고려해야 할 사항은.. 2021. 1. 5.
[python]파이썬이란? 파이썬으로 할 수 있는 것들과 할 수 없는 것들 파이썬이란 인터프리터 언어이다.(한 줄 씩 소스 코드를 해석해서 그때그때 실행해 결과를 바로 확인할 수 있는 언어.) (컴파일 언어,C언어 java) 파이썬의 특징 1. 인간다운(인간의 생각방식에 가까운)언어이다. ex) if 4 in [1,2,3,4]: print("4가 있다.") 2. 문법이 쉽다. 3. 무료이고, 강력하다. 시스템 프로그밍이나 하드웨어 제어와 같은 복잡하고 반복 연산이 많은 프로그램은 파이썬과 안 어울린다. 그래서 이러한 약점을 극복할 수 있게끔 다른 언어로 만든 프로그램을 파이썬 프로그램에 포함시킬 수 있다. (C와 찰떡궁합) 4. 간결하다. 의도적으로 간결하게 만들었기 때문에 파이썬은 가장 좋은 방법 1가지만 사용하는 것을 선호한다. ex) languages = ['python'.. 2021. 1. 3.
[데이터베이스] 데이터 표준 관리 도구 -데이터 표준 관리 도구는 수립된 전사 데이터 표준 정보의 관리, 데이터 표준에 의한 개발 및 유지보수 지원, 데이터 표준 준수 및 변경 영향도 평가를 담당하는 기능으로 구성된다. -최근에는 이러한 데이터 표준 관리 기능과 더불어 애플리케이션 정보, 데이터 흐름 정보, 각종 데이터에 대한 메타 정보에 대한 조회 기능을 갖는 시스템을 도입하여 활용하고 있다. 확장된 데이터 표준 관리 도구의 기능 -최근에는 이러한 데이터 표준 관리 기능 외에 애플리케이션 정보, 데이터 흐름 정보, 각종 데이터 에 대한 메타(Meta) 정보에 대한 조회 기능을 갖는 메타 데이터 시스템을 도입하여 활용하고 있다. [그림 3-1-3] 데이터 표준 관리 시스템 구성 기능명 설명 데이터 모델 관리 데이터 표준 관리 도구를 이용하여 .. 2020. 12. 13.
[데이터베이스]데이터 표준화 개념 데이터 표준화 정의 -데이터 표준화는 시스템별로 산재해 있는 데이터 정보 요소에 대한 명칭, 정의, 형식, 규칙에 대한 원칙을 수립하여 이를 전사적으로 적용하는 것을 의미한다. -이러한 데이터 표준화 작업은 데이터의 정확한 의미를 파악할 수 있게 할 뿐만 아니라 데이터에 대한 상반된 시각을 조정하는 역할을 수행한다. 데이터 명칭 데이터 명칭은 해당 기업 내에서 데이터를 유일하게 구별해주는 이름이다. 따라서 데이터 명칭에 대한 표준화는 동음이의어 및 이음동의어의 조정을 필요로 한다. 데이터 명칭은 일반적으로 다음의 원칙에 부합되어야 한다. 유일성 -데이터 명칭은 해당 개념을 유일하게 구분해 주는 이름이어야 한다. -하나의 개념에 대해 모든 사용자들이 통일된 용어를 사용할 수 있도록 오직 하나의 명칭만을 허.. 2020. 12. 13.
[데이터베이스] 데이터 표준화 필요성 데이터 활용상의 문제점 데이터의 중복 및 조직, 업무, 시스템별 데이터 불일치 발생 -데이터 표준 정책의 미비로 정보시스템 개발 및 운영 과정상에서 동일한 의미의 데이터를 다른 명칭으로 중복 관리하거나 동일한 명칭의 데이터를 시스템간에 상이한 로직으로 산출하여 다른 의미로 활용한다. 데이터에 대한 의미 파악 지연으로 정보 제공의 적시성 결여 -데이터 명칭, 데이터 정의에 대한 표준 미관리로 인해 새로운 정보 요건이나 정보 요건 변경시 필요 데이터를 파악하는데 많은 시간을 낭비하여 정보 사용자에게 적시에 정확한 정보를 제공하는데 어려움이 있다. 데이터 통합의 어려움 -단위 시스템 위주의 데이터 표준을 적용하거나 적용치 않는 경우도 존재하여 전사 데이터웨어하우스 구축 등 전사 데이터에 대한 통합적인 정보 요.. 2020. 12. 13.
oracle, ms-sql DDL ,DML ,DCL ,TCL정리 1.DML(Data Manipulation Language) -데이터 조작어로 테이블에 입력, 수정, 삭제,검색하는 언어이다. -INSERT, UPDATE, DELETE, SELECT(DML이라고도 불리고, DQL이라고도 불린다.) 1.INSERT(데이터 삽입) ex) INSERT INTO 테이블명 [(칼럼1, 칼럼2, ...)] VALUES (값1, 값2, ...); -칼럼명의 기술 순서는 테이블에 정의된 칼럼 순서와 동일할 필요는 없으며, INTO 절에 기술하지 않은 칼럼은 Defalut로 NULL값이 입력된다. -해당 칼럼의 데이터 유형이 CHAR나 VARCHAR2등 문자 유형일 경우 ''(Single Quotation)과 함게 입력한다. -숫자 유형일 경우엔 ''없이 숫자만 입력한다. 2.UPDA.. 2020. 12. 9.
[MySQL]오류문구 Workbench Can't connect to MySQL server on 'localhost' (10061) 에러 코드 > Could not connect, server may not be running. Can't connect to MySQL server on 'localhost' (10061) 에러 해결 > 내PC 마우스 오른쪽 관리 클릭> 서비스 및 응용 프로그램 > 서비스 클릭 > MySQL이 멈춰있다면 실행 시켜줌 > Workbench 다시 켜서 작동 시키면 잘 됨. 출처: https://xodgl2.tistory.com/34 2020. 12. 5.
데이터베이스,SQL 조인(join)완벽 정리 ●(theta join)세타조인(R▷◁(r 조건 s)S): -조인에 참여하는 두 릴레이션의 속성 값을 비교하여 조건을 만족하는 투플만 반환한다. -세타조인의 조건은{=,≠,≥,≤,>, 2020. 11. 28.
728x90