본문 바로가기

데이터분석/AD(s)P

(2)
[개념정리] 3-03 데이터 마트 1. 데이터 변경, 요약 요약변수 vs 파생변수 DM에서 받아온 데이터를 처리과정을 통해 분석 활용 자료로 변환하는데, 이 만들어진 변수들이 요약변수와 파생변수 요약변수 분석에 맞게 종합한 변수 DM에서 기본적인 변수로, 총구매 금액, 금액, 횟수, 구매여부 등 데이터 분석을 위해 만들어지는 변수 모델에 공통 사용 가능 -> 재활용성 간단한 구조(ex. 합계, 횟수)라서 자동화 프로그램 구축 가능 단점 : 기준값 의미 해석 애매(ex. 얼마이상을 구매할 경우) -> 연속형 변수를 그룹핑해 사용할 것 파생변수 분석자가 특정 조건 만족 or 특정함수에 의한 값을 만들어 의미 부여 세분화, 고객행동 예측, 캠페인 반응 예측에 활용 파생변수가 특정 상황에만 유의미 하지 않게 대표성을 나타나게 해야 함 단점 : ..
[개념정리] 3-01 데이터 분석 개요 데이터 분석 기법 이해 DW or DM이나, Legacy(기존 운영시스템), 스테이징영역(임시영역?), ODS(Operational Data Store) 에서 데이터 get (되도록 클린징 영역인 ODS에서 데이터 전처리해서 활용하는 것이 이상적) 시각화는 대용량 데이터 분석, 탐색적 분석시 필수로 복잡한 분석보다도 더 효율적이고, SNA(사회연결망 분석)에 자주 활용 공간분석(GIS)은 공간적 차원과 관련 속성들을 시각화하며, 지도위에 속성들을 크기, 모양, 선굵기 등으로 구분 탐색적 자료분석 특이한 점, 의미있는 사실 도출, 분석의 최종 목적을 달성해가는 과정. 데이터 이해(변수 분포, 특성파악), 변수생성, 변수선택에 활용. 통계분석 통계 : 현상을 일정한 체계에 따라 숫자, 표, 그림 형태로 표현..