OLAP
태그 :
- 개념
- OLAP(OnLine Analytical Processing) 의 정의 - 최종 사용자가 다차원 정보에 중간 매개자나 매개체 없이 정보에 직접 접근하여 대화식으로 정보를 분석하고 의사결정에 활용하는 과정
I. OLAP의 개요
가. OLAP(OnLine Analytical Processing) 의 정의
- 최종 사용자가 다차원 정보에 중간 매개자나 매개체 없이 정보에 직접 접근하여 대화식으로 정보를 분석하고 의사결정에 활용하는 과정
나. OLAP의 필요성
- DW에서 전략적 결정을 유도하기 위해 다차원 분석에 유리한 시스템 필요
- 여러 차원 따라 측정치들에 대한 빠른 접근과 강력한 계산기능 필요(Rollup/Drill down)
- 업무관점의 다차원 뷰 및 시계열 데이터처리를 위해 다른 분석 방법들의 한계 (SQL 기반의 보고서 작성기, 스프레드시트 등)
다. DW프레임웍에서 OLAP의 위치
- OLAP은 DW에서 데이터를 분석하는 위치에 해당합니다.
II. OLAP의 전체 개념도와 주요 적용기술/용어
가. OLAP의 전체 개념도
나. OLAP의 주요 적용 기술용어
- OLAP의 문제가 나오면 OLAP에 적합한 용어로 작성을 해야 높은 점수를 맞을 수 있습니다.
Data Warehouse |
OLTP |
셀 (Cell) |
- 하나의 데이터 값이 저장됨. |
다차원 배열(Multi-Dimensional Array) |
- 데이터의 디멘전들에 의하여 정렬된 데이터 셀의 집합. |
Dimension
|
- 사용자가 분석하려는 항목에 대한 관점 |
Demension Hierarchy
|
- 한 Dimension의 Dimension Member들간에 존재하는 계층 구조 하나의 Dimesion이 하나이상의 Dimension Hierarchy를 가지는 경우도 있음. .Consolidation (= Aggregation = Rolling Up)시 사용됨. |
Measure / Variable
|
- 분석하고자 하는 항목 예 : 매출액, 판매수량, 비용 - 대부분의 경우 수치 .Fact (ROLAP) .Variable (Express, Pilot) .Structure (Holos) .Cubes (TM1) .Universe (Acuity) |
Drill Down and Roll Up
|
특정한 주제영역의 상하위 범주를 필요에 따라 질의 |
Pivot (Rotate)
|
데이터 축의 변경 |
Slice & Dice
|
관점에 따라 큐브의 분석내용을 자름 |
III. ROLAP과 MOLAP의 비교 및 OLAP의 특징
가. ROLAP과 MOLAP의 비교
데이터의 저장형태에 따라 ROLAP과 MOLAP이 구분됩니다.
ROLAP과 MOLPA그리고 이 둘 을 혼합한 HOLAP의 비교는 다음과 같습니다.
구분 |
ROLAP |
MOLAP |
HOLAP |
기본구조 |
관계형 DB |
다차원 DB |
다차원 DB + 관계형 DB |
핵심기술 |
다차원 모델링
|
다차원 DB
|
다차원 DB 다차원 모델링 |
처리용량 |
대용량 처리 가능
|
대용량 처리 처리 불가능 |
대용량 처리 처리 가능 |
고급분석 |
불가능 |
가능 |
가능 |
상세조회 |
가능 |
불가능 |
가능 |
장점 |
차원에 관계없이 처리
|
질의응답 시간 빠름
|
ROLAP+MOLAP 의 장점 취득 (단, 구축이 어려움) |
나. OLAP의 주요 특징에 따른 포지션
IV. 온라인 다차원 대용량 데이터 분석을 위한 OLAP의 개요
가. OLAP(Online Analytical Processing)의 정의
최종사용자가 다차원 정보에 직접 접근하여 대화식으로 정보를 분석하고 의사결정에 활용하는 과정 및 도구
나. OLAP의 특징
특징 |
주요개념 |
다차원성 |
사용자들이 실제적인 차원에서 정보분석 |
직접접근 |
최종사용자들이 자신들이 원하는 정보에 직접 접근 |
대화식 분석 |
시스템과 상호작용, 계속적인 분석수행(Drilling) |
의사결정 |
기업의 전략적 방향설정 및 의사결정에 활용 |
V. OLAP 구성도 및 네비게이션 기능
가. OLAP 구성도
운영데이터(OLTP 데이터)를 Data Warehowse와 Data Mart에 저장하고 , 이 정보를 OLAP을 이용하여 분석
나. OLAP의 네비게이션 기능
기능 |
내용 |
비고 |
Drill Down |
특정한 주제영역에서 큰 요약된 범위에서 작은상세범위로 단계적으로 접근하는 분석 방법 |
제품영역: 가전제품세탁기 ->드럼형세탁기 |
Roll Up |
Drill Down과 반대방향(작은 범위->큰 범위)의 단계적 접근 분석방법 |
제품영역: 드럼형세탁기 ->세탁기 ->가전제품 |
Drill Across |
다른 큐브에 접근하여 분석하는 기법 |
제품영역으로부터 지역영역으로 접근 |
Drill Through |
DW 나 OLAP의 상세 데이터에 접근하는 분석방법 |
Reach Though 라고도 함 |
Pivot |
분석 의 축을 바꾸는 것 |
T-SQL문에서 Pivot/Unpivot 기능 |
Slice |
한 차원의 멤버나 그 이상의 멤버를 가지고 한 값을 선택했을 때 나타나는 그 부분의 집합 |
특정제품에 대한 전기간 전지역의 판매량 |
Dice |
Slice 된 특정항목에 대해 Drill Down, Roll Up등을 이용하여 분석하는 프로세스 |
화면 기능사용 |
VI. OLAP의 유형 및 비교
가. OLAP유형
유형 |
설명 |
|
ROLAP (Relational OLAP) |
- 관계형 데이터베이스와 SQL과 같은 관계형 질의어를 사용하여 다차원 데이터를 저장하고 분석하는 형태임. - 전형적 3 Tier 구조 |
|
장점 |
- 대용량으로서 전사적으로 구축하는데 적합하며 확장성이 뛰어남. - 요약정보가 추출된 원시데이터를 검색해 볼 수 있음 |
|
단점 |
- 정규화를 통해 저장되어 응답시간이 느림(Star Schema) - 기존의 SQL 사용한계(다차원데이터분석의 충분한 기능 없음) |
|
MOLAP (Multi dimensional OLAP |
- 다차원데이터를 저장하기 위한 특수한 구조의 다차원DB사용 - Transaction DB에서 추출된 데이터를 데이터셀에 보관하고, 속도 개선을 위해 주기억장치의 큐브캐쉬(Cube Cache)속에 데이터큐브를 보관함 |
|
장점 |
- ROLAP 대비 사용이 쉽고, 검색속도가 빠름, 중소형 DW에 적합 |
|
단점 |
- 차원을 미리 정의 내리고, 데이터큐브를 먼저 생성 후 데이터를 적재 - 새 데이터 차원추가 -> 새 데이터큐브 생성필요 :유연성, 확장성 미흡 - 추출된 원시 데이터 추적 불가 |
|
DOLAP (Desktop OLAP) |
- 서버 개념 없이 직접 Data Warehouse와 연결되어 최종 사용자의 분석 및 질의 요구 처리 - Desktop OLAP으로서 DW추출 후 사용자의 PC에 저장하는 형태 - 다차원데이터의 저장 및 프로세싱이 모두 Client에서 발생 |
|
장점 |
- 싸고 빠르다 - 설치와 관리가 용이하다 |
|
단점 |
- 대용량의 데이터를 처리하는데 한계 - 데이터 정합성을 유지하기 힘들다 |
|
HOLAP (Hybrid OLAP) |
- ROLAP과 MOLAP을 결합한 형태 - DB저장은 ROLAP사용, 다차원프로세싱은 MOLAP사용 |
|
장점 |
- ROLAP의 대용량데이터 저장능력, MOLAP의 정밀한 다차원 프로세싱 분석능력 |
|
단점 |
- 정밀하지만 구현이 어렵다 |
|
Web OLAP |
- 사용자가 웹을 통해 OLAP사용 - OLAP데이터는 Broadcasting |
|
장점 |
C/S OLAP에 비하여 가격 저렴 |
|
단점 |
인터페이스 방식 및 보안문제 |
나. ROLAP, MOLAP, HOLAP비교
구분 |
ROLAP |
MOLAP |
HOLAP |
기본구조 |
관계형 DB |
다차원 DB |
다차원DB+관계형 DB |
핵심기술 |
다차원 모델링 |
다차원 큐브 생성 |
RDB, MDB의 연계 |
처리용량 |
대용량 처리 가능 |
대용량 처리 불가능 |
대용량 처리 가능 |
고급분석 |
불가능 |
가능 |
가능 |
상세조회 |
가능 |
불가능 |
가능 |
장점 |
- 보편화 환경 - 다양한 지원 도구 |
- 다차원 분석 빠른 수행 - 복잡한 분석 지원 |
- ROLAP과 MOLAP의 장점 취득 |
단점 |
- 복잡한 분석 어려움 - 수행 속도 낮음 |
- 대용량 처리 어려움 - Data 로딩 시 오래걸림 |
- MOLAP과 RDB간 추가 변환이 필요 |
다. OLTP(online transaction Processing)와 OLAP 비교
구분 |
OLTP |
OLAP |
Granularity |
상세 |
요약 |
업부성격 |
거래처리(What) |
분석 (Why) |
데이터변경 |
잦음 |
거의 없음 |
질의패턴 |
정형 |
비정형 |
프라이버시요소 |
강함 |
약함 |