OLAP

개념
OLAP(OnLine Analytical Processing) 의 정의 - 최종 사용자가 다차원 정보에 중간 매개자나 매개체 없이 정보에 직접 접근하여 대화식으로 정보를 분석하고 의사결정에 활용하는 과정

I. OLAP의 개요

가. OLAP(OnLine Analytical Processing) 의 정의

- 최종 사용자가 다차원 정보에 중간 매개자나 매개체 없이 정보에 직접 접근하여 대화식으로 정보를  분석하고  의사결정에 활용하는 과정

 

나. OLAP의 필요성

- DW에서 전략적 결정을 유도하기 위해 다차원 분석에 유리한 시스템 필요

- 여러 차원 따라 측정치들에 대한 빠른 접근과 강력한 계산기능 필요(Rollup/Drill down)

- 업무관점의 다차원 뷰 및 시계열 데이터처리를 위해 다른 분석 방법들의 한계 (SQL 기반의 보고서 작성기, 스프레드시트 등)

 

다. DW프레임웍에서 OLAP의 위치

- OLAP은 DW에서 데이터를 분석하는 위치에 해당합니다.


  

II. OLAP의 전체 개념도와 주요 적용기술/용어

가. OLAP의 전체 개념도

 

나. OLAP의 주요 적용 기술용어

- OLAP의 문제가 나오면 OLAP에 적합한 용어로 작성을 해야 높은 점수를 맞을 수 있습니다.

Data Warehouse

OLTP

셀 (Cell)

- 하나의 데이터 값이 저장됨.
- 다차원 배열내에서 각 디멘전의 특정멤버들에 의해 정의되며, 각 디멘전들이 상호교차하는 지점.

다차원 배열(Multi-Dimensional Array)

- 데이터의 디멘전들에 의하여 정렬된 데이터 셀의 집합.
- 이차원 배열은 스프레드시트와 유사하게 보인다.
- 삼차원 배열은  정육면체(cube)로 나타낼 수 있다. 이 때 각 평면 및 평면에 평행한 평면들은 디멘전을 표현한다.
- 삼차원 이상의 다차원 배열은 그림으로 표현하기 곤란하나, 실제 업무에 사용되는 시각들을 보다 적절히 반영할 수 있다.

Dimension

 

- 사용자가 분석하려는 항목에 대한 관점
- 예 : 매출액을 지역별, 상품별, 기간별로 분석한다고 하면, 지역, 상품, 기간이 Dimension이 됨.

Demension Hierarchy

 

- 한 Dimension의 Dimension Member들간에 존재하는 계층 구조 하나의 Dimesion이 하나이상의 Dimension Hierarchy를 가지는 경우도 있음.

.Consolidation (= Aggregation = Rolling Up)시 사용됨.
. Hierarchical Relation
. Parent
. Child
. Hierarchical Level

Measure / Variable

 

- 분석하고자 하는 항목 예 : 매출액, 판매수량, 비용

- 대부분의 경우 수치

.Fact (ROLAP)

.Variable (Express, Pilot)

.Structure (Holos)

.Cubes (TM1)

.Universe (Acuity)

 

 

 

Drill Down and Roll Up

 

특정한 주제영역의 상하위 범주를 필요에 따라 질의

Pivot (Rotate)

 

데이터 축의 변경

Slice & Dice

 

관점에 따라 큐브의 분석내용을 자름

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

III. ROLAP과 MOLAP의 비교 및 OLAP의 특징

가. ROLAP과 MOLAP의 비교

데이터의 저장형태에 따라 ROLAP과 MOLAP이 구분됩니다.

 

ROLAP과 MOLPA그리고 이 둘 을 혼합한 HOLAP의 비교는 다음과 같습니다.

구분

ROLAP

MOLAP

HOLAP

기본구조

관계형 DB

다차원 DB

다차원 DB +

관계형 DB

핵심기술

다차원 모델링

 

다차원 DB

 

다차원 DB

다차원 모델링

처리용량

대용량 처리 가능

 

대용량 처리

처리 불가능

대용량 처리

처리 가능

고급분석

불가능

가능

가능

상세조회

가능

불가능

가능

장점

차원에 관계없이

처리

 

질의응답

시간 빠름

 

ROLAP+MOLAP 의

장점 취득

(단, 구축이 어려움)

 

나.  OLAP의 주요 특징에 따른 포지션

 

 

IV. 온라인 다차원 대용량 데이터 분석을 위한 OLAP의 개요

가. OLAP(Online Analytical Processing)의 정의

최종사용자가 다차원 정보에 직접 접근하여 대화식으로 정보를 분석하고 의사결정에 활용하는 과정 및 도구

 

나. OLAP의 특징

특징

주요개념

다차원성

사용자들이 실제적인 차원에서 정보분석

직접접근

최종사용자들이 자신들이 원하는 정보에 직접 접근

대화식 분석

시스템과 상호작용, 계속적인 분석수행(Drilling)

의사결정

기업의 전략적 방향설정 및 의사결정에 활용

 

 

V. OLAP 구성도 및 네비게이션 기능

가. OLAP 구성도

운영데이터(OLTP 데이터)를 Data Warehowse와 Data Mart에 저장하고 , 이 정보를 OLAP을 이용하여 분석

 

나. OLAP의 네비게이션 기능

기능

내용

비고

Drill Down

특정한 주제영역에서 큰 요약된 범위에서 작은상세범위로 단계적으로 접근하는 분석 방법

제품영역: 가전제품세탁기

 ->드럼형세탁기

Roll Up

Drill Down과 반대방향(작은 범위->큰 범위)의 단계적 접근 분석방법

제품영역: 드럼형세탁기 ->세탁기

 ->가전제품

Drill Across

다른 큐브에 접근하여 분석하는 기법

제품영역으로부터 지역영역으로 접근

Drill Through

DW 나 OLAP의 상세 데이터에 접근하는 분석방법

Reach Though 라고도 함

Pivot

분석 의 축을 바꾸는 것

T-SQL문에서 Pivot/Unpivot 기능

Slice

한 차원의 멤버나 그 이상의 멤버를 가지고 한 값을 선택했을 때 나타나는 그 부분의 집합

특정제품에 대한 전기간 전지역의 판매량

Dice

Slice 된 특정항목에 대해 Drill Down, Roll Up등을 이용하여 분석하는 프로세스

화면 기능사용

 

 

VI. OLAP의 유형 및 비교

가. OLAP유형

유형

설명

ROLAP

(Relational OLAP)

- 관계형 데이터베이스와 SQL과 같은 관계형 질의어를 사용하여 다차원 데이터를 저장하고 분석하는 형태임.

  - 전형적 3 Tier 구조

장점

- 대용량으로서 전사적으로 구축하는데 적합하며 확장성이 뛰어남.

- 요약정보가 추출된 원시데이터를 검색해 볼 수 있음

단점

- 정규화를 통해 저장되어 응답시간이 느림(Star Schema)

- 기존의 SQL 사용한계(다차원데이터분석의 충분한 기능 없음)

MOLAP

(Multi

dimensional OLAP

   - 다차원데이터를 저장하기 위한 특수한 구조의 다차원DB사용

- Transaction DB에서 추출된 데이터를 데이터셀에 보관하고, 속도 개선을 위해 주기억장치의 큐브캐쉬(Cube Cache)속에 데이터큐브를 보관함

장점

- ROLAP 대비 사용이 쉽고, 검색속도가 빠름, 중소형 DW에 적합

단점

- 차원을 미리 정의 내리고, 데이터큐브를 먼저 생성 후 데이터를 적재

- 새 데이터 차원추가

-> 새 데이터큐브 생성필요 :유연성, 확장성 미흡

- 추출된 원시 데이터 추적 불가

DOLAP

(Desktop OLAP)

- 서버 개념 없이 직접 Data Warehouse와 연결되어 최종 사용자의 분석 및 질의 요구 처리

   - Desktop OLAP으로서 DW추출 후 사용자의 PC에 저장하는 형태

   - 다차원데이터의 저장 및 프로세싱이 모두 Client에서 발생

장점

- 싸고 빠르다

- 설치와 관리가 용이하다

단점

- 대용량의 데이터를 처리하는데 한계

- 데이터 정합성을 유지하기 힘들다

HOLAP

(Hybrid OLAP)

- ROLAP과 MOLAP을 결합한 형태

- DB저장은 ROLAP사용, 다차원프로세싱은 MOLAP사용

장점

- ROLAP의 대용량데이터 저장능력,

MOLAP의 정밀한 다차원 프로세싱 분석능력

단점

- 정밀하지만 구현이 어렵다

Web OLAP

- 사용자가 웹을 통해 OLAP사용

- OLAP데이터는 Broadcasting

장점

C/S OLAP에 비하여 가격 저렴

단점

인터페이스 방식 및 보안문제

 

나. ROLAP, MOLAP, HOLAP비교

ROLAP

MOLAP

HOLAP

기본구조

관계형 DB

다차원 DB

다차원DB+관계형 DB

핵심기술

다차원 모델링

다차원 큐브 생성

RDB, MDB의 연계

처리용량

대용량 처리 가능

대용량 처리 불가능

대용량 처리 가능

고급분석

불가능

가능

가능

상세조회

가능

불가능

가능

장점

- 보편화 환경

- 다양한 지원 도구

- 다차원 분석 빠른 수행

- 복잡한 분석 지원

- ROLAP과 MOLAP의 장점 취득

단점

- 복잡한 분석

어려움

- 수행 속도 낮음

- 대용량 처리 어려움

- Data 로딩 시 오래걸림

- MOLAP과 RDB간 추가 변환이 필요

 

다. OLTP(online transaction Processing)와 OLAP 비교

구분

OLTP

OLAP

Granularity

상세

요약

업부성격

거래처리(What)

분석 (Why)

데이터변경

잦음

거의 없음

질의패턴

정형

비정형

프라이버시요소

강함

약함

 

댓글