데지덤

  1. 데이터관련 직무와 자격
    1. 데이터베이스 직무

    2. 데이터베이스 자격

  2. 데이터관련 학습방법
    1. 데이터베이스 개론 학습

    2. DBMS 학습

    3. 읽어볼만한 DB책

  3. 최신동향과 유명한 Things
    1. DB최신동향

    2. 데이터로 유명한 Things

  4. 데이터베이스 개념
    1. 데이터베이스 개념

    2. DBMS

    3. 데이터베이스 개발과운영

  5. 데이터베이스 설계(1/2)
    1. 데이터표준

    2. 데이터모델링

    3. 데이터모델 디자인패턴

  6. 데이터베이스 설계(2/2)
    1. 프로세스및상관모델링

    2. 정규화

    3. 반(역)정규화

    4. DB물리설계

  7. 인덱싱과 DB프로그래밍
    1. 인덱스와 해싱

    2. 관계연산

    3. DB언어

    4. SQL

    5. 데이터베이스 미들웨어

  8. 데이터베이스 운영
    1. 트랜잭션

    2. 병렬처리

    3. 데이터베이스 복구

    4. 데이터베이스 성능

    5. 병행제어(동시성제어)

  9. 분석계 및 빅데이터기술
    1. 데이터웨어하우스

    2. 데이터마이닝

    3. 빅데이터기술

  10. 데이터거버넌스
    1. 데이터거버넌스

    2. 데이터베이스 감리/진단

  11. 데이터베이스 종류와 보안
    1. 데이터베이스 종류

    2. 데이터베이스 보안

  12. DBMS
    1. 오라클

    2. SQL Server

    3. DB2

    4. Sybase

    5. Altibase

데이터베이스개념

개념
한 조직의 여러 응용시스템이 공용(shared)하기 위해 최소의 중복으로 통합(integrated), 저장(Stored)된 운영(Operational) 데이터의 집합으로 통합된 데이터, 저장된 데이터, 운영데이터, 공용데이터로 구성됨

 

 

분류

내용

통합 데이타 (integrated data)

ƒ동일한 데이터가 원칙적으로 중복되어 있지 않다는 것을 의미

-최소의 중복(minimal redundancy)

-통제된 중복(controlled redundancy)

저장 데이타 (stored data)

ƒ컴퓨터가 접근 가능한 저장 매체에 저장 (테이프, 디스크 등)

운영 데이타 (operational data)

ƒ한 조직의 고유 기능을 수행하기 위해 필요한 데이터

(단순한 입출력 등 작업처리과정의 임시 데이터는 운영데이터가 아님)

공용 데이타 (shared data)

ƒ한 조직의 여러 응용 프로그램이 공동으로   소유, 유지, 이용하는 데이타

 

1. 파일 시스템 문제점 및  데이터베이스 시스템 장단점

 가. 파일 시스템의 문제점

  - 데이터 독립성 보장 미흡                         – 프로그램 의존적
  - 데이터 일관성 보장 문제                         – 파일의 시간 의존성(걷어낼 시점별 다른 값)
  - 데이터 무결성 보장 문제                         – 의미적으로 같은 값은 동일하게 유지되어야 함
  - 공유성, 사용 편의성 저조                        - 낮은 경제성, 보안관리 저조

 

나. 데이터베이스 시스템의 장단점

장점

단점

자료 독립성

중복자료 감소

자료 통합 처리

자체 자료관리 기능

 (병행제어/회복/무결성/보안) 생산성 향상

 (표준화 도구 / 개발기간단축 / 유지보수 비용 절감)

시스템 부담증가로 인한 저효율

시스템 복잡함

복잡한 연산 위한 고급 인력 필요

어려운 백업 및 회복

높은 비용 및 고급인력필요

 

다. 종이에 기록하는 전통적인 방법에 비한 장점

장점

내용

압축성

많은 양의 종이 파일이 필요 없음

처리 속도

기계는 인간보다 훨씬 빨리 데이터를 검색하고 변환 시킬 수 있음

단조롭게 고된 일 감소

수작업에 의해서 파일을 유지하는 고된 일이 제거

현재성

정확한 최신의 정보가 항상 이용가능

 

라. 중앙집중 제어를 갖는 데이터베이스 장점

장점

내용

중복성 감소

(Redundancy)

개별적 파일이 갖는 중복성을 데이터베이스를 통해 감소시켜 기억장소 감소와 전반적 통제권강화의 효과를 가져올 수 있음

불일치 피함

(Inconsistency)

두 개(N개)의 파일에 수정이 필요할 때 한 개만 수정하고 나머지 한 개는 수정이 안되어 불일치가 발생할 수 있는데 데이터베이스를 이용할 경우 한번에 일관성 있는 수정이 가능하게 됨

데이터공유

(Shared)

응용 프로그램이 처리하기 위한 데이터가 서로 공유되어 제공받을 수 있는 환경 제공

표준화

(Standard)

데이터베이스를 중앙에 통제함으로써 데이터를 표현하는 데 모든 적용가능한 표준을 확립할 수 있음

보안

(Security)

데이터에 대한 완전한 권한을 가짐으로써 데이터베이스를 적절한 채널을 통해서만 접근 가능하도록 할 수 있음

무결성

(Integfity)

데이터베이스에 데이터가 정확하다는 것을 보증하는 것

데이터베이스 중앙통제를 통해 무결성 통제를 한층 더 쉽게 할 수 있음

 

2. 데이터베이스 시스템의 일반적인 특징

 

구분

내용

실시간 접근성

(real-time accessibilities)

 

ƒ수시적이고 비정형적인 질의(query)에 대하여 실시간 응답

계속적인 변화

(real-time accessibilities)

ƒ갱신, 삽입, 삭제 :   동적 특성

(이러한 변화 속에서 항상 현재의 상태(state)를 정확히 유지)

동시 공용 (concurrent Sharing)

ƒ동일 데이터를 여러 사람이 다른 방법으로 동시(concurrent)

에 공용할 수 있도록 지원

내용에 의한 참조 (content reference)

ƒ위치나 주소가 아닌, 사용자가 요구하는 데이터의 내용(data

contents), 즉 값(value)에 따라 참조

 

  • 1970년 이전, 파일 시스템 사용으로 데이터 중복에 따른 일관성 문제 대두
  • 데이터 일관성 문제를 해결하기 위해 1970년  E.F Codd에 의한 정규화 이론 발표
  • 정규화 이론에 입각하여 데이터 중복성을 최소화한 데이터베이스 확산
  • 1975년, 데이터를 모델링하여 체계화된 방법에 의한 스키마 구성
  • 1980년 이후, ANSI에 의해 SQL표준화에 따라 관계형 DBMS의 확산 적용
  • 디지털 자료의 급격한 증가에 따른 데이터분석 중요성은 증가하였으나 성능저하 발생.
    이에 따라 데이터 일관성과 함께 대량데이터 처리를 위한 데이터 처리성능 중요성 부각
  • OLTP 에 최적화된 Row-based 기반의 RDB와 OLAP에 최적화된 Column-based  기반의 RDB로 발전이 가속화됨

 


분류


내용


통합 데이타
(integrated data)


 동일한 데이터가 원칙적으로 중복되어 있지 않다는 것을 의미
 

-최소의 중복(minimal redundancy)
 

-통제된 중복(controlled redundancy)


저장 데이타

 (stored data)

컴퓨터가 접근 가능한 저장 매체에 저장 (테이프, 디스크 등)


운영 데이타

(operational data)


한 조직의 고유 기능을 수행하기 위해 필요한 데이터
 

(단순한 입출력 등 작업처리과정의 임시 데이터는 운영데이터가 아님)


공용 데이타 

(shared data)


한 조직의 여러 응용 프로그램이 공동으로   소유, 유지, 이용하는 데이타

댓글