데지덤

  1. 데이터관련 직무와 자격
    1. 데이터베이스 직무

    2. 데이터베이스 자격

  2. 데이터관련 학습방법
    1. 데이터베이스 개론 학습

    2. DBMS 학습

    3. 읽어볼만한 DB책

  3. 최신동향과 유명한 Things
    1. DB최신동향

    2. 데이터로 유명한 Things

  4. 데이터베이스 개념
    1. 데이터베이스 개념

    2. DBMS

    3. 데이터베이스 개발과운영

  5. 데이터베이스 설계(1/2)
    1. 데이터표준

    2. 데이터모델링

    3. 데이터모델 디자인패턴

  6. 데이터베이스 설계(2/2)
    1. 프로세스및상관모델링

    2. 정규화

    3. 반(역)정규화

    4. DB물리설계

  7. 인덱싱과 DB프로그래밍
    1. 인덱스와 해싱

    2. 관계연산

    3. DB언어

    4. SQL

    5. 데이터베이스 미들웨어

  8. 데이터베이스 운영
    1. 트랜잭션

    2. 병렬처리

    3. 데이터베이스 복구

    4. 데이터베이스 성능

    5. 병행제어(동시성제어)

  9. 분석계 및 빅데이터기술
    1. 데이터웨어하우스

    2. 데이터마이닝

    3. 빅데이터기술

  10. 데이터거버넌스
    1. 데이터거버넌스

    2. 데이터베이스 감리/진단

  11. 데이터베이스 종류와 보안
    1. 데이터베이스 종류

    2. 데이터베이스 보안

  12. DBMS
    1. 오라클

    2. SQL Server

    3. DB2

    4. Sybase

    5. Altibase

데이터베이스 접근

1. 파일의 조직 방법의 개요  : 레코드 저장과 접근 방법 결정

 

2. 순차 방법

  가. 레코드들의 물리적 순서가 그 레코드들의 논리적 순서와 같게 저장하는 것.

  나. 레코드 접근은 기본적으로 레코드가 저장되어 있는 물리적 순서에 따름, 파일을 복사하거나 레코드들을 순차적으로 일괄처리(batch processing)하는 응용에서 많이 사용됨.

     1) 엔트리 순차 파일(entry-sequence file) - 파일(pile)

- 레코드가 시스템에 삽입되는 순서대로 만들어짐

     2) 키 순차 파일(key-sequence file)

   - 키값의 크기 순으로 만들어짐, 순차 파일은 보통 이것을 뜻함.

 

3. 인덱스 방법

데이타 레코드를 접근하기 위해서 먼저 인덱스를 찾아서 그 인덱스가 가리키는 주소를 따라가 원하는 레코드를 접근하는 방법. 인덱스 파일은 <키값, 주소> 쌍으로 구성됨.

가. 인덱스된 파일(indexed file) = 인덱스 파일(index file) + 데이터 파일(data file)

나. 인덱스된 순차 파일(indexed sequential file) : 순차 파일과 직접 접근 방법을 지원하는 직접 파일을 결합한 형태의 파일

다. 다중키 파일(multikey file) : 하나의 데이터 파일에 여러 개의 상이한 접근 방법을 지원하는 구조

1) 역 파일(inverted file) : 데이터 파일에 대한 다중 접근 경로를 각 응용에 적절한 인덱스를 만들어 구현

2) 다중리스트(multilist file) : 하나의 인덱스 값마다 하나의 레코드 리스트를 구축

 

라. 인덱스 조직방법
   1) B-트리 : 균형된 m-원 탐색트리로서 효율적인 균형 알고리즘을 제공

2) B+-트리 : B-트리를 변형한 것.

- 리프가 아닌 노드로 된 인덱스세트(index set)와 리프 노드로만 구성된 순차세트(sequence set)로 구성됨.

 

4. 해싱 방법

  - 다른 레코드를 참조하지 않고 원하는 목표 레코드를 직접 접근할 수 있게 하는 기법.

  - 해싱 방법을 기초로 만들어진 파일을 직접 파일(direct file)이라 한다.

  - 해싱(hashing)이란, 레코드가 키에서 변환되어 나온 바로 그 주소에 저장되는 과정.

  - 해싱함수(hashing function) : 키값을 가지고 레코드를 직접 접근할 수 있기 위해서 먼저 키 값과 물리적 주소 사이에 어떤 대응 관계를 정의해 두고 어떤 키 값이 주어졌을 때 그 키 값으로 부터그 키 값을 가진 레코드가 저장되어 있는 주소를 계산해 낼 수 있는 기법.

 

    1) 버킷 해싱

- 해싱함수가 레코드의 키 값(해시키)으로부터 그 레코드가 저장되어 있는 버킷 주소로 사상하는 것.

- 버킷(bucket) : 하나의 주소를 가지면서 하나 이상의 레코드를 저장할 수 있는 파일의 한 구역.

- 서로 다른 레코드들이 같은 주소(버킷)로 변환되는 충돌로 인해 오버플로우가 많이 일어나게 되면 자연히 레코드의 접근 시간이 길어지게 되어 파일의 성능이 저하된다. 따라서 해싱기법에서 이 충돌로 인한 오버플로우를 어떻게 처리하느냐가 가장 큰 관심사의 하나이다.

    2) 확장성 해싱(extensible hashing)

- 버킷 해싱의 충돌 문제에 대처하기 위해 제안된 기법.

- 어떤 특정 레코드를 검색하기 위해 디스크 접근이 두 번을 넘지 않고 수행.

- 레코드가 유일하게 식별되기 위해서 해시 필드 값이 유일해야 되기 때문에 기본 키가 사용되어야 함.

 

 

 

 

댓글