웹마이닝
태그 :
- 개념
- - 데이터 마이닝 기법을 활용하여 웹 상의 문서들과 서비스들로부터 정보를 자동적으로 추출/발견하는 기법 - 웹에서 발생하는 고객의 행위 분석과 특성 데이터를 추출 정제 로딩하여 의사결정에 활용하기 위한 데이터 마이닝 기법
I. Web Mining 의 개요
가. Web Mining 의 정의
- 데이터 마이닝 기법을 활용하여 웹 상의 문서들과 서비스들로부터 정보를 자동적으로 추출/발견하는 기법
- 웹에서 발생하는 고객의 행위 분석과 특성 데이터를 추출 정제 로딩하여 의사결정에 활용하기 위한 데이터 마이닝 기법
나. 유형별 개념
유형 |
개념 설명 |
|
웹내용마이닝 |
에이전트기반 |
웹 사이트를 구성하는 페이지의 내용 중에서 유용한 정보를 추출 (텍스트, 이미지, 사운드 등) |
DB 기반 |
||
웹 사용 마이닝 |
웹로그를 분석 사용자의 행위 패턴을 분석하여 의미 있는 정보 추출 |
|
웹 구조 마이닝 |
웹 사이트의 구조적인 요약 정보를 찾기 위한 기법, 웹 사이트내의 하이퍼링크를 통한 그래프의 구조적인 정보 이용 |
II. Web Mining 의 구조 및 유형
가. Web Mining 의 구조
구분 |
요소 |
설명 |
추출 |
WEB LOG 분석 |
웹 서버로그를 기반으로 개인별 Site방문기록 추적 |
HTML 분석 |
HTML 내의 컨텐츠 의미를 분석하여 구조화 |
|
HTML 구조분석 |
HTML내의 하이퍼링크를 기반으로 그래픽적으로 구조화 |
|
저장 |
DW |
웹로그 기반으로 추출한 정보를 DW에 저장하여 패턴 분석 |
Data Mart |
추출한 정보 중 특정 패턴이나 특정 고객 분류 및 데이터 |
|
기법 |
연관성탐사 |
관련성이 강한 웹로그 정보를 조합하여 패턴발견 |
연속성탐사 |
시간의 경과에 따른 웹로그 분석을 통해 패턴을 질의 |
|
분류탐사 |
이미 알려진 그룹의 특성을 부여 |
|
군집탐사 |
유사항 특성을 갖는 데이터의 그룹을 분류하여 패턴 분석 |
나. Web Mining 의 유형
구분 |
Web Mining |
|||
Web 컨텐츠 Mining |
Web 구조 Mining |
Web 사용 Mining |
||
Agent 기반 |
DB 기반 |
|||
Data 특징 |
Unstructured Semi Structured |
Semi Structured Web site as DB |
링크 구조 |
Interactivity |
주요 Data |
Text 문서 Hypertext 문서 |
Hypertext 문서 |
링크구조 |
Server로그 브라우저 로그 |
처리결과 |
단어/용어/구 개념 또는 Ontology 관계형 |
Graph 관계형 |
Graph |
관계형테이블 Graph |
주요분석기법 |
변이 탐색 기계학습 통계기법 |
선호도 알고리즘 관계분석 |
선호도 알고리즘 |
기계학습 통계기법 관계분석 |
활용 유형 |
범주화 군집화 규칙추출/발견 Text에서 패턴발견 사용자 모델링 |
빈도높은 하부구조 발견 웹사이트 스키마 도출 |
범주화 군집화 |
사이트구축/변경/관리 마케팅 사용자 모델링 |
다. Web Mining 의 수행 주요 단계
단계 |
설명 |
Resoure Finding |
웹상의 문서 검색의 획득 |
Information Selection & Pre-Processing |
획득된 웹 자원들로부터 특정정보를 자동으로 선택하고 전처리 |
Generalization |
개별 웹 사이트 및 다수의 웹사이트들에 걸친 일반 패턴을 자동 발견 |
Analysis |
발견된 패턴의 해석과 검증 |
III. Web Mining 활용 및 고려 사항
가. Web Mining 활용(Web 사용 Mining 중심)
분야 |
서비스 |
설명 |
금융 |
은행상품, 주식매매 |
예금안내 및 개인화된 예금 상품 발굴 주식매매 패턴 분석 후 상품 제안 |
전자상거래 |
홈쇼핑, B2B |
구매 패턴과 구매품 분석을 통해 상품제안 거래 기업의 구매 형태 분석 |
E-learning |
LMS 정책 수립 |
학습자에 대한 개인화 교육 패턴 분석/학습 제안 |
여행사 |
개인화 여행 제안 |
여행 관심도나 여행 패턴분석을 통해 여행 제안 |
나. Web Mining 활용 시 고려 사항
- 패턴 규칙 발견을 위한 정보수집시 개인 정보 침해 방지를 위한 정책/구조적 대책 필요
- Web Mining을 통한 사용자 모델링 자료와 CRM 등과의 적극적 연계를 통한 시너지 효과
- 발견 된 패턴 규칙에 대한 검증 및 수정 작업을 통하여 추출 모델의 질적인 개선 필요