웹마이닝

개념
- 데이터 마이닝 기법을 활용하여 웹 상의 문서들과 서비스들로부터 정보를 자동적으로 추출/발견하는 기법 - 웹에서 발생하는 고객의 행위 분석과 특성 데이터를 추출 정제 로딩하여 의사결정에 활용하기 위한 데이터 마이닝 기법

I. Web Mining 의 개요

가. Web Mining 의 정의

  • 데이터 마이닝 기법을 활용하여 웹 상의 문서들과 서비스들로부터 정보를 자동적으로 추출/발견하는 기법
  • 웹에서 발생하는 고객의 행위 분석과 특성 데이터를 추출 정제 로딩하여 의사결정에 활용하기 위한 데이터 마이닝 기법

 

나. 유형별 개념

유형

개념 설명

웹내용마이닝

에이전트기반

웹 사이트를 구성하는 페이지의 내용 중에서 유용한 정보를 추출 (텍스트, 이미지, 사운드 등)

DB 기반

웹 사용 마이닝

웹로그를 분석 사용자의 행위 패턴을 분석하여 의미 있는 정보 추출

웹 구조 마이닝

웹 사이트의 구조적인 요약 정보를 찾기 위한 기법, 웹 사이트내의 하이퍼링크를 통한 그래프의 구조적인 정보 이용

 

 

II. Web Mining 의 구조 및 유형

가. Web Mining 의 구조

구분

요소

설명

추출

WEB LOG 분석

웹 서버로그를 기반으로 개인별 Site방문기록 추적

HTML 분석

HTML 내의 컨텐츠 의미를 분석하여 구조화

HTML 구조분석

HTML내의 하이퍼링크를 기반으로 그래픽적으로 구조화

저장

DW

웹로그 기반으로 추출한 정보를 DW에 저장하여 패턴 분석

Data Mart

추출한 정보 중 특정 패턴이나 특정 고객 분류 및 데이터

기법

연관성탐사

관련성이 강한 웹로그 정보를 조합하여 패턴발견

연속성탐사

시간의 경과에 따른 웹로그 분석을 통해 패턴을 질의

분류탐사

이미 알려진 그룹의 특성을 부여

군집탐사

유사항 특성을 갖는 데이터의 그룹을 분류하여 패턴 분석

 

나. Web Mining 의 유형

구분

Web Mining

Web 컨텐츠 Mining

Web 구조 Mining

Web 사용 Mining

Agent 기반

DB 기반

Data 특징

Unstructured

Semi Structured

Semi Structured

Web site as DB

링크 구조

Interactivity

주요 Data

Text 문서

Hypertext 문서

Hypertext 문서

링크구조

Server로그

브라우저 로그

처리결과

단어/용어/구

개념 또는 Ontology

관계형

Graph

관계형

Graph

관계형테이블

Graph

주요분석기법

변이 탐색

기계학습

통계기법

선호도 알고리즘

관계분석

선호도 알고리즘

기계학습

통계기법

관계분석

활용 유형

범주화

군집화

규칙추출/발견

Text에서 패턴발견

사용자 모델링

빈도높은 하부구조 발견

웹사이트 스키마 도출

범주화

군집화

사이트구축/변경/관리

마케팅

사용자 모델링

 

 

다. Web Mining 의 수행 주요 단계

단계

설명

Resoure Finding

웹상의 문서 검색의 획득

Information Selection & Pre-Processing

획득된 웹 자원들로부터 특정정보를 자동으로 선택하고 전처리

Generalization

개별 웹 사이트 및 다수의 웹사이트들에 걸친 일반 패턴을 자동 발견

Analysis

발견된 패턴의 해석과 검증

 

III. Web Mining 활용 및 고려 사항

가. Web Mining 활용(Web 사용 Mining 중심)

분야

서비스

설명

금융

은행상품, 주식매매

예금안내 및 개인화된 예금 상품 발굴

주식매매 패턴 분석 후 상품 제안

전자상거래

홈쇼핑, B2B

구매 패턴과 구매품 분석을 통해 상품제안

거래 기업의 구매 형태 분석

E-learning

LMS 정책 수립

학습자에 대한 개인화 교육 패턴 분석/학습 제안

여행사

개인화 여행 제안

여행 관심도나 여행 패턴분석을 통해 여행 제안

 

나. Web Mining 활용 시 고려 사항

  • 패턴 규칙 발견을 위한 정보수집시 개인 정보 침해 방지를 위한 정책/구조적 대책 필요
  • Web Mining을 통한 사용자 모델링 자료와 CRM 등과의 적극적 연계를 통한 시너지 효과
  • 발견 된 패턴 규칙에 대한 검증 및 수정 작업을 통하여 추출 모델의 질적인 개선 필요

댓글