Semantic Web

개념
- 구조화된 데이터를 정의하고 구축(Ontology)하고 구축된 데이터간의 연결(Link Data)을 통하여 지능적 자료처리와 지식의 축적 활용이 가능한 차세대 웹 - 웹 상에 존재하는 데이터들의 의미와 관계를 RDF, 온톨로지 기반으로 표현하여 기계가 의미를 이해하고 추론할 수 있도록 하는 지능형 웹 패러다임

I. 의미 기반 정보 처리 서비스 시멘틱 웹(Semantic Web) 의 개요

가. 시멘틱 웹(Semantic Web)의 정의

- 구조화된 데이터를 정의하고 구축(Ontology)하고 구축된 데이터간의 연결(Link Data)을 통하여 지능적 자료처리와 지식의 축적 활용이 가능한 차세대 웹

- 웹 상에 존재하는 데이터들의 의미와 관계를 RDF, 온톨로지 기반으로 표현하여 기계가 의미를 이해하고 추론할 수 있도록 하는 지능형 웹 패러다임

 

나. 시멘틱 웹의 목적

구분

설명

비즈니스 측면

- 분산된 웹의 정보를 효율적으로 사용

- 정보의 홍수 속에서 의미 있는 데이터의 추출

- 웹에서 급증하는 데이터의 구조화 및 해석의 방법

정보기술 측면

- XML, RDF(Resource Description Framework), Ontology 등의

정보검색 기술의 발달

- W3C에서 차세대 웹 기술로 표준화 진행

 

다. 시멘틱 웹의 필요성

구분

설명

자원표현의

한계성

현재의 웹은 HTML언어로 웹 문서만을 표기하는 웹으로써 자원을 표현하는데 한계가 존재

시멘틱 표현의 부재

웹 문서끼리의 관계가 설정되지 않았으므로 컴퓨터가 시멘틱을 이해하지 못하는 단점이 존재함

URL의 단순성

현재 웹은 URL만으로 문서를 인식 하는데 모든 객체들을 URL만으로 인식하기에는 문제점이 존재함

 

 

II. 시멘틱 웹의 계층구조 , 개념도 및 구성요소

가. 시멘틱 웹의 계층구조

- 정확하고 효율적인 웹 사용을 위하여 RDF, Ontology 등의 기술들을 기반으로 웹 페이지에 내용과 의미를 부여

 

나. 시멘틱 웹의 개념도

- Agent를 통해 검색요청을 받고 이를 검색엔진으로 전달

- 검색엔진은 추론엔진을 통해 추론규칙과 온톨로지를 검색하여 해당 도메인 내의 정확한 정보를 추출

 

다. 시멘틱 웹의 계층체계의 주요구성요소

구성요소

설명

URI/

Unicode

- Uniform Resource Identifier

- 웹 상의 자원을 식별하기 위한 객체의 명칭, 위치 등의 표현

IRI

- International Resource Identifier with UNICODE

- 기존 URL를 확장한 웹 자원의 통합 식별 체계

XML

- eXtensible Markup Language

- 웹 상에서 구조화된 문서를 전송 가능하도록 설계된 표준화된 텍스트 형식

RDF

- Resource Description Framework

- XML기반의 구조화된 Metadata확장, 교환 및 인코딩을 위한 체계

- 메타데이터를 상호 교환하기 위한 표준

RDF

Schema

- RDF의 Schema 정보로 경량의 Ontology 표현

- 주어, 서술어, 목적어 (Triple 모델로 기술)

- 의미를 기술하는 RDF 형식 언어

SPARQL

- RDF 질의를 위한 언어

RIF

- Rule Interchange Format

- 규칙의 정의와 교환을 위한 계층

Ontology

- 특정 도메인에서 특정 지식과 관련되고 자주 사용되는 용어를

 정의한 사전

OWL

- 특정 도메인에 대한 공유되는 일반적인 이해와 개념, 개념과의 관계를 표현하기 위한 언어

Proof/Trust

- 논리체계를 이용해서 증명하고 웹 정보자원의 신뢰성 평가

Agent

- Ontology를 이용하고 정보를 추출, 추론을 이용하여 정보가공

Semntic Repository

- 시멘틱 저장소, 문서와 문서간의 의미관계를 정의하여 문서 검색의 효율성을 높임

Semantic Extract Moudle

- 의미추출

- Taxonomy에서 불용어(stopword)와 무의어(noise)를 제거하여 의미가 유사한 것을 추출하는 시스템

 

 

III. 시멘틱 웹의 기술전반 및 활용 사계

가. 시멘틱 웹의 기술전반

기술

상세 설명

자원서술기술

(RDF, XML)

- XML을 이용 사용자가 임의의 태그를 지정하여 문서 구조화- RDF는 주어(Subject), 서술(Predicate), 목적(Object)의 Triple 모델로 기술되며 XML의 구조화된 문서로 서술됨

지식서술기술

(Ontology)

- 개념의 체계적인 규정을 의미하며, 용어와 용어들간의 관계를 표현하는 컴퓨터 판독이 가능한 공식 규정을 의미

통합운용기술

(Agent)

- 메타 데이터와 Ontology를 이용하여 추론하고 사용자 대신에 유용한 일을 자율적으로 실행할 수 있는 프로그램

- 자원 서술을 위한 RDF나 지식서술을 위한 Ontology가 비교적 정적인 구조를 가지는 반면, Agent는 자원정보와 지식을 바탕으로 사용자의 요구에 맞게 정보를 추출하고 가공하여 제공하는 동적 역할 담당

메타데이터

(Metadata)

- 정보검색의 처리과정을 줄여주고, 관련성이 많은 정보의 발견 가능성을 높여 정보 검색을 향상

(예: 도서관의 사서 목록 / 인덱싱 된 결과물 등)

 

나. 시멘틱 웹(Semantic Web)의 활용 사례

분야

내용

활용 예

전자상거래

ebXML과 같은 전자상거래 Framework와 연계

e-Commerce,

e-Catalog

Data

Mining

웹 전체를 대상으로 하는 웹 마이닝

e-CRM,

e-MarketPlace

지식처리

Agent 이용 대량의 지식 축적 및 분배

Topic Map,

Taxonomy

웹 서비스

기업의 비즈니스 서비스 컴포넌트 연계

UDDI, Registry

신디케이션

단순 공통 메타데이터를 정보의 수집과 필터링에 활용

블로그, RSS

 

IV. 시멘틱 웹과 기존 웹과의 비교 및 웹 서비스와의 비교

가. 시멘틱 웹과 웹 서비스와의 관계

- 차세대 웹 서비스인 지능형 웹 서비스(Intelligent Web Services)의 진화 방향을 정보의 특성과 에이전트의 역할을 중심으로 구분

 

나. 시멘틱 웹과 기존 웹 및 쇼셜 웹과의 비교

구분

Semantic Web

Social Web

기존 Web

정보표현

의미 중심의 정보 표현과 해석

웹 기술과 서비스를 기반으로 각각의 사람들이 자신의 관심 사항들을 나누며 상호 작용

문법 중심의 정보 표현

관점

컴퓨터의 이해/추론이 가능한 의미중심

서비스 및 소통하는 사용자 중심

인간이 이해할 수 사용자 중심

기반기술

웹에서의 Data 기술을 위한 XML기반

Mobile SNS, Mobile Web2.0, Enterprise MashUp 등

web2.0 기반 기술들

웹 문서를 화면에 보여주기 위한 HTML기반

초점

정보자원 사이의 의미적 연결성

새로운 기술이 아닌 기존 기술을 활용하여 사용자간 상호작용

Hyper Text Link를 통한 웹에서의 위치적 연결성

 

댓글