2011년 5월 27일 금요일

RDF(Resource Description Framework)

XML 가진 비정규적 논리적 구조와 사용자들의 다양한 표현을 이용한 데이타를 기계가 이해하기는 쉽지 않다. 따라서 풍부하며 정확한 결과를 얻는 것은 매우 어렵다. 이에 해결책으로 제시된 것은 웹에 수록된 데이타를 기술하기 위해 메타데이타를 사용하는 것이다. 이를 위해 메타데이타에 대한 표준화의 많은 연구가 진행 되었는데 W3C에서는 메타데이타를 위한표준에 대한 연구로 RDF 표준안으로 제시하였다. 기존의 HTML이나 XML 가지고 있는장점과 더불어 메타데이타를 기술할 있는 장점을 더한 것이 RDF 있다.

이처럼 RDF 메타데이타를 처리하기 위한 기초를 제공한다. , 정보 리소스들의 의미와이들 사이의 연관성을 기술하기 위한 수단을 제공해 주기 위해 개발됐다. RDF 형태의 문서는소스/속성/값이라는 반복된 구조로 구성되어 있다. 리소스는 RDF 의하여 표현되는 모든것, 표현의 대상을 나타낸다. 리소스는 모든 웹페이지, 혹은 웹페이지의 일정 부분, 도서, 정보 거의 모든 것이 대상이다. 속성은 리소스를 기술하기 위한 특정한 , 특성, 관계등을 의미한다. 속성은 의미를 지니고, 값을 지닌다. 값은 속성이 지니는 실제의 값을 의미한다. 여기서 값은 리터럴 값인 경우도 있고, 반면에 다른 리소스를 의미할 때도 있다. RDF 표준화된 용어의 사용과 데이타간의 의미적 관계에 대한 기술이 가능하기 때문에 현재의 HTML XML 문서가 주류를 이루는 인터넷 데이타 환경은 RDF 형태로 변형될 조짐을 보이고 있다.
RDF 제안
RDF XML 기반으로 웹상의 분산된 다양한 자원들을 기술하기 위한 구조이고, 상의자원을 대상으로 메타데이타의 표준화 작업과 효율적이고 체계적인 관리를 위하여 W3C에서제안하였다. RDF 자원 검색을 위한 상이한 메타데이타를 효율적으로 교환하고 공유할수 있는 상호운영을 목적으로 한다. 또한 RDF 자원의 자동화 처리와 컴퓨터가 이해할 수잇는 정보 교환 수단을 제공한다. W3C RDF모델 구문을 1999sus 2월에 권고안으로 제정하였고, RDF 스키마를 2000 4월에 후보 권고안으로 제정하였다.
RDF 데이터 모델
RDF W3C에서 제정한 것으로서 기술하고자 하는 대상에 대한 부가정보, 데이타간의 상하및 연관 관계 등을 기술하는 능력을 가진다. 데이타를 정의하고 데이타에 대한 설명이나 관계를 기술함으로써 온톨로지를 구축할 있는 방법을 제공한다. RDF 기본적으로 주어(subject), 서술(predicate), 목적(object) 트리플(triple)모델로 기술된다. 주어란 표현하고자 하는 데이타를 의미하며, 서술은 주어에 대해 기술하거나 주어와 목적의 관계를 의미한다. 목적이란 서술에 대한 내용이나 값을 의미한다. 또한 내용들에 대해서 URI 통해기술할 있다.



주어(subject) http://www.w3.org/Home/Lassila
서술(predicate) Creator
목적(object) "Ora Lassila"
위의 도표를 RDF 구문으로 표현하면
RDF 이와 같은 트리플을 연속적으로 기술함으로써 정보를 표현한다. RDF에서는 이와 같이실제 데이터를 기술하는것 뿐만 아니라 데이타에서 사용되는 용어의 종류와 용어간의 관계를기술하는 스키마인 RDF 스키마(RDF Schema) 지원한다.
RDF 스키마(Schema)
RDF 스키마는 자원들 사이의 속성과 관계를 포함한 정보 집합인 타입 시스템을 제공하고RDF 문장들을 해석하기 위해 응용된다. 또한 특정 분야의 정보 자원에 대한 속성을 표현하는요소들을 선언하기 위해 사용되고, 기계가 이해할 있는 요소들을 정형화함으로써 다른 메타데이타에서 사용된 요소들을 재사용하거나 교환할 있다. 다른 메타데이타 스키마를 구별하기 위하여 RDF 이름공간 개념을 사용한다. RDF 스키마에 대한 자원과 클래스들의 집합과 요소들을 표현하면 아래 그림과 같다. 그림에서 둥근 직사각형은 클래스를 나타내며, 큰점들은 자원을, 화살표는 자원이 정의하는 클래스를 나타낸다. 그리고 서브클래스는 슈퍼클래스에 둘러싸여 있다.

RDF 자원은 클래스, 프로퍼티, 제한조건, 설명부분으로 구성된다.

댓글 없음:

댓글 쓰기

ETL 솔루션 환경

ETL 솔루션 환경 하둡은 대용량 데이터를 값싸고 빠르게 분석할 수 있는 길을 만들어줬다. 통계분석 엔진인 “R”역시 하둡 못지 않게 관심을 받고 있다. 빅데이터 역시 데이터라는 점을 볼때 분산처리와 분석 그 이전에 데이터 품질 등 데이...