2011년 5월 27일 금요일

GRID Database

GRID Database

요 약
GRID 데이터베이스는 GRID컴퓨팅 환경에서 분산된 데이터의 효율적 처리와 사용을 위한 데이터 베이스 관리 시스템이다. 공간 데이터는 일반적인 데이터에 비해 지역적 특성에 따른 이용도가 높으며, 대용량의 저장 공간을 필요로 하는 특징을 포함한다. GRID 데이터베이스는 이러한 공간 데이터의 관리를 위한 최적의 시스템으로 적용 가능하다. 그러나, 기존의 분산 데이터베이스 시스템과는 달리 지역적 자율성을 보장하기 때문에 단일 관리자에 대한 적용이 불가능하거나 비효율적인 시스템 구성이 이루어질 가능성이 있다. 또한, 동적으로 변화되는 환경에 유동적인 대응을 위해서는 효율적인 재조직 연산이 필요하다.

분산 데이터베이스와 GRID 데이터베이스
기하 급수적으로 늘어가는 방대한 데이터들의 효율적 성능향상을 위한 노력은 지속적으로 이루어져 왔다. 이러한 노력의 일환으로 분산 데이터베이스와 데이터베이스 클러스터 그리고GRID 데이터베이스에 대한 연구가 계속 되었다.

분산 데이터베이스는 컴퓨터 통신망을 이용하여 여러 개의 지역 데이터베이스를 논리적으로연관시킨 통합된 데이터베이스이다. 물리적으로는 분산되고 논리적으로는 집중되어 있는 형태의 구성으로 단순한 연결이 아닌 각 데이터베이스가 서로 관여를 하는 연결구조이다. 분산 데이터베이스의 장점은 데이터를 분산 배치하므로 장애에 대한 대비에 강하고 다수의 이용자가 대규모의 데이터베이스를 낮은 비용으로 공유할 수 있는 점이다. 분산 데이터 베이스는 중앙 집중형 데이터베이스 보다 저비용으로 구성이 가능하며, 확장성 및 가용성에 장점이 있다.

데이터베이스 클러스터는 한 지역의 같은 구역에서 물리적으로 연결이 되어있는 구조이다. 분산 데이터베이스가 데이터의 공유, 유통 및 투명성에 초점이 맞추어 있다면, 데이터베이스 클러스터는 고속의 네트워크 연결하여 데이터 처리의 성능성, 신뢰성, 분산성 및 가용성을 향상 시키는데 목적이 있다. 그러나 이 시스템은 물리적인 근접성으로 인하여 확장하는데 한계가 있다.

GRID 데이터베이스는 기존에 제시되었던 데이터베이스 시스템보다 더 많은 것을 지원 한다.이 시스템의 초점은 대용량 자원의 공유와 고속연산 및 다양한 응용기기의 지원에 맞추어져 있다. GRID 데이터베이스의 본질적인 기술로서 자원을 공유하고 높은 자원 활용도를 가지는 자원가상화 기술, 리소스들이 GRID 상에서 제공되거나 제거되는 동적인 관리 기술, 서비스 지향구조를 가지는 웹 서비스 기술이 있다. 특히 자원 가상화 기술은 스토리지, 서버 및 네트워크 도메인에 이르기까지 물리적인 자원을 가상적으로 묶어 자원이 동적으로 추가, 삭제, 변경될 수 있도록하는 기술이다. GRID 데이터베이스가 가지고 있는 이 기종의 통합 된 서비스, 확장성, 보안성,적합성 및 결함 허용 등 기술적 특성들을 접목시켜 유비쿼터스 컴퓨팅에 관한 많은 문제들을 해결할 수 있다.
GRID의 분류
분류
내용
컴퓨팅 GRID
  • 분산 슈퍼컴퓨팅
  • 많은 컴퓨터를 동시에 이용
  • High throughput
데이터 GRID
  • 전세계적으로 분산된 대용량 데이터를 통합해서 분석하도록 함.
엑세스 GRID
  • 온 디멘드 : 사용자 작업요구에 따라 동적으로 자원연결
  • 협업 환경 : 사용자들이 원격에서 협력하여 작업할 수 있도록 공간을 지원함
  • 멀티미디어 : 실시간 멀티미디어 응용을 위한 인프라 제공


GRID 데이터베이스의 구성 요소
분류
구성요소
내용
물리적
인프라
Computer
Grid
-      지역으로 분산 배치된 소형 컴퓨터부터 슈퍼 컴퓨터 까지를 연결한 GRID 플랫폼 환경 제공
Storage
Grid
-      동적으로 대량의 데이터를 디스크에 저장 유지하는 네트워크 스토리지(SAN, NAS) 그리드
-      Automatic Storage Management
논리적
인프라
Self
Management
-      대량 데이터처리 성능, 가용성 향상, 관리비용의 최소화를 위한 자동적 자기 진단 및 해결
-      자동진단 및 감시자 기능 : 데이터충돌 및 장애
-      관리작업 자동화 : 부하조절, 통계정보수집 활용
Virtualization
& Pool
-      동적으로 데이터베이스 서버를 조정하면서 운영
-      표준화되고 모듈화된 스토리지 및 서버들의Pool 관리를 통한 자원 동적 재분배 및 자동 관리
Provision
-      언제 어디서나 대용량 데이터베이스에 접근 제공
-      대규모 데이터 재배치 : 데이터복제, 메시지 큐잉
Quality Of
Service
-      자원의 효과적 활용을 위한 성능 및 가용성 보장
-      IT 구성환경의 복잡성 최소화
보안
인프라
기밀성, 무결성, 가용성
-      GRID 사용자들에게 단일 이미지의 데이터베이스 환경제공과 관리시스템의 하부 자원을 안전하게 사용하기 위해 SSO를 통한 정보 공유
-      PKI, 접근제어, 흐름제어, 추론제어


GRID 데이터베이스의 활용
1.     IT 비즈니스 과제 해결
IT 비즈니스 과제
GRID 해결
고립화된 서버
공유된 서버, 가상화에 위한 TCO
높은 하드웨어, 소프트웨어 도입 및 유지보수
저비용의 컴포넌트 적용을 통한 유연한 확장성 제공
시스템 Peak에 맞춘 용량 산정
저비용의 컴포넌트 적용을 통한 유연한 확장성 제공
시스템 장애에 취약 함
무정지 시스템 인프라 제공


2.     기업내 기본 시스템과 웹 용 시스템간의 통합
3.     기업간 자연스러운 시스템 통합
4.     통합한 시스템에 대한 운영관리의 효율화 및 저비용화

댓글 없음:

댓글 쓰기

블록체인 개요 및 오픈소스 동향

블록체인(block chain) 블록체인은 공공 거래장부이며 가상 화폐로 거래할때 발생할때 발생할 수 있는 해킹을 막는 기술. 분산 데이터베이스의 한 형태로, 지속적으로 성장하는 데이터 기록 리스트로서 분산 노드의 운영자에 의한 임의 조작이 불가...