“Ontology 활용 : Linked Open Data(LOD)”
오늘은 지난 포스팅에서 잠시 언급했던 LOD(Linked Open Data)를 중심으로 이야기 해보겠습니다.
l LOD = Linked Data + Open Data
지난 포스팅에서 언급했던 대로 LOD는 기존 HTML로 이뤄진 Document Web에서 RDF와 OWL 등으로 이뤄진 Data Web으로의 변화의 과정에서 탄생한 녀석(?)입니다.
- Document Web : URL을 통해 각각의 URL에 매칭된 화면을 기본단위로 제공
* URI : 화면[식별자]을 포함
- Data Web : URL을 통해 각각의 URL에 매칭된 데이터를 기본단위로 제공
* URI : 클래스[이름 or 식별자] or 트리플 구조를 포함.
위 그림과 요약된 설명을 보시면 URI을 통해 서버로부터 얻는 결과물도 차이가 있을 뿐 아니라 URI의 구성도 조금 다름을 아실 수 있습니다. 뿐만 아니라 LOD의 URI에서 지금까지 우리가 공부한 온톨로지의 흔적(클래스, 트리플 구조)도 찾으실 수 있습니다.
l LOD 와 Open API의 차이
근데 이렇게 보면 LOD가 어딘가 Open API랑 유사하다는 생각을 하시는 분도 계실 수 있습니다. 맞습니다. URI을 통해 데이터를 전달 받는다는 사실에서 그렇게 느끼셨을 거라 생각합니다. 하지만 LOD만의 강점이자 Open API와의 차이점이 있는데 그것은 온톨로지를 활용한다는 점입니다.
- Open API : 데이터 제공자가 규정한 형태의 정보만 획득이 가능
- LOD : 트리플 구조를 활용해 사용자가 획득하고자 하는 데이터의 형태를 직접 결정
* 트리플 구조의 표현 : 일반적으로는 온톨로지 질의(Query)언어인 SPARQL(Simple Protocol And RDF
Query Language)을 사용해 표현합니다.
l LOD의 사례
LOD의 사례는 해외뿐 아니라 국내에도 공공기관을 중심을 몇몇 곳을 찾아 볼 수 있습니다. 창조경제 시절(?) LOD가 붐을 일으켜 많은 곳에서 LOD를 적용한 것으로 보여집니다. 그 중 한가지 사례로 ‘국립중앙도서관’을 소개합니다. 이곳은 SPARQL(= SPARQL Endpoint)의 예제도 보여주고 있어 LOD를 이해하는데 도움이 됩니다.
[참고 : (국내)국립중앙도서관] URL : http://lod.nl.go.kr/home/
l 정리
LOD를 통해 우리는 사용자가 알고자 하는 대상을 컴퓨터에게 요구(검색)했을 때 컴퓨터가 온톨로지를 통해 대상을 파악(인식)하고 대상에 대한 다양한 형태의 정보를 제공한다는 것을 알게 되었습니다. 이러한 기능을 활용해 컴퓨터가 제공한 정보를 분석한다거나, 더 나아가 컴퓨터 스스로가 분석한 내용까지 제공한다면 온톨로지가 더 많은 활용가치를 가질 수 있다는 것을 알 수 있습니다.
'빅데이터' 카테고리의 다른 글
Storm + Kafka 연동하기 (0) | 2017.07.21 |
---|---|
docker 이해 (0) | 2017.07.07 |
Spark 개발환경 구축 - Zeppelin Spark Interpreter에 HBase 연결하기 (0) | 2017.06.23 |
[세번째 이야기] Hadoop Cluster 설치하기 (1) | 2017.06.14 |
데이터 수집 – flume [2/2] (0) | 2017.06.09 |