빅데이터

스마트의 시작, Ontology_2

CyberI 2017. 6. 2. 18:15


온톨로지의 활용


 앞선 포스팅을 통해 온톨로지가 무엇인지 개념적인 내용을 살펴보았기 때문에 오늘은 기억만 잠시 되살린 후, 온톨로지가 어떻게 활용되는지 살펴 보도록 하겠습니다.

지난 시간의 내용을 되짚어 보면 온톨로지는 두 대상(개념)에 대해 공유된 개념(지식)을 표현한 명세이고, 그 기본구조는 아래와 같습니다.


 그래서 일정한 Domain 내에서 온톨로지를 구현하게 되면 무수히 많은 대상들이 서로 연결되고 연결되어 아래 그림과 같이 복잡한 형태의 그래프 구조를 갖게 됩니다.

컴퓨터는 이러한 구조를 통해 대상이 어떤 존재인지 파악하게 되는 것입니다.

 

- 연관검색 기능

 초기 온톨로지가 가장 많이 활용된 분야는 검색 분야였습니다. 기존 검색은 사용자가 입력한 검색어와 일치하는 내용만 결과로 출력해주는 구조였습니다. 아무리 검색어와 깊은 연관이 있더라도 검색어가 그 내용에 없다면 검색이 불가능한 구조였습니다. 그러나 온톨로지가 적용된 이후 다양한 관계 구조를 통해 하나의 검색어만 바라보는 것에서 벗어나 그와 연관된 주변 대상들도 볼 수 있는 시야의 확장이 가능해졌습니다. 결국 연관된 정보들까지도 검색 결과로 출력해주는 구조로 발전하게 된 것입니다.


- 시멘틱 웹(Semantic Web)

 다음으로 알아볼 내용은 시멘틱 웹입니다. 우선 웹은 아래 그림과 같은 단계를 거쳐 발전해 왔습니다.


( RDF[Resource Description Framework], OWL[Web Ontology Language] )

 HTML에서 XML, XML에서 RDFOWL로 변화되며 화면을 보는 사람만 정보를 이해하는 것이 아니라 컴퓨터 자체도 사람과 동일한 이해를 하게 하기 위한 목적이 깔려있었습니다. 그래서 Ontology를 반영한 RDF OWL가 등장하였고, 발전하게 된 것입니다.

 좀더 상세하게 설명을 해보자면 우리가 자주 보는 웹 페이지에는 수많은 데이터가 나타나게 됩니다. 물론 이 데이터는 컴퓨터가 보여주긴 하지만 사실 컴퓨터는 이 데이터가 어떤 내용인지 알지 못합니다. 그냥 사람이 설정해 놓은 대로, 시키는 대로 보여줄 뿐인 거죠.

 하지만 RDF OWL을 활용해 보다 더 시멘틱한 웹을 구성하게 되면 컴퓨터도 화면에 보여지는 데이터가 어떤 정보인지 이해하게 됩니다. 이러한 변화를 통해 컴퓨터는 서로 다른 화면 내에 있는 동일 대상(정보)을 동일하게 인식할 수 있게 되는 것입니다.

 이러한 온톨로지의 적용으로 인해 기존 HTML로 이뤄진 Document Web에서 RDF OWL로 이뤄진 Data Web으로 변화가 진행되고 있습니다. 또한 각 화면에 나타나는 대상(데이터)를 컴퓨터가 인식할 수 있게 되면서 LOD(Linked Open Data)라고 불리는 데이터의 연결과 통합이 점점 확산되고 있습니다.

 

 지금까지 온톨로지의 대표적인 2가지 활용 사례를 알아보았습니다

조금이라도 온톨로지가 어떻게 활용되는지 이해하는데 도움이 되셨기를 바라고, 다음 포스팅에서 뵙도록 하겠습니다.