Blog/2014-01

Submitted by hyacinth @
1998년 제안된 시멘틱 웹은 연구자의 의도와는 다르게 인터넷 커뮤니티가 이를 채택하지 않아 제대로 활용되지 못하고 있다. 그 때문인지 팀 버너스리는 'Raw Data Now'(2009)라는 연설을 통해 기존 인터넷의 문서의 연결 뿐 아니라 데이터의 연결을 가능하게 하자는 링크드 데이터(linked data[1])의 보급을 강조했다.

링크드 데이터는 웹 상에 존재하는 데이터에 개별 URI나 RDF를 부여하고 링크 정보를 식별하여 상호 연결된 웹을 지향하는 모델이다. 링크 기능이 강조된 시멘틱 웹이라고 볼 수 있다. 링크드 데이터 프로젝트는 2007년 1월 W3C에 의해 발표되었고 오픈(공공) 데이터 확산과 함께 퍼지고 있다.

팀 버너스리는 링크드 데이터가 제대로 활용되기 위해서 데이터를 어떻게 제공해야 하는지에 대한 가이드라인을 제시했다. 링크드 데이터의 본질을 제대로 이해하고 데이터를 구현했는가에 따라 제공되는 데이터를 5등급의 별로 표시하는 방법을 제시했다. 이는 링크드 데이터 참여를 자발적으로 유도하는데 효과를 얻고 있다.

다음은 팀 버너스리가 제안한 별점을 이용한 오픈 데이터의 다섯 단계 배포 계획에 대한 설명이다.

5star-steps.png
[PNG image (71.09 KB)]

http://5stardata.info/kr/

등급 설명
임의의 형식으로 공개
★★ 기계 처리 가능한 정형 데이터 형식(예:엑셀)
★★★ 공개 표준 형식
★★★★ URL을 사용하는 링크드 데이터 형식
★★★★★ 타 웹사이트와의 연계

이것은 링크드 데이터의 본질을 이해하는 데 도움을 준다.

별점 한 개짜리 PDF 같은 임의 형식의 공개 단계부터, 별점 네 개에 이르면 오픈 API나 SPARQL 질의를 통해 원하는 데이터에 접근할 수 있게 된다.[2] 별점 네 개와 다섯 개의 차이는, 별점 다섯 개는 다른 데이터를 링크하여 데이터를 제공한다. 예를 들면 DBpedia의 링크를 사용해 데이터 해석에 대한 문맥을 제공한다. 이것의 의미는 별점 네 개까지가 단지 웹에 공개된 데이터라면, 별점 다섯 개는 다른 데이터를 소비하여 연결 된(linked) 웹 안의 데이터가 되는 것이다.



Submitted by hyacinth @
더 많은 책 읽기.

작년을 돌이켜보면 살면서 가장 책을 조금 읽었던 한 해였다. 그래서 올해 첫 번째 목표로 책 읽기를 꼽았다.

그런데 책을 몇 권 봤는지 연연하지 말고 한 권이 주는 내용이라도 제대로 자기 지식으로 만들라는 의미 말도 떠오른다. 이건 언제나 고민하고 있는 부문이다. 우선 지난 해보다는 독서량을 높이자란 의미에서 시작하기로 하자.



Submitted by hyacinth @
100% 알지 못하는 건 전혀 모르는 것과 같다.

지난 몇 년 동안 생긴 습관인데 새해가 되면 격언을 하나씩 골라보는 거 같다. 올해의 아포리즘은 이걸로 정했다.

사람은 30살까지 배우고 30살 이후는 지금까지 배운 걸 써먹으며 살아간다는 말이 떠오른다. 오래 전 대학원 다니던 어떤 블로거가 나이는 늘어 가는데 계속된 공부로 조급해하던 중 멘토에게 들었다는 말이다. 나도 인상에 남아 기억하고 있다. 나도 이 말에 위안을 좀 갖자. -.-

관련글: 신년을 맞아