본문바로가기

용어설명(Glossary)


1. 개념 관련

Semantic Web (시맨틱 웹)

시맨틱 웹(Semantic Web)은 '의미론적인 웹'이라는 뜻으로,현재의 인터넷과 같은 분산환경에서 리소스(웹 문서, 각종 화일, 서비스 등)에 대한 정보와 자원 사이의 관계-의미 정보(Semanteme)를 기계(컴퓨터)가 처리할 수 있는 온톨로지 형태로 표현하고, 이를 자동화된 기계(컴퓨터)가 처리하도록 하는 프레임워크이자 기술이다. 웹의 창시자인 팀 버너스리가 1998년 제안했다. 출처 : https://ko.wikipedia.org/wiki/시맨틱_웹

Linked Data (링크드 데이터)

링크드 데이터(linked data)는 웹 상에 존재하는 데이터를 개별 URI(Uniform Resource Identifier)로 식별하고, 각 URI에 링크 정보를 부여함으로써 상호 연결된 웹을 지향하는 모형이다. 출처 : https://ko.wikipedia.org/wiki/링크드_데이터 참조 : http://linkeddata.org/

웹 상에 존재하는 데이터를 개별 URI(Uniform Resource Identifier)로 식별하고, 아직 연결되지 않은 관련 데이터들을 웹을 이용해 연결하는 것 혹은 다른 방식을 활용하여 현재 링크되어 있는 데이터에 대한 장벽을 낮추는 것을 의미. 각 URI에 링크 정보를 부여함으로써 상호 연결된 웹을 지향하는 모형으로 링크 기능이 강조된 시맨틱 웹의 모형에 속한다고 볼 수 있으며 팀 버너스 리의 W3C를 중심으로 발전하고 있음 위키디피아에서는 “URIs(Unified Resource Identifiers)나 RDF를 이용해 시맨틱 웹 상에 널려있는 데이터, 정보, 지식을 노출하고 공유하며 연결하기 위해 추천되는 최고의 방법을 설명하는 용어”라고 정의하고 있음 출처 : 도서관 실무용어 해설집

Ontology (온톨로지)

온톨로지(Ontology)란 사람들이 세상에 대하여 보고 듣고 느끼고 생각하는 것에 대하여 서로 간의 토론을 통하여 합의를 이룬 바를, 개념적이고 컴퓨터에서 다룰 수 있는 형태로 표현한 모델로, 개념의 타입이나 사용상의 제약조건들을 명시적으로 정의한 기술이다.
온톨로지는 일종의 지식표현(knowledge representation)으로, 컴퓨터는 온톨로지로 표현된 개념을 이해하고 지식처리를 할 수 있게 된다. 프로그램과 인간이 지식을 공유하는데 도움을 주기 위한 온톨로지는, 정보시스템의 대상이 되는 자원의 개념을 명확하게 정의하고 상세하게 기술하여 보다 정확한 정보를 찾을 수 있도록 하는데 목적이 있다 출처 : https://ko.wikipedia.org/wiki/온톨로지

Class (클래스)

온톨로지의 구성 요소는 클래스(class), 인스턴스(instance), 관계(relation), 속성(property)으로 구분할 수 있다.
클래스는 일반적으로 우리가 사물이나 개념 등에 붙이는 이름을 말한다고 설명할 수 있다. "키보드", "모니터", "사랑"과 같은 것은 모두 클래스라고 할 수 있으며, 어떠한 영역에서 클래스는 인스턴스를 멤버(Member)로 같는다. "키보드", "모니터", "사랑"은 어떠한 영역에서는 인스턴스로 사용될 수도 있으며, 어떠한 영역에서는 클래스로 사용될 수도 있다. "컴퓨터부품"이라는 클래스에 대해 "키보드", "모니터"는 인스턴스가 될 수 있으며, "키보드"라는 클래스에 대해 "A사제품 키보드", "B사제품 키보드"가 인스턴스가 될 수 있다. 참조 : https://ko.wikipedia.org/wiki/온톨로지

Instance (인스턴스)

인스턴스는 사물이나 개념의 구체물이나 사건 등의 실질적인 형태로 나타난 그 자체를 의미한다.
즉, "LG전자 ST-500 울트라슬림 키보드", "삼성 싱크마스터 Wide LCD 모니터", "로미오와 줄리엣의 사랑"은 일반적으로 인스턴스라 볼 수 있다.
이와 같은 클래스와 인스턴스의 구분은 응용과 사용목적에 따라서 매우 달라질 수 있다. 즉, 같은 표현의 개체가 어떠한 경우에는 클래스가 되었다가 다른 경우에는 인스턴스가 될 수 있다. 참조 : https://ko.wikipedia.org/wiki/온톨로지

Property (속성)

속성은 클래스나 인스턴스의 특정한 성질, 성향 등을 나타내기 위하여 클래스나 인스턴스를 특정한 값(value)와 연결시킨 것이다. 예를 들어, "삼성 싱크마스터 Wide LCD 모니터는 XX인치이다."라는 것을 표현하기 위하여, hasSize와 같은 속성을 정의할 수 있다. 참조 : https://ko.wikipedia.org/wiki/온톨로지

URI (Uniform Resource Identifier)

인터넷에 있는 자원을 나타내는 유일한 주소이다. URI의 존재는 인터넷에서 요구되는 기본조건으로서 인터넷 프로토콜에 항상 붙어 다닌다.
[프로토콜 (HTTP 혹은 FTP) + : + // + 호스트이름 + 주소] 형식으로 표현된다.
비슷한 의미로 URL이 있는데 URL은 Uniform Resource Locator의 약자로 Locator을 사용하여 인터넷상의 해당 위치에 존재한다라는 의미가 있으며, URI는 Uniform Resource Identifier의 약자로 Identifier를 사용하여 자원이라는 의미로 사용된다.
즉 http://domain_name/resource/test 라고 URI가 사용된 경우 해당 웹서버에 "test" 라는 라는 파일이나 컨트롤러가 존재하는 것이 아니라 "test"라는 식별자를 포함하여 구분된 자원이 존재한다는 의미이다. 출처 : https://ko.wikipedia.org/wiki/통합_자원_식별자, https://en.wikipedia.org/wiki/Uniform_Resource_Identifier

Triple (트리플)

W3C에 의해 구축되는 온톨로지는 웹 온톨로지의 성격을 갖으며, 웹 온톨로지 상에서의 자원은 [자원명, 속성명, 속성명에 해당하는 값]으로 구성된 집합으로 표현한다.
[자원명, 속성명, 속성명에 해당하는 값]으로 표현하는 그래프 방식의 데이터 표현 방식을 트리플 구조 또는 트리플이라고 한다.

Content Negotiation (내용 협상)

Content Negotiation이란 HTTP상에서 동일한 URI에 대해 요청 목적에 따라 URI에 해당하는 내용을 서로 다른 형식으로 전달하는 메커니즘을 말한다. Linked Open Data는 Content Negotiation을 지원할 수 있어야 한다.

국립중앙도서관 국가서지 LOD의 Content Negotiation 예시
http://lod.nl.go.kr/resource/KMO201738475 (도가니, 공지영, 창비) 라는 URI에 대해
(브라우저 요청 시) http://lod.nl.go.kr/page/KMO201738475
(데이터를 요청 시) http://lod.nl.go.kr/data/KMO201738475 또는
http://lod.nl.go.kr/data/KMO201738475?output=rdfxml

2. 재활용 용어 관련

Dublin Core (더블린 코어)

더블린 코어(Dublin Core)는 ISO 15836으로 표준화된 메타데이터 요소 집합이다. 다시 말해서, 이 표준은 메타데이터들에서 사용되는 기초적인 관례들을 표준화하여 검색 및 처리가 용이하게 한다.
DCMI(Dublin Core Metadata Initiative는)는 더블린 코어 요소 집합(Dublin Core Element Set)과 더블린 코어 용어(Dublin Core Metadata Terms)를 포함한 메타데이터의 상호운용성 개발을 위해 노력하는 열린 국제 기구이다. 출처 : https://ko.wikipedia.org/wiki/더블린_코어 참조 : http://www.dublincore.org/

FOAF (Friend of A Friend)

사람간의 관계 기술을 위한 RDF 기반의 명세 용어집이다. 그룹(Group)과 그룹에 소속된 개인(Person), 조직(Organization)에 의해 생성된 자원, 그룹, 개인, 조직의 연결 처리에 활용된다. 참조 : http://xmlns.com/foaf/spec/

bibo (Bibliographic Ontology)

Bibliographic Ontology는 책이나 잡지 등의 서지정보를 표현하기 위한 온톨로지이다. 시맨틱웹상에서의 구현을 위해 RDF 기반으로 작성되었다. 참조 : https://en.wikipedia.org/wiki/Bibliographic_Ontology 참조 : http://bibliontology.com/

VIAF

가상 국제 전거 파일(Virtual International Authority File, VIAF)은 Online Computer Library Center (OCLC)에 의해 운영 관리되고 있는 전거 파일이다.
이 프로젝트는 독일 국립 도서관과 미국 의회 도서관에 의해 시작되었으며, 저자(인명) 또는 조직에 대해 서로 다른 곳에서 표현한 동일 저자 또는 조직을 유기적으로 연결하기 위해 사용한다. 참조 : http://viaf.org

FRBR

FRBR 은 IFLA 일단의 전문가와 자문위원들에 의해 1992 년부터 1997 년까지 수행된 ‘서지레코드의 기능상의 요건’(functional requirements for bibliographic records)에 관한 연구의 결과이다. 이 연구는 서지레코드가 제공하고자 하는 정보가 무엇인지를 분명하고 정확하게 제시하며 그에 대한 이해를 공유하고, 그리고 이용자의 요구에 해답을 제시하기 위하여 서지레코드가 무엇을 추구해야 할 것인가에 대한 틀을 제공하는 것을 목적으로 한다. 참조 : http://www.nl.go.kr/icc/down/070502_09_Kor.pdf

SKOS (Simple Knowledge Organization System)

시소러스, 택사노미, 분류 체계와 주제명 같은 지식 어휘 체계를 웹에서 표현하기 위한 RDF 용어집이다. RDF(Resource Description Framework)에 기반하고 있기 때문에 SKOS로 표현된 지식어휘체계는 기계가 이해 가능하고(machine-readable), 소프트웨어 어플리케이션 간에 상호호환이 가능(interoperability)하며 웹으로 발행(publishing)이 가능하다. 참조 : https://www.w3.org/2004/02/skos/

nlon (National Library of korea ONtology)

국립중앙도서관의 국가서지 Linked Open Data에서 사용되는 국가서지 온톨로지에 활용된 용어이다. 국가서지 온톨로지에서는 기본적으로 skos, foaf 등의 용어집을 재활용하며 특수한 환경 또는 속성에 대해 nlon을 활용한다.

3. 시맨틱웹 표준 용어 관련

RDF (Resource Description Framework)

RDF(Resource Description Framework)는 웹상의 자원의 정보를 표현하기 위한 규격이다. 상이한 메타데이터 간의 어휘, 구문 및 구조에 대한 공통적인 규칙을 지원한다. 웹상에 존재하는 기계 해독형(machine-understandable)정보를 교환하기 위하여 월드 와이드 웹 컨소시엄에서 제안한 것으로, 메타데이터간의 효율적인 교환 및 상호호환을 목적으로 한다. 출처 : https://ko.wikipedia.org/wiki/RDF

RDFS (RDF Schema)

RDF 스키마는 RDFS, RDF(S), RDF-S, or RDF/S 등으로 사용하며 RDF 구조를 표현하기 위한 지식 표현 모델이다.
기본적으로 클래스, 속성을 표현하기 위한 메커니즘을 제공한다. 1998년 W3C에 의해 처음 발표 되었으며, 2004년 2월에 최종 권장사항 (Recommendation)이 출시(Release)되었다. 참조 : https://en.wikipedia.org/wiki/RDF_Schema

OWL(Web Ontology Language)

OWL은 RDF 구조로 온톨로지를 표현하기 위해 RDFS 상위의 보다 풍부한 표현 방식을 제공하기 위한 온톨로지 모델이다. OWL은 관계들 간의 hierarchy, 관계 인스턴스 내에서의 논리적 제약조건 등을 포함한 언어이다. 정밀하고 논리적인 추론을 필요로 하는 경우에 사용한다. 참조 : https://en.wikipedia.org/wiki/Web_Ontology_Language

SPARQL (SPARQL Protocol And RDF Query Language)

SPARQL은 Linked Data에 질의하기 위한 W3C 표준 질의언어이다. 관계형 데이터베이스에서 SQL이란 표준 질의언어를 사용하는 것과 마찬가지로 Linked Data에서는 SPARQL이란 질의언어를 이용한다.
SPARQL 질의가 가능하다는 것은 개발자 혹은 사용자에게 보다 높은 수준의 자유도를 제공하여 보다 편리하게 데이터에 접근할 수 있는 접점을 제공한다는 의미이다.
여기에서의 접점을 SPARQL Endpoint라고 일컫는다. 국립중앙도서관 국가서지 LOD의 SPARQL Endpoint : http://lod.nl.go.kr/sparql 국립중앙도서관 국가서지 LOD의 SPARQL 따라하기 : https://lod.nl.go.kr/home/sparql/getting.jsp 국립중앙도서관 국가서지 LOD의 SPARQL 사용방법 : https://lod.nl.go.kr/home/sparql/using.jsp

4. 데이터 형식 관련

JSON (JavaScript Object Notation)

JSON(JavaScript Object Notation)은 속성-값 쌍으로 이루어진 데이터 오브젝트를 전달하기 위해 인간이 읽을 수 있는 텍스트를 사용하는 개방형 표준 포맷이다. 비동기 브라우저/서버 통신 (AJAX)을 위해, 넓게는 XML(AJAX가 사용)을 대체하는 주요 데이터 포맷이다. 특히, 인터넷에서 자료를 주고 받을 때 그 자료를 표현하는 방법으로 알려져 있다. 출처 : https://ko.wikipedia.org/wiki/JSON

CSV, TSV

CSV(영어: comma-separated values)는 몇 가지 필드를 쉼표(,)로 구분한 텍스트 데이터 및 텍스트 파일이다. 확장자는 .csv이며 MIME 형식은 text/csv이다. comma-separated variables라고도 한다.
[참고] TSV(영어: Tab-separated values)는 CSV와 유사하게 몇 가지 필드를 탭(\t)으로 구분한 텍스트 형식이다. 출처 : https://ko.wikipedia.org/wiki/CSV_(파일_형식) 출처 : https://en.wikipedia.org/wiki/Tab-separated_values

N3, N-Triples

RDF 구조의 표현은 RDF 직렬화(Serialization)를 통해 다양한 형식으로 표현 가능하다. N3, nTriples 같은 형식이 대표적이다.

N-Triples 형식은 아래와 같다.
_:dave <http://www.w3.org/1999/02/22-rdf-syntax-ns#type> <http://xmlns.com/foaf/0.1/Person>
_:dave <http://xmlns.com/foaf/0.1/name> "Dave Beckett".

N3 형식은 아래와 같다.
<http://en.wikipedia.org/wiki/Tony_Benn>
dc:title "Tony Benn";
dc:publisher "Wikipedia". 참조 : https://en.wikipedia.org/wiki/N-Triples 참조 : https://en.wikipedia.org/wiki/Notation3