bibo:abstract
  • There has been some research in Korea on test collections for evaluation of information retrieval (IR) systems. The test collections constructed as an outcome from the research have provided a starting point and opportunities to test Korean IR systems in an objective manner. However, they are well short of the standard practice in the broader IR community in that they are small in their size and usually unbalanced in terms of the characteristics of the documents and the queries (such as the subject domains). In this article, we describe our research effort to alleviate this problem and the resulting test collection, called HANTEC (Hangul TEst Collection). HANTEC is balanced in terms of the subject domains, document lengths, and user types, and currently consists of 120,000 documents divided into three groups: general area, social science area and scienceltechnology area. The 30 queries in the collection are grouped into the same three areas in one dimension and into three distinct user groups in the other dimension. (rdf:langString) (en)
  • 검색 시스템들의 평가를 위해 국내에서도 테스트 컬렉션에 관한 여러 연구가 진행되어왔다. 그러나 그 규모나 대상 분야가 편중되어 있고 질의 및 문헌 특성의 균형 등에 대한 고려가 반영되어 있지 않아 평가 결과를 객관화하기는 사실상 어려운 실정이다. 본 논문에서는 분야별, 사용자별 균형을 고려한 대규모 테스트 컬렉션인 HANTEC에 대해 기술한다. HANTEC 테스트 컬렉션은 총 12만 건의 문헌집합으로 구성되었는데 일반, 사회과학, 과학기술 각 분야별 4만 건씩으로 특정 분야에 편중되지 않도록 하였고 질의집합도 각 분야별 10개씩 30개로 구성하였다. (rdf:langString) (ko)
nlon:biographicalNote
  • 맹성현, 충남대학교 컴퓨터과학과 교수 (xsd:string)
  • 송사광, 전자통신연구원 (xsd:string)
  • 이석훈, 충남대학교 통계학과 교수 (xsd:string)
  • 이응봉, 충남대학교 문헌정보학과 조교수 (xsd:string)
  • 이준호, 숭실대학교 컴퓨터학부 조교수 (xsd:string)
nlon:classificationNumberOfNLK
  • 028.105 (xsd:string)
nlon:containedIn
dc:creator
  • 맹성현 (xsd:string)
  • 송사광 (xsd:string)
  • 이석훈 (xsd:string)
  • 이응봉 (xsd:string)
  • 이준호 (xsd:string)
dcterms:creator
nlon:datePublished
  • 2021-01-30T23:37:12 (xsd:dateTime)
dcterms:description
  • Construction of a balanced test collection for evaluation of information retrieval systems (xsd:string)
bibframe:extent
  • 26 cm (xsd:string)
  • p. 135-148 (xsd:string)
dcterms:isPartOf
nlon:issuedYear
  • 1999 (xsd:string)
nlon:itemNumberOfNLK
  • 한613ㅈ (xsd:string)
rdfs:label
  • 정보 검색 시스템 평가를 위한 균형 테스트 컬렉션 구축 / 맹성현, 이석훈,이준호,이응봉,송사광 (xsd:string)
dcterms:language
dc:subject
  • HANTEC (xsd:string)
  • Retrieval systems (xsd:string)
  • Test collection (xsd:string)
  • 정보 검색 시스템 평가 (xsd:string)
  • 테스트 컬렉션 (xsd:string)
dcterms:tableOfContents
  • 1 서론 2 문헌 집합 3 질의 집합 4 후보 문헌 생성 5 적합성 판정 6 테스트 컬렉션 분석 7 결론 (xsd:string)
dcterms:title
  • 정보 검색 시스템 평가를 위한 균형 테스트 컬렉션 구축 (xsd:string)
rdf:type
nlon:volumeOfNLK
  • 16(2) (xsd:string)