A Study on the Methods of Integrated Search in Digital Libraries Environment

디지털도서관의 통합검색 방식에 관한 연구

  • Published : 2006.06.01

Abstract

This study intends to analyze the integrated search methods in digital libraries environment. To categorize various integration methods, I investigated the developmental properties and integration types of digital libraries from a users point of view. And then, I reviewed the current best practices of library portal which are JISC Information Environment, NSDL OCKHAM and Korea Knowledge Portal Initiatives. Nextly, I derived the two methods of Integrated search mechanisms such as aggregated search and distributed search that is useful in the digital libraries environment.

이 연구는 디지털도서관에서 제공 가능한 통합검색 방식의 유형과 특성을 분석할 목적으로 다음의 세 가지작업을 수행하였다. 첫째, 이용자 관점에서 디지털도서관의 발전단계와 일반적인 통합 방식의 특성을 정리하였다. 둘째, 현재 국내외 대표적인 도서관 포털의 모범사례인 영국의 JISC IE, 미국의 NSDL의 OCKHAM, 그리고 한국의 국가지식포털을 대상으로 통합검색의 현황과 특성에 대하여 검토하였다. 셋째, 디지털도서관에 영역에서 많이 적용되고 있는 통합검색 방식의 유형을 메타통합검색과 분산검색으로 구분하여 각각의 기법적 특성을 도출하였다.

Keywords

References

  1. http://en.wikipedia.org/wiki/Digital_library. (인용 2006. 04. 10)
  2. 알리 쉬리 (Ali Shiri)는 2003 년도 논문을 통해 디지털도서관 연구의 최근 동향에 대하여 정리한 바 있는데, 주요내용을 살펴보면 다음과 같다. 첫째, 디지털도서관의 이론적 틀을 구성하는 3가지 요소는 사람, 정보자원 그리고 기술이며, 최근의 연구는 주로 이 3가지 영역에 관한 과제들이다. 둘째, 최근 디지털도서관에 관한 주요 현안범주를 8가지로 정리하고 있다: 1) 아키텍처. 시스템. 도구. 기술. 2) 디지털 콘텐츠와 장서. 3) 메타데이터. 4)상호운용성, 5) 표준화, 6) 지식조직화 시스템. 7) 이용자와 사용성, 8) 법률, 조직, 경제, 사회적 이슈와 같은 거버넌스 문제. Ali Shiri, "Digital library research: current developments and trends." Library Review, Vol.52, No.5(2003). pp.l98-202 https://doi.org/10.1108/00242530310476689
  3. 디지털도서관과 디지털 아카이브는 디지털 자원을 관리하고 유용한 서비스를 제공하는 시스템이라는 관점에서 보면, 유사하고 서로 공유되는 역할과 기능을 가지고 있다. 전통적인 도서관과 기록관(아카이브)의 차이처럼, 이들을 구분한다면 두 가지 특성에 대해 논의가 가능하다. 첫째, 가장 중심이 되는 기능에 관한 것으로 전자는 '검색'. 후자는 '보존'이라 할 수 있다. 그러나 디지털도서관에서 '보존' 기능이, 디지털 아카이브에서 '검색' 기능이 중요하게 되어 이 관점에서의 구분은 애매해 진다. 둘째, 관리하고 서비스하는 대상 자원의 관리 단위에 관한 것이다. 디지털 아카이브는 주로 유일본의 원자료(primary sources)를 대상으로 하는 시스템이며. 디지털도서관은 연구자, 교수 및 교사. 그리고 학생의 연구/강의/학습 등과 관련된 양질의 정보자원을 대상으로 하는 시스템이다. 그러나 전자는 개별자원보다 장서 단위에서 관리활동을 수행하며, 후자는 장서보다는 개별자원(아이템)단위에서 관리활동을 한다는 점에서 기본적인 차이가 있다. 그렇지만 최근 디지털도서관은 장서 기반의 관리를 모색하고 있으며, 디지털 아카이브에서도 개별자원의 관리 문제에 관심을 나타내고 있다. 그러기에 대상 자원의 관리 단위에 대한 구분도 명확하지 않다고 할 수 있다慵瑨潲㭲敳敡牣栭慳獩獴慮琻牥獥慲捨ⵡ獳楳瑡湴㭲敳敡牣栭慳獩獴慮琻牥獥慲捨ⵡ獳楳瑡湴㭲敳敡牣栭慳獩獴慮琻牥獥慲捨ⵡ獳楳瑡湴㭲敳敡牣栭慳獩獴慮琻牥獥慲捨ⵡ獳楳瑡湴㬀
  4. http://en.wikipedia.org/wiki/Digita_library.( 인용 2006. 03. 15)
  5. Sun Microsystem Inc., "Digital Library Technology Trends," 2002. www.sun.com/products-n-solutions/edu/whitepapers/pdf/digita_library_trends.pdf(인용 : 2006. 3. 15)
  6. William H. Mischo, "Digital Libraries: Challenges and Influential Work," D-Lib Magazine 11(7-8), 2005. http://www.dlib.org/dlib/july05/mischo/07mischo.html( 인용 2006. 3. 15)
  7. 검색 (search)과 탐색(discovery)은 둘 다 디지털도서관이나 정보검색 시스템에서 이용자가 정보자원을 찾아내는 행위를 말한다. 굳이 구분한다면. 전자는 이용자가 알고 있는 정보원(데이터베이스)을 대상으로 검색하고자 하는 경우에 사용하는 개념이며. 후자는 이용자가 규모와 내용을 잘 모르는 정보원으로부터 정보자원을 발견하는 경우(resource discovery)에 사용하는 개념이다. 디지털도서관이나 인터넷 검색포혈과 같이 방대한 규모의 분산자원을 대상으로 하는 경우 분산검색의 의미가 있는 탐색이 더 어울린다고 할 수 있다. 검색/탐색 행위에 의해 식멸된 정보자원은 접근(access) 행위에 의해 내용의 확인이 가능하고, 이것은 제공(delivery) 행위에 의해 이용자에게 전달된다
  8. 정보자원의 통합관리는 콘텐츠 관리시스템이나 장서 관리시스템 차원에서 구현된다. 전자는 디지털콘텐츠라고 하는 개별정보자원 수준에서 그것의 수집, 정리, 유지 등에 해당되는 기능을 제공하는 것이라면, 후자는 개별정보 자원의 집합체인 디지털장서 수준에서 통합관리에 필요한 기능들을 제공하게 된다. 콘텐츠 관리시스템은 기관 내부에 소장하고 있는 디지털자원에 대한 관리기능에 초점을 맞춘 것이라면, 장서 관리시스템은 내외부에 존재 하는 다양한 디지털장서의 관리기능에 초점을 맞춘 것이다. 각각은 전자도서관과 디지털도서관의 핵심 시스템이라고 하지만, 디지털도서관의 입장에서 보면 이 두 가지 시스템 모두가 필요하다. 한편, DLF 에서는 전자자원의 라이프사이클에 기반하는 전자자원 관리시스템 (electronic resources management system) 의 기능적 요건을 제시하기도 하였다
  9. 검색 서비스 이외에도 도서관에서는 다양한 정보서비스들을 제공하고 있다. 도서관에서 이용자들에게 일방적으로 제공하는 서비스와 이용자들이 도서관에 요청하는 서비스로 크게 구분이 가능하다. 전자는 이메일이나 전화를 통한 도서반납요청, 대출내역조회, SDI 서비스, 지정도서 안내 등이 있고, 후자는 희망도서신청, 예약신청, 상호대차(원문복사), 참고봉사(질의) 등이 있다. 이와 같은 정보서비스에 의해 제공되는 정보는 주로 연성정보이며, 검색서비스에 의해 접근하고 제공되는 정보는 주로 경성정보의 형태이다
  10. William H, Mischo. "Digital Libraries: Challenges and Influential Work," D-Lib Magazine 11(7-8), 2005. http://www.dlib.org/dlib/july05/mischo/07mischo.html( 인용 2006. 3. 15)
  11. Andrew Cox, "Library portals: technical developments," in 'LibPortal Project: Access to Library Provided Resources'. http://www.lboro.ac.uk/departments/dis/lisu/downloads/LibPortal_final_report.pdf(인용 2006. 4. 25)
  12. Ron Davies, "Library portals - today and tomorrow," http://www.online-information.co.uk/2004proceedings/thurspm/davies_r.pdf( 인용 2006. 5. 10)
  13. 참조할 만한 논의는 다음과 같다. Mary E. Jackson. "The Current State of Portal Applications in ARL Libraries" ARL의 회원도서관을 상대로 도서관 포털의 구현현황을 조사한 보고서이다. www.arl.org/access/portal/PAWGfinlrpt. pdf( 인용 : 2006. 5. 10), Andrew Cox, Robin Yeates. "Library oriented portals solutions," Chameleon iPortal. DigitalLink/iPac, ENCompass, MetLib, MAP Portal, ZPORTAL 등과 같은 도서관포털 솔루션을 평가한 보고서이다. www.jisc.ac.uk/uploaded_documents/tsw_02-03.pdf (인용 2006. 5. 10)
  14. http://wwwjisc.ac.uk/( 인용 2006. 4. 15)
  15. Stephen Pinfield, Lorcan Dempsey, "The Distributed National Electronic Resource(DNER) and the hybrid library," Ariadne 26. 2001. http://www.ariadne.ac.uk/issue26/dner/intro.html. (인용 2006. 1. 15)
  16. http://wwwjisc.ac.uk/ie/( 인용 2006. 3. 20)
  17. http://wwwjisc.ac.uk/dner/development/IEstrategy.html (인용 2006. 3. 20)
  18. http://www.ukoln.ac.uk/distributed-systems/jisc-ie/arch/standards/ (인용 2006. 3. 27)
  19. Amanda Hill, "The Information Environment Service Registry: Promoting the use of electronic resources." Ariadne 40, 2004. http://www.ariadne.ac.uk/issue40/hill/(인용 2006. 05. 12)
  20. 표준 프로토콜과 요소기술은 IESR 의 메타데이터에서 제공되는 서비스의 접근방식 (access method)을 참조한 것이다. http://www.mimas.ac.uk/iesr/metadata( 인용 2006. 5. 10)
  21. NSDL의 공식 사이트는 http://nsdl.org이다
  22. 프로젝트의 명칭은 Open Community Knowledge Hypermedia Administration and Metadata 의 약칭이다
  23. 이를 위한 OCKHAM 개발의 기본원칙은 다음 4가지로 제시하고 있다: 개방형 표준 사용(Open Standards), 컴포넌트 기반의 개발(Component Based Development). 간편한 적용(Ease of Adoption). 참여와 협업(Open Collaboration)
  24. 테스트베드 서비스 유형에는 다음의 7 가지를 제시하고 있다: 탐색과 접근 서비스, OAI/Z39.50 검색 서비스, 공지 서비스. 브라우징 서비스, 변환 서비스, 목록작성 서비스, NSDL 탐색도구 (pathfinding) 서비스
  25. Jeremy Frumkin, "The problem of mainstreaming digital libraries," OCLC Systems & Services: International Digital Library Perspectives 20(3), 2004: 106-109
  26. http://comm.nsdl.org/download.php/326/NSDLArchOverview.doc (인용 2006. 5. 10)
  27. ZDNet Korea 뉴스기사 (2006-02-24)
  28. 분산검색 방식은 미국의 NISO 가 MetaSearch 프로젝트 연구도 참조할 만하다. 이 프로젝트에서는 접근관리 (Access management), 장서 및 서비스 메타데이터 기술(Collection & Service Descriptions). 검색(Search/Retrieval)의 영역에서 관련된 요소기술과 표준에 대한 연구를 진행하고 있다. http://www.nisc.org/committees/MS_initiative.html (인용 2006. 5. 10)
  29. Tamar Sadeh. "The challenge of metasearchin." New Library World, 105(1198/1199), 2004: 104-112 https://doi.org/10.1108/03074800410526721
  30. 지식정보는 장서 메타데이터를 의미한다. 장서 시스템의 이름, 포괄범위, 언어, 데이터유형 등과 같은 장서 그 자체에 대한 서지 메타데이터와 프로토콜 유형, 목록유형, 레코드 구조 등과 같은 접근에 필요한 정보기술적인 정보로 구성된다
  31. 이 방식에 대해서는 다음 논문을 참조. 이수상, 이길신, "OpenURL을 이용한 정보자원의 연계기술에 관한 연구," 도서관 58(1), 2003: 107-132. 김성희, "OpenURL을 이용한 전자자원 링킹시스템 비교 . 분석," 정보관리학회지, 제22권. 제4호(2005), pp.221-234
  32. 현재 거론되고 있는 표준적인 장서 메타데이터는 RSLP CD 스키마. DCMI CD AP가 대표적이다. DCMI CD AP는 NISO CD 스키마라 부르기도 한다. 장서 메타데이터를 이용한 통합검색 기반을 제공하는 주요 사례는 SCONE, GDL, NSDL, OAC, EnrichUK, IMLS DCC, Cornucopia 등이 있으며, 이들은 대개 특정 지역이나 주제 영역의 도서관, 박물관, 기록관 등의 장서를 대상으로 하고 있다
  33. 웹 2.0은 시멘틱웹과 비슷한 개념이다. 웹을 바라보는 관점에서 차이가 있다. 웹2.0은 웹을 인간 중심에서 바라보며, 시멘틱웹은 웹을 기술 중심에서 바라본다. 즉, 웹2.0에서 웹은 새로운 기술보다 인간이 웹을 사용하고 바라보는 관점에서 사용하는 개념이다. 도서관 영역에서 웹 2.0은 이제 막 논의가 시작되고 있으며, 사람들에 따라서 '도서관 2.0(Library 2.0)'이라는 명칭을 사용하기도 한다. 이와 관련된 최근의 논문은 다음과 같다. Theo van Veen. "Serving Services in Web 2.0," Ariadne 47, 2006. http://www.ariadne.ac.uk/issue47/vanveen/. Paul Miller, "Coming Together around Library 2.0," D-lib Magazine, Vol.l2, No.4(2006). http://www.dlib.org/dlib/apriI06/miller/04miller.html. (인용 2006. 5. 12)