A Exploratory Study on the Expansion of Academic Information Services Based on Automatic Semantic Linking Between Academic Web Resources and Information Services

웹 정보의 자동 의미연계를 통한 학술정보서비스의 확대 방안 연구

  • 정도헌 (한국과학기술정보연구원 정보서비스실) ;
  • 유소영 (연세대학교 대학원 문헌정보학과) ;
  • 김환민 (한국과학기술정보연구원 정보서비스실) ;
  • 김혜선 (한국과학기술정보연구원 정보서비스실) ;
  • 김용광 (연세대학교 대학원 문헌정보학과) ;
  • 한희준 (한국과학기술정보연구원 정보기술연구실)
  • Published : 2009.03.30


In this study, we link informal Web resources to KISTI NDSL's collections using automatic semantic indexing and tagging to examine the possibility of the service which recommends related documents using the similarity between KISTI's formal information resources and informal web resources. We collect and index Web resources and make automatic semantic linking through STEAK with KISTI's collections for NDSL retrieval. The macro precision which shows retrieval precision per a subject category is 62.6% and the micro precision which shows retrieval precision per a query is 66.9%. The experts' evaluation score is 76.7. This study shows the possibility of semantic linking NDSL retrieval results with Web information resources and expanding information services' coverage to informal information resources.

이 연구에서는 KISTI NDSL의 학술논문 정보를 웹 학술자원과 연계하는 실험적 연구를 수행함으로써 KISTI의 정보 유통 서비스의 확대 가능성을 살펴보고자 하였다. 이를 위해 웹 학술자원을 수집하여 STEAK 시스템을 이용한 자동 의미 연계를 생성하고 이를 학술논문 검색결과와 결합하였다. 시스템의 검색 정확률을 평가한 결과 매크로 정확률은 62.6%, 마이크로 정확률은 66.9%를 보였으며, 자동연계 성능에 대한 전문가 평가는 76.7점을 보였다. 주제 범주별 전문가 평가는 본 연구를 통해 의미연계를 잘 수행하는 경우에 높게 측정되어 시스템적 성능과 동일한 경향을 보였다. 이 연구는 다양한 웹 학술자원의 서비스 연계를 위하여 논문정보로부터 생성한 언어자원을 의미색인에 사용한 것으로 이를 통해 지속적인 웹 자원의 학술적 활용에 대한 가능성을 제시하고자 하였다.



  1. 김홍렬. 2000. 적합성 평가기준 변화에 관한 실험 연구. 한국도서관정보학회지, 31(4): 139-164.
  2. 윤정옥. 2003. 웹 자원의 서지적 조직과 접근: 국내외 대학 도서관의 사례연구. 정보관리학회지, 20(1): 271-299.
  3. 이재윤. 2005. 문서측 자질선정을 이용한 고속 문서분류기의 성능향상에 관한 연구. 정보관리연구, 36(4): 51-69.
  4. 정도헌. 2007. 다국어 전문용어의 의미망을 이용한 질의확장 시스템 구현. 제10회 디지털 도서관 컨퍼런스. 2007년 11월 29일. [서울: 코엑스 그랜드볼룸].
  5. 정도헌, 김환민, 김혜선, 신기정. 2007. 과학기술 전문용어의 주제 분야별 전문성과 자동분류 성공률 간의 연관성 비교. 제14회 한국 정보관리학회 학술대회 논문집, 31-36.
  6. 정도헌, 최희윤. 2006. 과학기술 전문용어의 다국어 의미망 생성과 분석. 정보관리연구, 37(4): 25-47.
  7. 정영미. 2005. 정보검색연구. 서울: 구미무역.
  8. Baum, J.A.C., Calabrese, T., and Brian S. Silverman. 2000. "Don'T Go It Alone: Alliance Network Composition and Startups' Performance in Canadian Biotechnology." Strategic Management Journal, 21(3): 267-294.<267::AID-SMJ89>3.0.CO;2-8
  9. Bergman, Michael K. 2001. The Deep Web: Surfacing Hidden Value, Deep Content White paper. [cited 2008. 09. 18]. .
  10. Bloehdorn S. and Andreas Hotho. 2006. "Boosting for Text Classification with Semantic Features." Lecture Notes in Computer Science, 3932: 149-166.
  11. Florescu, D., Levy, A., and A. Mendelzon. 1998. "Database Techniques for the World-Wide Web: A Survey." SIGMOD Record, 27(3): 59-74.
  12. Koch, T. 2000. "Quality-Controlled Subject Gateways: Definitions, Typologies, Empirical Overview." Online Information Review, 24(1): 24-34.
  13. Liebeskind, J. P., Oliver, A. L., Zucker, L., and Marilynn Brewer. 1996. "Social Networks, Learning, and Flexibility: Sourcing Scientific Knowledge in New Biotechnology Firms." Organization Science, 7(4): 428-443.
  14. Miller, G. A. 1956. "The Magical Number Seven, Plus or Minus Two: Some Limits on Our Capacity for Processing Information." Psychological Review, 63: 81-97.
  15. Moschitti, A., and Roberto Basili. 2004. "Complex Linguistic Features for Text Classification: A Comprehensive Study." LNCS, 2997: 181-196.
  16. Owen-Smith, J., Riccaboni, M., Pammolli, F., and Walter W. Powell. 2002. "A Comparison of U.S. and European University-Industry Relations in the Life Sciences." Management Science, 48(1): 24-43.
  17. OCW Consortium. .