DOI QR코드

DOI QR Code

Thesaurus Updating Using Collective Intelligence: Based on Wikipedia Encyclopedia

집단지성을 활용한 시소러스 갱신에 관한 연구: 위키피디아를 중심으로

  • 한승희 (서울여자대학교 사회과학대학 문헌정보학과)
  • Published : 2009.09.30

Abstract

The purpose of this study is to suggest how the classic thesaurus structure of terms and links can be mined and updated from Wikipedia encyclopedia, which is the best practice of collective intelligence. In a comparison with ASIS&T thesaurus, it was found that Wikipedia contains a substantial coverage of domain-specific concepts and semantic relations. Furthermore, it was resulted that the structural characteristics of Wikipedia, such as redirects, categories, and mutual links are suitable to extract semantic relationships of thesaurus. It is needed to apply to update various thesauri, including multilingual thesaurus, in order to generalize the results of this research.

이 연구에서는 위키피디아를 활용하여 시소러스를 갱신하고, 그 결과를 평가함으로써 시소러스 갱신에 있어 집단지성의 활용가능성에 대해 확인하고자 하였다. ASIS&T 시소러스를 대상으로 시소러스를 갱신한 결과, 용어 포괄성의 측면에서 ASIS&T 시소러스에 비해 위키 시소러스가 우수한 것으로 나타났다. 또한, 갱신된 시소러스를 평가한 결과, 위키피디아가 시소러스 갱신에 활용될 수 있음이 증명되었다. 특히, 리디렉션, 카테고리, 상호 링크로 요약되는 위키피디아의 구조적 특성은 시소러스의 의미관계를 추출하는 데 있어 적합하다는 것을 확인하였다. 이 연구의 결과를 일반화하기 위해 다국어 시소러스를 포함한 다양한 시소러스를 대상으로 적용해 볼 필요가 있다.

Keywords

References

  1. 김지훈. 2002. 디지털 환경에서 시소러스의 동향 과 연구과제. 國會圖書館報, 39(6): 3-27
  2. 김지훈, 김태수. 2006. 용어정의와 관계추출을 통한 시소러스 확장에 관한 연구. 한국 문헌정보학회지, 40(1): 293-314
  3. 김학래, 최재화, 김홍기. 2006. 사회적 소프트웨 어(Social Software)와 지식관리 프로세 스. 한국지능정보시스템학회 2006 춘계 학술대회 논문집, 316-323
  4. 남영준, 이영주. 2002. 시소러스 구축과 유지보수 방안에 대한 연구. 國會圖書館報, 39(6): 49-68
  5. 박재천, 신지웅. 2007. 웹2.0플랫폼에서의 집단지성 활용방안 연구: 교육분야에서의 적용 을 중심으로. 인터넷정보학회지, 8(2):15-20
  6. 석영희. 2006. 집단지성(Collective Intelligence) 을 통한 정보생산의 사회적 의미. 석사학위논문, 영남대학교 대학원 사회학과
  7. 위키백과.
  8. 이재윤. 1994. 동적 시소러스 구축에 관한 실험적 연구. 석사학위논문, 연세대학교 대 학원 문헌정보학과
  9. 장준국. 2004. 사용자 그룹 지식을 활용한 온라인 시소러스 구축 시스템. 석사학위논문, 고려대학교 교육대학원 컴퓨터공학 전공
  10. 제임스 서로위키 지음. 홍대운, 이창근 옮김. 2005. 대중의 지혜: 시장과 사회를 움직이는 힘. 서울: 랜덤하우스
  11. 최석두. 2000. 시소러스 標準開發에 대한 硏究. 지식처리연구, 1(2): 1-38
  12. 피에르 레비 지음. 권수경 옮김. 2002. 집단지성: 사이버 공간의 인류학을 위하여. 서 울: 문학과지성사
  13. 한승희. 2006. 단어연상검사법을 이용한 탐색 시소러스 구축에 관한 실험적 연구. 한국 문헌정보학회지, 40(3): 289-304
  14. Aitchison, Jean, Alan Gilchrist, and David Bowden. 2000. Thesaurus Construction and Use: A Practical Manual. 4th ed. Chicago: Fitzroy Dearborn Publishers
  15. Curran, James R. and Marc Moens. 2002. 'Improvements in automatic thesaurus extraction.' Proceedings of the ACL- 02 Workshop on Unsupervised Lexical Acquisition, 9: 59-66 https://doi.org/10.3115/1118627.1118635
  16. Doerr, M. 2001. 'Semantic Problems of Thesaurus Mapping.' Journal of Digital Information[online], 1(8). [cited 2009. 4.7].
  17. Enterprise 2.0 기반의 지식 경영 시스템 - 집 단 지성 활용. 2007. In Mimul's Developer World[personal blog]. 2007년 11월 17일. [cited 2009.5.13].
  18. Fischer, Gerhard. 2003. 'Designing Social Networks in Support of Social Creativity.' Position Paper for the Workshop on Moving from Analysis to Design: Social Networks in the CSCW Context, ECSCW '03: 14-18
  19. Heylighen, Francis. 1999. 'Collective Intelligence and its Implementation on the Web: Algorithms to Develop a Collective Mental Map.' Computational & Mathematical Organization Theory, 5(3): 253-280 https://doi.org/10.1023/A:1009690407292
  20. Ito, Masahiro, Kotaro Nakayama, Takahiro Hara, and Shojiro Nishio. 2008. 'Association Thesaurus Construction Methods based on Link Co-occurrence Analysis for Wikipedia.' Proceeding of the 17th ACM conference on Information and knowledge management, 817-826 https://doi.org/10.1145/1458082.1458191
  21. Kim, Chai. 1973. 'Theoretical Foundations of Thesaurus-Construction and Some Methodological Considerations for Thesaurus Updating.' Journal of the American Society for Information Science, 24(2): 148-156 https://doi.org/10.1002/asi.4630240210
  22. Kramer, R., R. Nicholai, and C. Habeck. 1997 'Thesaurus Federations: Loosely Integrated Thesauri for Document Retrieval in Networks Based on Internet Technologies.' International Journal of Digital Libraries, 1: 122-131 https://doi.org/10.1007/s007990050009
  23. Medelyan, O. and D. Milne. 2008. Augmenting Domain-specific Thesauri with Knowledge from Wikipedia. In Proceedings of the NZ Computer Science Research Student Conference(NZCSRSC 2008), Christchurch, New Zealand. [online]. [cited 2009.5.2].
  24. Milne, D., O. Medelyan, and I. H. Witten. 2006. Mining Domain-Specific Thesauri from Wikipedia: A case study. In Proceedings of the International Conference on Web Intelligence(IEEE/ WIC/ACM WI 2006), Hong Kong. [online]. [cited 2009.4.30].
  25. Noubel, Jean-François. 2007. Collective Intelligence, The Invisible Reolution. [pdf file]. [cited 2009.5.8].
  26. Redmond-Neal, Alice and Marjorie M. K. Hlava ed. 2005. ASIS&T Thesaurus of Information Science, Technology and Librarianship. New Jersey: Information Today, Inc
  27. Schirmer, Robert F. 1967. 'Thesaurus Analysis for Updating.' Journal of Chemical Documentation, 7(2): 94-98 https://doi.org/10.1021/c160025a011
  28. Voss, Jakob. 2006. 'Collaborative Thesaurus Tagging the Wikipedia Way.' Wikimetrics [online], 1(1).
  29. Wang, Jun. 2006. 'Automatic Thesaurus Development: Term Extraction from Title Metadata.' Journal of the American Society for Information Science and Technology, 57(7): 907-920. Wikipedia. https://doi.org/10.1002/asi.20352

Cited by

  1. Design and Implementation of Library Information System Using Collective Intelligence and Cloud Computing vol.11, pp.11, 2011, https://doi.org/10.5392/JKCA.2011.11.11.049
  2. An Experimental Study Investigating the Retrieval Effectiveness of a Video Retrieval System Using Tag Query Expansion vol.44, pp.4, 2010, https://doi.org/10.4275/KSLIS.2010.44.4.075
  3. Design of an Integrated Monitoring System for Constructional Structures Based on Mobile Cloud in Traditional Towns with Local Heritage vol.11, pp.2, 2015, https://doi.org/10.5392/IJoC.2015.11.2.037
  4. An Experimental Study on Semantic Searches for Image Data Using Structured Social Metadata vol.44, pp.1, 2010, https://doi.org/10.4275/KSLIS.2010.44.1.117
  5. Evolution of Integrated Management Systems for Smart Library vol.8, pp.4, 2012, https://doi.org/10.5392/IJoC.2012.8.4.012
  6. A Study on Constructing Theological Thesaurus vol.27, pp.3, 2010, https://doi.org/10.3743/KOSIM.2010.27.3.207
  7. Twitter Issue Tracking System by Topic Modeling Techniques vol.20, pp.2, 2014, https://doi.org/10.13088/jiis.2014.20.2.109
  8. Improvement of Smart Library Information Service System for SaaS-based Cloud Computing Service vol.12, pp.4, 2016, https://doi.org/10.5392/IJoC.2016.12.4.023