DOI QR코드

DOI QR Code

Word Sense Disambiguation of Predicate using Sejong Electronic Dictionary and KorLex

세종 전자사전과 한국어 어휘의미망을 이용한 용언의 어의 중의성 해소

  • 강상욱 (부산대학교 전기전자컴퓨터공학과) ;
  • 김민호 (부산대학교 전기전자컴퓨터공학과) ;
  • 권혁철 (부산대학교 정보컴퓨터공학부) ;
  • 전성규 (KBS 방송기술연구소) ;
  • 오주현 (KBS 방송기술연구소)
  • Received : 2015.03.20
  • Accepted : 2015.04.28
  • Published : 2015.07.15

Abstract

The Sejong Electronic(machine readable) Dictionary, which was developed by the 21 century Sejong Plan, contains a systematic of immanence information of Korean words. It helps in solving the problem of electronical presentation of a general text dictionary commonly used. Word sense disambiguation problems can also be solved using the specific information available in the Sejong Electronic Dictionary. However, the Sejong Electronic Dictionary has a limitation of suggesting structure of sentences and selection-restricted nouns. In this paper, we discuss limitations of word sense disambiguation by using subcategorization information as suggested by the Sejong Electronic Dictionary and generalize selection-restricted noun of argument using Korean Lexico-semantic network.

21세기 세종계획을 통하여 개발된 세종 전자사전은 한국어 어휘의 내재정보에 대한 체계적인 분석 정보를 담고 있다. 이는 일반적으로 사용하는 텍스트 사전이 가지는 전산적 표상 문제를 해결하는데 많은 도움을 주고 있다. 자연언어처리 분야에서 끊이지 않는 문제인 어의 중의성 해소(Word Sense Disambiguation) 문제 또한 세종 전자사전의 상세 정보를 이용하여 해결할 수 있지만, 실제 제시된 문형과 논항의 선택제약 명사로는 어의 중의성 해소 문제를 해결하는 데 한계를 보인다. 본 연구에서는 세종 전자사전의 용언 하위범주화 정보를 이용한 어의 중의성 해소의 한계점을 보이고, 한국어 어휘의미망(Korean Lexico-semantic network)을 이용하여 논항의 선택제약 정보를 일반화한다.

Keywords

Acknowledgement

Supported by : KBS 기술연구소

References

  1. Burnard, Lou. Reference guide for the British National Corpus (world edition), 2000.
  2. Taylor, Ann, Mitchell Marcus, and Beatrice Santorini, The Penn treebank: an overview, pp. 5-22, Springer, Netherlands, 2003.
  3. Ide, Nancy, and Catherine Macleod, "The american national corpus: A standardized resource of american english," Proc. of Corpus Linguistics 2001, Vol. 3, 2001.
  4. Y.P. Hong, Result and problem of 21 century Sejong Plan Business, The National Institute of the Korean Language, Saegugeosaenghwal, Vol. 19, No. 1, 2009. (in Korean)
  5. J.S. Hong, Development Research Paper of 21 century Sejong Plan Electronic Dictionary. (11-1370252-000063-10), the Ministry of Culture and Tourism, The National Institute of the Korean Language, 2007. (in Korean)
  6. M. Kim, H. Kwon, "Word Sense Disambiguation using Semantic Relations in Korean WordNet," Journal of KIISE: Software and Application. Vol. 38, No. 9, pp. 554-564. Oct. 2011. (in Korean)
  7. J. Jo, G. Shin, "A Graph-based Word Sense Disambiguation Using Measures of Graph Connectivity," Journal of KIIT, Vol. 12, No. 6, pp. 143-151, Jun. 2014. (in Korean)
  8. S. Kim, S. Bae, Y. Ko, "Ambiguity Resolution and Expansion of Query using Wikipedia," Proc. of KIISE, Vol. 37, No. 2A, pp. 46-47. Nov. 2010. (in Korean)
  9. S. Bae, G. Lim, A. Yoon, "Mapping Heterogenous Ontologies for the HLP Applications - Sejong Semantic Classes and KorLexNoun 1.5," Korean Journal of Cognitive Science, Vol. 20, No. 1, pp. 95-126, Mar. 2010. (in Korean)
  10. A. Yoon, S. Hwang, E. Lee, H. Kwon, "Construction of Korean Wordnet "KorLex 1.5"," Journal of KIISE: Software and Application, Vol. 36, No. 1, pp. 92-108, Jan. 2009. (in Korean)
  11. Ch. Fellbaum (ed.), WordNet: An Electronic Lexical Database, The MIT Press, Cambridge, 1998.