Distinguishing Referential Expression 'Geot' Using Decision Tree

결정 트리를 이용한 지시 표현 '것'의 구별

  • 조은경 ((주)다음커뮤니케이션) ;
  • 김학수 (강원대학교 IT특성화학부(대학) 컴퓨터정보통신공학) ;
  • 서정연 (서강대학교 컴퓨터학과)
  • Published : 2007.09.15

Abstract

Referential expression 'Geot' is often occurred in Korean dialogues. However, it has not been properly dealt with by the previous researchers of reference resolution, since it is not by itself the referential expression like pronoun and definite noun phrases, and it has never been discriminated from non-referring 'geot'. To resolve this problem, we establish a feature set which is based on the linguistic property of 'geot' and the discourse property of its text, and propose a method to identify referential 'geot' from non-referring 'geot' using decision tree. In the experiment, our system achieved the F-measures of 92.3% for non-referring geot and of 82.2% for referential geot and the total classification performance of 89.27%, and outperformed the classification system based on pattern rules.

지시 표현 '것'은 한국어 대화에서 자주 등장하는 표현이지만, 그 자체로서 대명사나 한정 명사구와 같은 지시 표현이 아니고, 비지시적인 표현으로 쓰이는 '것'과 구별되지 못했기 때문에 지시 해석(reference resolution)에 관한 기존 연구에서 제대로 다루어지지 못했다. 이러한 문제를 해결하기 위해 '것'이 가지고 있는 언어학적 속성과 담화 상의 속성을 기반으로 하여 자질 집합을 설정하고, 결정트리를 이용하여 '것'을 구별하는 방법을 제안한다. 이 방법에 의한 시스템은 비지시 표현의 것에 대해 92%, 지시표현의 것에 대해 82%의 F-measure를 보였으며, 전체적인 분류 성능은 89%였다. 이는 패턴에 따른 규칙을 적용한 분류 성능에 비해 약 15% 가량 향상된 결과이다.

Keywords

References

  1. 김학수, 다중모드 대화 시스템에서의 명사 대용어구 처리, 석사학위논문, 서강대학교, 1997
  2. 남기심, '불완전명사 '것'의 쓰임', 국어의 이해와 인식, 한국문화사, 1991
  3. 노현철, 이근배, 이종혁, 박재득, '한국어 담화 특성에 기반한 영역 독립 생략 및 대용 처리', 정보과학회논문지(B) 제25권 제12호, pp. 1845-1857. (1998)
  4. 양명희, 현대국어 대용어에 대한 연구, 국어학총서33, 국어학회, 태학사, 1998
  5. 이상호, 미등록어를 고려한 한국어 품사 태깅 시스템 구현, 석사학위논문, 한국과학기술원, 1995
  6. 조은경, 이민행, '지시 해석을 위한 것의 구별과 쓰임에 관한 연구', 한국어학 제 31집, 한국어학회, 2006
  7. MAK Halliday and Ruqaiya Hasan, Cohesion in English, Longman, 1976
  8. Shalom Lappin and Herbert J. Leass, 'An Algorithm for Pronominal Anaphora Resolution,' Computational Linguistics, volume 20, number 4. (1994)
  9. Lluis Marquez, 'Machine Learning and Natural Language Processing,' Technical Report LSI00-45-R, Departament de Llenguatges i Sistemes Informatics (LSI), Universitat Politecnica de Catalunya (UPC), Barcelona, Spain (2000)
  10. David L. Bean and Ellen Riloff., 'Corpus-Based Identification of Non-Anaphoric Noun Phrases', In the proceedings of ACL. (1999)
  11. Richard Evans, 'Applying Machine Learning Toward an Automatic Classification of It,' Literary and Linguistic Computing (2001)
  12. Renata Vieira and Massimo Poesio, 'Processing definite descriptions in corpora,' Corpus-based and computational approaches to discourse anaphora. Simon Botley and Anthony Mark McEnery.(ed.) Benjamins Pub. 2000
  13. Vincent Ng and Claire Cardie, 'Identifying Anaphoric and Non-Anaphoric Noun Phrases to Improve Coreference Resolution,' In the proceedings of COLING. (2002)
  14. Vincent Ng and Claire Cardie 'Learning Noun Phrase Anaphoricity to Improve Coreference Resolution-Issues in Representation and Optimization,' In the proceedings of ACL. (2004)
  15. Antonio Ferrández and Lidia Moreno 'A computational approach to pronominal anaphora, oneanaphora and surface count anaphora,' In the proceedings of Discourse Anaphora and Anaphora Resolution (1998)
  16. Michael Strube and Christoph Muller, 'A Machine Learning Approach to Pronoun Resolution in Spoken dialogue,' In the proceedings of ACL. (2003)
  17. Didier Baltazart and Laurence Kister, 'Is it possible to predetermine a referent included in a French N De N structure?,' Corpus-based and computational approaches to discourse anaphora. Simon Botley and Anthony Mark McEnery.(ed.) Benjamins Pub, 2000
  18. Joseph F. McCarthy and Wendy G. Lehnert, 'Using Decision Trees for Coreference Resolution,' In the proceedings of International Joint Conference on Artificial Intelligence (1995)
  19. Ian H. Witten and Eibe Frank, Morgan Kaufmann. Data Mining: Practical machine learning tools and techniques, San Francisco, 2005
  20. Quinlan R. J., C4.5: Programs for Machine Learning, Morgan Kaufmann, San Mateo, CA, 1993