A Korean Grammar Checker based on the Trees Resulted from a Full Parser

전체 문장 분석에 기반한 한국어 문법 검사기

  • 이공주 (이화여자대학교 컴퓨터학과) ;
  • 황선영 (연세대학교 국어정보 협동과정) ;
  • 김지은 ((주)한국마이크로소프트)
  • Published : 2003.10.01

Abstract

The purpose of a grammar checker is to find a grammatical erroneous expression in a sentence, and to provide appropriate suggestions for them. To find those errors, grammar checker should parse the whole input sentence, which is a highly time-consuming job. B7or this reason, most Korean grammar checkers adopt a partial parser that can analyze a fragment of a sentence without an ambiguity. This paper presents a Korean grammar checker using a full parser in order to find grammatical errors. This approach allows the grammar checker to critique the errors between the two words in a long distance relationship within a sentence. As a result, this approach improves the accuracy in correcting errors, but it nay come at the expense of decrease in its performance. The Korean grammar checker described in this paper is implemented with 65 rules for checking and correcting the grammatical errors. The grammar checker shows 96.49% in checking accuracy against the test corpus including 7 million words.

문법 검사기는 문장의 문법 오류를 찾고 이에 대한 적절한 대안을 제시하는 것이다. 문법 오류를 찾기 위해서 문법 검사기는 전체 문장을 분석해야 하며 이는 많은 자원이 소요되는 작업이다. 이러한 이유로 대부분의 한국어 문법 검사기는 중의성이 없는 작은 부분에 대해서만 구문 분석을 수행하는 부분구문 분석기를 이용하고 있다. 본 논문의 구문 분석기는 문법 오류를 검사하기 위해서 전체 구문 분석기를 사용하였다. 이 방식은 여러 단어를 사이에 두고 떨어져 있는 두 단어간에 문법적 오류가 있을 경우에도 이를 찾아서 고칠 수 있다. 결과적으로 이 방식은 수행 성능을 저하시키는 대신, 문법 오류를 수정하는 정확률의 향상을 기대할 수 있다. 본 논문의 문법 검사기는 문법 오류를 찾고 수정하기 위해서 65개의규칙을 사용한다. 전체 구문 분석기를 사용하는 한국어 문법 검사기는 약 7백만 어절로 구성된 실험 코퍼스에 대해서 약 96.49%의 교정 정확률을 얻을 수 있었다.

Keywords

References

  1. 채영숙, 연어 규칙에 기반한 한국어 문서 교정 시스템의 구현, 부산대학교 박사학위 논문, 1998
  2. 소길자, 권혁철, 어휘적 중의성 제거 규칙과 부분 문장 분석을 이용한 한국어 문법 검사기, 정보과학회 논문지, 제23권 제3호, p. 305-315, 2001
  3. 한국전자통신연구원, 구문 분석을 이용한 한국어 문법/문체 검사기의 구현, 한국전자통신연구원 연구 보고서, p. 21-47, 1999
  4. 남현숙, 김상훈, 김지원, 권현주, 정유진, 권혁철, 한국어 철자/문법 검사기와 웹 기반 언어 학습 시스템의 통합 환경 구축, 한국인지과학회 춘계 학술대회, pp. 37-40, 2000
  5. MS Internal Documents: NLPwin Overview
  6. 고영근, 남기심, 표준국어문법론, 탑출판사, 1985