Design and Implementation of Korean Verb-OntoNet

한국어 Verb-OntoNet의 설계와 구축

  • 이선아 (인천대학교 컴퓨터공학과) ;
  • 최진탁 (인천대학교 컴퓨터공학부)
  • Published : 2013.02.28

Abstract

This paper suggests the semantic understanding of vocabulary and how to resolve polysemy in order to create intelligent and smart information environment. We defined sentence patterns for the semantic analysis of Korean language vocabulary, and built Verb-OntoNet, a sentence pattern dictionary centering on Korean language predicatives utilized under constraints for semantic understanding of lexical situations. For the design of Verb-OntoNet in this study, we defined semantic roles according to surface particle constraining the complement constituent of predicatives and its corresponding representative particle constraining the semantic role of nouns. Then, using representative particles and their semantic roles, we defined sentence patterns representing the meanings of Korean language predicatives and used them as standards for building a general-purpose Korean sentence pattern dictionary.

본 논문에서는 자연언어에 대한 어휘의 의미를 파악하기 위하여, 어휘의 중의성에 대한 문제를 해결하는 것은 중요한 일이다. 한국어 어휘는 용언과 어휘들이 의미적 역할에 따라 결합되는 특성을 보여준다. 그래서 한국어 어휘의 의미 분석을 위하여 문형 패턴을 정하고, 어휘의 상황을 의미 파악하기 위한 제약 조건으로 활용하였다. 입력문으로 부터 용언(동사, 형용사)과 의존되는 표층 조사 성분을 파악하고 구문 매칭을 수행한 후, 명사와 의미 매칭을 이루도록 설계를 한 의미추론제약 알고리즘을 이용하여 용언의 보어 성분을 제약하는 대표 조사들에 대한 문형 패턴이 정의된 Verb-OntoNet사전을 구축하여 중의성문제에 대한 효율성을 검증하였다.

Keywords

References

  1. Lee W. Lacy, "OWL : Representing Information Using the Web Ontology Language", Trafford Publishing. CANADA. pp. 25, Nov. 2004.
  2. T. R Cruber, "A Translation Approach to Portable Ontology Specification", Knowledge Acquisition, Vol. 5, No. 2, pp. 199-200, June 1993. https://doi.org/10.1006/knac.1993.1008
  3. 강신재, "온톨로지 구축 및 단어 의미 중의성 해소에의 활용", 정보처리학회지, 제 11-B권, 4호, pp. 491-500, 2004년 8월.
  4. 최호섭 외, "한국어 의미망 구축과 활용 - 명사를 중심으로", 한국어학회, 한국어학 제 17집, pp. 301-329, 2002년 12월.
  5. 최석두, "대단위 온톨로지 구축을 위한 시소러스 개발", 정보관리학회지, 제 23권, 제 62호, pp. 147-164, 2006년 12월.
  6. 최석두, 이우범, 김이겸, 최상기, 한상길, 이정연, "대단위 우리말 온톨로지 구축을 위한 시소러스의 개발", 정보관리학회지, 제 23권, 제 4호, pp. 147-164, 2006년 12월.
  7. 안광모, 한규열, 서영훈, "어휘별 중의성제거 규칙과 통계 정보를 이용한 한국어 품사 태깅", 콘텐츠학회논문지, 제 9권, 제 2호, pp. 18-26 , 2009년 2월.
  8. 이용구, "사전정보를 이용한 단어 중의성 해소모형에 관한 실험적 연구", 연세대 박사논문, 2007년 2월..
  9. 정용주, "하나의 속성을 사용하는 속성문법 작성의 일반화에 대한 연구", 한국인터넷방송통신학회 논문지, 제 11권, 제 1호, pp. 171-176, 2011년 2월.
  10. 김봉모, "한국어 문장 분석을 위한 용언의 하위 범주화", 부산대학교, 국어공학센터, 시스템공학연구소 보고서, 1996년 8월.
  11. 이운영, "한국어 명사의 다의적 해석: 생성어휘부 이론에 입각한 연구", 서울대학교 언어학과 박사학위 논문, 2004년 2월.
  12. 박은성, 성동수, 이건배, "지능형 동영상 제작을 위한 감성어휘 확장", 한국정보기술학회 논문지, 제 9권, 제 8호, pp. 193-201, 2011년 08월.
  13. 정병희, 최진탁, 박세승, "환자 만족도 향상을 위한 진료 스케줄 안내시스템 구현", 한국정보기술학회 논문지, 제 10권, 제 2호, pp. 88-93, 2012년 02월.