DOI QR코드

DOI QR Code

An Intelligent Marking System based on Semantic Kernel and Korean WordNet

의미커널과 한글 워드넷에 기반한 지능형 채점 시스템

  • 조우진 (한림대학교 대학원 컴퓨터공학과) ;
  • 오정석 (한림대학교 대학원 컴퓨터공학과) ;
  • 이재영 (한림대학교 정보전자공과대학 공대학) ;
  • 김유섭 (한림대학교 정보통신 공학부)
  • Published : 2005.12.01

Abstract

Recently, as the number of Internet users are growing explosively, e-learning has been applied spread, as well as remote evaluation of intellectual capacity However, only the multiple choice and/or the objective tests have been applied to the e-learning, because of difficulty of natural language processing. For the intelligent marking of short-essay typed answer papers with rapidness and fairness, this work utilize heterogenous linguistic knowledges. Firstly, we construct the semantic kernel from un tagged corpus. Then the answer papers of students and instructors are transformed into the vector form. Finally, we evaluate the similarity between the papers by using the semantic kernel and decide whether the answer paper is correct or not, based on the similarity values. For the construction of the semantic kernel, we used latent semantic analysis based on the vector space model. Further we try to reduce the problem of information shortage, by integrating Korean Word Net. For the construction of the semantic kernel we collected 38,727 newspaper articles and extracted 75,175 indexed terms. In the experiment, about 0.894 correlation coefficient value, between the marking results from this system and the human instructors, was acquired.

최근 인터넷 사용자가 급증하면서 원격교육의 발전과 함께 평가에서도 원격을 이용한 방법이 많이 사용되고 있다. 하지만 현재까지는 자연언어처리의 어려움으로 객관식이나 단답식 평가가 주류를 이루고 있다. 본 논문에서는 서술형 주관식 문제의 빠르고 공정한 지능형 채점을 위하여, 다양한 언어 지식을 활용하였다. 이를 위하여, 가공되지 않은 말뭉치에서 의미커널을 구축하고, 수험자가 작성한 답안과 이미 구축된 정답을 벡터로 구성하여 이 답안간의 유사도를 의미커널을 통해 계산하여 정답여부를 자동으로 판단하도록 하였다. 의미커널을 구축하기 위하여 벡터 공간 모델에 기반한 은닉 의미 분석을 이용하였으며, 또한 한글 워드넷을 이용하여 답안의 정보부족 문제를 줄여보고자 하였다. 실험을 위하여 3000 문항의 주관식 문제를 구축하였으며, 의미커널의 구축을 위하여 38,727개의 신문기사를 모아 말뭉치로 구성하고 75,175개의 색인어를 추출하였다. 의미커널에 기반한 자동 채점 시스템으로 실제 수험자에 의하여 작성된 답안을 채점한 결과, 출제자가 실제로 채점한 결과를 기준으로 하여 최고 0.894의 상관관계를 얻을 수 있었다

Keywords

References

  1. 김경아, '웹 기반 자동 문제 출제 시스템' 동국대학교 교육대 학원 석사학위논문, 2000
  2. 정동경, '벡터유사도와 시소러스를 이용한 주관식 답안의 채점방법', 동국대학교 교육대학원 석사학위논문, 2001
  3. 박희정, 강원석, '유의어 사전을 이용한 주관식 문제 채점 시스템 설계 및 구현', 컴퓨터교육학회논문지, 2003
  4. 장정호, 김유섭, 장병탁, '헬름홀츠머신 학습 기반의 의미커널을 이용한 문서 유사도 측정', 한국정보과학회 춘계학술대회, 2003
  5. 신동호, 'Latent Semantic Analysis를 이용한 내용 기반 정보검색 시스템', 서울대학교 대학원 협동 과정 인지과학전공 석사학위논문, 2000
  6. 이은녕, 임성신, WordNet 2.0의 한국어 번역 작업과 결과물, 부산대학교 한국어정보처리연구실
  7. Cristianini, N., Shawe-Taylor, J., and Loclhi, H., 'Latent Semantic Kernels,' Journal of Intelligent Information System, Vol.18, No.2/3, pp.127-152, 2002 https://doi.org/10.1023/A:1013625426931
  8. Deerwester, S., S. T. Dumais, G. W. Furas, T. K. Landauer, and R. A. Harshman, 'Indexing by latent semantic analysis,' Journal of the American Society for Information Science, ature Medicine, Vol.41 , No.06, pp.391-407, 1990 https://doi.org/10.1002/(SICI)1097-4571(199009)41:6<391::AID-ASI1>3.0.CO;2-9
  9. Frey, B. J., 'Graphical Models for Machine Learning and Digital Communication,' The MIT Press, 1998
  10. Landauer, T. K., P. W. Foltz, and D. Laham, 'An Introduction to Latent Semantic Analysis,' Discourse Process, Vol.25, pp.259-284, 1998 https://doi.org/10.1080/01638539809545028
  11. Landauer, T. K. and Laham, D., 'Learning Human-like Knowledge by Singular Value Decomposition,' A Progress Report, NIPS, Vol.10, pp.45-51, 1997
  12. 의미론적 어휘개념에 기반한 한국어 명사 WordNet의 설계와 구축, 서울대학교 박사학위논문, 1996
  13. L. Bain and M. Engelhardt, 'Introduction to Probability and Mathematical Statistics,' Thomson Learning, pp.179-190, 1987
  14. 강승식, 범용 형태소 분석기 'HAM Ver 6.0.0', 국민대학교 자연언어 정보 검색 연구실, http://nlp.kookmin.ac.kr

Cited by

  1. Movie Contents Design of One-Person Production Using IP Cameras vol.11, pp.2, 2011, https://doi.org/10.5392/JKCA.2011.11.2.001
  2. Automatic scoring system for short descriptive answer written in Korean using lexico-semantic pattern 2017, https://doi.org/10.1007/s00500-017-2772-7
  3. Automatic Grading System for Subjective Questions Through Analyzing Question Type vol.11, pp.2, 2011, https://doi.org/10.5392/JKCA.2011.11.2.013