Korean Speech Act Tagging using Previous Sentence Features and Following Candidate Speech Acts

이전 문장 자질과 다음 발화의 후보 화행을 이용한 한국어 화행 분석

  • 김세종 (포항공과대학교 컴퓨터공학과) ;
  • 이용훈 (포항공과대학교 컴퓨터공학과) ;
  • 이종혁 (포항공과대학교 컴퓨터공학과)
  • Published : 2008.06.15

Abstract

Speech act tagging is an important step in various dialogue applications, which recognizes speaker's intentions expressed in natural language utterances. Previous approaches such as rule-based and statistics-based methods utilize the speech acts of previous utterances and sentence features of the current utterance. This paper proposes a method that determines speech acts of the current utterance using the speech acts of the following utterances as well as previous ones. Using the features of following utterances yields the accuracy 95.27%, improving previous methods by 3.65%. Moreover, sentence features of the previous utterances are employed to maximally utilize the information available to the current utterance. By applying the proper probability model for each speech act, final accuracy of 97.97% is achieved.

화행 분석이란 자연언어로 된 발화를 통해서 나타나는 화자의 의도를 인식하는 것으로 대화를 처리하는 여러 응용 분야에서 중요하게 요구되는 과정이다. 기존의 연구에서는 이전 발화의 화행과 현재 발화의 문장 자질을 사용하여 규칙 기반 및 통계 기반의 연구가 진행되었다. 하지만 본 논문에서는 현재 발화 이후의 후보 화행을 추정하여 이를 현재 발화의 화행을 결정하는데 사용함으로써 기존의 연구와 차별화를 두었으며, 실제로 기존 방법보다. 3.65%의 성능 향상을 보인 95.27%의 정확도(accuracy)를 보였다. 또한 이전 발화의 화행 정보뿐만 아니라 이전 화행을 결정하는데 사용했던 문장 자질을 현재 발화의 화행 결정에 추가적으로 사용함으로써 이전 발화의 화행 결정을 통해 소실된 정보들의 활용을 최대화하였다. 마지막으로 화행의 종류에 따라 그에 알맞은 확률 모델을 단계별로 적용하여 최종적으로 97.97%의 정확도를 얻었다.

Keywords

References

  1. J. Allen, et al., 'The TRAINS Project: A case study in building a conversational planning agent,' Journal of Experimental & Theoretical Artificial Intelligence, Vol.7, No.1, pp. 7-48, 1995. https://doi.org/10.1080/09528139508953799
  2. L. Lambert and S. Carberry, 'A tripartite plan-based model of dialogue,' Proceedings of the 29th annual meeting on Association for Computational Linguistics, pp. 47-54, 1991
  3. J. Chu-Carroll and S. Carberry, 'Response generation in collaborative negotiation,' Proceedings of the 33rd annual meeting on Association for Computational Linguistics, pp. 136-143, 1995
  4. C. Doran, et al., 'Comparing Several Aspects of Human-Computer and Human-Human Dialogues,' Current and New Directions in Discourse and Dialogue, pp. 133-159, 2003
  5. A. Stolcke, et al., 'Dialogue act modeling for automatic tagging and recognition of conversational speech,' Computational Linguistics, Vol.26, No.3, pp. 339-373, 2000 https://doi.org/10.1162/089120100561737
  6. E. Ivanovic, 'Dialogue act tagging for instant messaging chat sessions,' Proceedings of the ACL Student Research Workshop, pp. 79-84, 2005
  7. 김경선, 서정연, '자질 선택 기법을 이용한 한국어 화행 결정,' 정보과학회논문지: 소프트웨어 및 응용, Vol.30, No.3, pp. 278-284, 2003
  8. M. Core and J. Allen, 'Coding Dialogs with the DAMSL Annotation Scheme,' Proceedings of the AAAI Fall Symposium on Communicative Actionin Humans and Machines, pp. 28-35, 1997
  9. SRI ATIS Collection, http://www.ai.sri.com/-communic/amex/amex.html
  10. 이현정, 이재원, 서정연, '자동통역을 위한 한국어 대화 문장의 화행 분석 모델', 정보과학회논문지(B), Vol.25, No.10, pp. 1443-1452, 1998
  11. K. Samuel, et al., 'Dialogue Act Tagging with Transformation-Based Learning,' Proceedings of the 36th annual meeting on Association for Computational Linguistics, Vol.2, pp. 1150-1156, 1998
  12. W. Choi, et al., 'An Integrated Dialogue Analysis Model for Determining Speech Acts and Discourse Structures,' IEICE Transactions on Information and Systems, Vol.E88-D, No.1, pp. 150-157, 2005 https://doi.org/10.1093/ietisy/E88-D.1.150
  13. S. Lee and J. Seo, 'Korean Speech Act Analysis System Using Hidden Markov Model with Decision Trees,' International Journal of Computer Processing of Oriental Languages, Vol.15, No.3, pp. 231-243, 2002 https://doi.org/10.1142/S0219427902000625
  14. I. Witten and E. Frank, 'Weka - Machine Learning Algorithms in Java,' Data Mining : Practical Machine Learning Tools and Techniques with Java Implementations, pp. 264-321, 2000
  15. N. Reithinger and M. Klesen, 'Dialogue Act Classification Using Language Models,' Proceedings of EuroSpeech-97, pp. 2235-2238, 1997
  16. T. Fukada, et al., 'Probabilistic Dialogue Act Extraction for Concept Based Multilingual Translation Systems,' Proceedings of the International Conference on Spoken Language Processing, Vol. 6, pp. 2771-2774, 1998
  17. N. Webb, et al., 'Dialogue Act Classification Based on Intra-Utterance Features,' Proceedings of the AAAI Workshop on Spoken Language Understanding, 2005