DOI QR코드

DOI QR Code

Design and Implementation of Minutes Summary System Based on Word Frequency and Similarity Analysis

단어 빈도와 유사도 분석 기반의 회의록 요약 시스템 설계 및 구현

  • Received : 2019.07.31
  • Accepted : 2019.09.05
  • Published : 2019.10.28

Abstract

An automated minutes summary system is required to objectively summarize and classify the contents of discussions or discussions for decision making. This paper designs and implements a minutes summary system using word2vec model to complement the existing minutes summary system. The proposed system is further implemented with word2vec model to remove index words during morpheme analysis and to extract representative sentences with common opinions from documents. The proposed system automatically classifies documents collected during the meeting process and extracts representative sentences representing the agenda among various opinions. The conference host can quickly identify and manage all the agendas discussed at the meeting through the proposal system. The proposed system analyzes various agendas of large-scale debates or discussions and summarizes sentences that can be representative opinions to support fast and accurate decision making.

의사 결정을 위한 토론이나 토의의 내용을 객관적 요약하고 분류하는 자동화된 회의록 요약 시스템이 요구되고 있다. 본 논문은 기존에 사용되었던 회의록 요약 시스템을 보완할 수 있도록 word2vec 모델을 이용한 회의록 요약 시스템을 설계하고 구현한다. 제안 시스템은 형태소 분석 과정에서 불용어를 제거하고 문서에서 공통적인 의견을 가진 대표 문장을 추출하기 위해 추가로 word2vec 모델로 학습을 수행한다. 제안 시스템은 회의 과정에서 수집되는 문서를 분석하여 자동으로 분류하고 다양한 의견들 중 안건을 대표하는 대표 문장을 추출한다. 회의 진행자는 제안 시스템을 통해 회의에서 다뤄지는 모든 안건을 보다 빠르게 확인하고 관리할 수 있다. 제안 시스템은 대규모 토론이나 토의의 여러 가지 안건을 분석하여 대표 의견이 될 수 있는 문장을 요약하여 빠른 정확한 의사 결정을 지원한다.

Keywords

References

  1. H. Liu, X. Wang, Y. Wei, W. Shao, J. Liono, F. D. Salim, B. Deng, and J. Du, "ProMETheus: An Intelligent Mobile Voice Meeting Minutes System," Proc. International Conference on Mobile and Ubiquitous Systems: Computing, Networking and Services, pp.392-401, 2018.
  2. H. Miura, Y. Takegawa, A. Terai, and K. Hirata, "Interactive Minutes Generation System Based on Hierarchical Discussion Structure," Proc. IEEE/WIC/ACM International Conference on Web Intelligence, pp.459-465, 2018.
  3. Z. Zhao, H. Pan, C. Fan, Y. Liu, L. Li, and M. Yang, "Abstractive Meeting Summarization via Hierarchical Adaptive Segmental Network Learning," Proc. The World Wide Web Conference, pp.3455-3461, 2019.
  4. T. Huang, C. Hsieh, and H. Wang, "Automatic meeting summarization and topic detection system," Data Technologies and Applications, Vol.52, No.3, pp.351-365, 2018. https://doi.org/10.1108/DTA-09-2017-0062
  5. 이병수, 어휘의 동시 발생 빈도와 분포를 이용한 다중주제 회의록 요약, 성균관대학교, 석사학위논문, 2015.
  6. 김선공, word2vec모델과 RNN을 이용한 영화 리뷰의 감성분석, 동국대학교, 석사학위논문, 2016.
  7. 노현아, 단어 빈도 가중치를 이용한 자동 문서 분류, 전남대학교, 석사학위논문, 2013.
  8. 백민지, word2vec모델 학습을 통한 의미 기반 해외 유사 특허 검색 방안, 국민대학교, 석사학위논문, 2017.
  9. 김정미, 이주홍, "word2vec모델을 활용한 RNN기반의 문서 분류에 관한 연구," 한국지능시스템학회 논문지, 제27권, 제6호, pp.560-565, 2017.
  10. Y. kim, "Convolutional Neural Network for Sentence Classification," Proc. Conference on Empirical Method in National Language Processing, pp.1746-1751, 2014.
  11. T. Mikolov, I. Sutskever, K. Chen, G. S. Corrado, and J. Dean, "Distributed Representations of Words and Phrases and their Compositionality," Proc. Annual Conference on Neural Information Processing Systems, pp.3111-3119, 2013.
  12. 김성민, 단어 벡터화를 통한 특징 단어 기반 문서 관련성 분석 방법 영화 스크립트 비교를 중심으로, 건국대학교, 석사학위논문, 2016.
  13. G. Yoav and O. Levy, "word2vec Explained: deriving Mikolov etal's negative-sampling word-embedding method," CoRR abs/1402.3722, 2014.
  14. T. Mikolov, K. Chen, G. Corrado, and J. Dean, "Efficient Estimation of Word Representations in Vector Space," Proc. International Conference on Learning Representations Workshop, 2013.
  15. 김도우, 구명완, "Doc2Vec과 Word2Vec을 활용한 Convolutional Neural Network 기반 한국어 신문기사 분류," 정보과학회논문지, 제44권, 제7호, pp.742-747, 2017.
  16. Python 형태소 분석기 Konlpy, http://konlpy-ko.readthedocs.io/ko/v0.43/api/konlpy.tag/
  17. word2vec 모델, https://radimrehurek.com/gensim/models/word2vec.html