DOI QR코드

DOI QR Code

A Study on the Application of Topic Modeling for the Book Report Text

독후감 텍스트의 토픽모델링 적용에 관한 탐색적 연구

  • Received : 2016.11.18
  • Accepted : 2016.12.21
  • Published : 2016.12.31

Abstract

The purpose of this study is to explore application of topic modeling for topic analysis of book report. Topic modeling can be understood as one method of topic analysis. This analysis was conducted with texts in 23 book reports using LDA function of the "topicmodels" package provided by R. According to the result of topic modeling, 16 topics were extracted. The topic network was constructed by the relation between the topics and keywords, and the book report network was constructed by the relation between book report cases and topics. Next, Centrality analysis was conducted targeting the topic network and book report network. The result of this study is following these. First, 16 topics are shown as network which has one component. In other words, 16 topics are interrelated. Second, book report was divided into 2 groups, book reports with high centrality and book reports with low centrality. The former group has similarities with others, the latter group has differences with others in aspect of the topics of book reports. The result of topic modeling is useful to identify book reports' topics combining with network analysis.

이 연구는 독후감 텍스트의 주제분석에 토픽모델링의 활용방안을 탐색하는 것을 목적으로 하고 있다. 텍스트의 주제분석 방안으로서 토픽모델링 분석방법을 이해하고, R에서 제공하는 "topicmodels" 패키지의 LDA 함수를 사용하여 23건의 사례 독후감 텍스트들을 대상으로 실제의 분석작업을 수행하였다 토픽모델링 분석결과 16개의 토픽들을 추출하였고 토픽과 구성 단어들의 관계에서 토픽 네트워크 사례 독후감과 토픽들의 관계에서 독후감 네트워크를 구성하였다. 이후 토픽 네트워크와 독후감 네트워크를 대상으로 중심성 분석을 수행하였으며 분석결과는 다음과 같다. 첫째 16개의 토픽들이 1개의 컴포넌트를 가지는 네트워크로 나타났다. 이것은 16개 토픽들이 상호 연관되어 있다는 것을 의미한다. 둘째, 독후감 네트워크에서는 연결정도 중심성이 높은 독후감들과 낮은 독후감들로 구분이 되었다. 전자의 독후감들은 다른 독후감들과 주제적으로 유사성을 가지며 후자의 독후감들은 다른 독후감들과 주제적으로 상이성을 가지는 것으로 해석하였다. 토픽모델링의 결과를 네트워크 분석과 결합함으로써 독후감의 주제파악에 유용한 결과들을 얻게 되었다.

Keywords

Acknowledgement

Supported by : 부산대학교

References

  1. Blei, D.M, Ng, A.Y, Jordan, M.I. 2003. "Latent Dirichlet Allocation." Journal of Machine Learning Research, 3: 993-1022.
  2. Liu Lin, et al. 2016. "An overview of topic modeling and its current applications in bioinformatics." SpringerPlus, 5(1). .
  3. Meza, David. 2015. "Topic Modeling in R." (인용: 2016. 11.15).
  4. Ponweiser, Martin. 2012. Latent Dirichlet allocation in R. Diploma thesis, Institute for Statistics and Mathematics, WU (Wirtschaftsuniversitat Wien), Austria.
  5. Su Yeon Kim, Sung Jeon Song, Min Song. 2015. Investigation of topic trends in computer and information science by text mining techniques. 정보관리학회지, 32(1): 135-152. https://doi.org/10.3743/KOSIM.2015.32.1.135
  6. 강범일, 송민, 조화순. 2013. 토픽 모델링을 이용한 신문 자료의 오피니언 마이닝에 대한 연구. 한국문헌정보학회지, 47(4): 315-334.(Beomil Kang, Min Song, Whasun Jho. 2013. "A Study on Opinion Mining of Newspaper Texts based on Topic Modeling." Journal of the Korean Society for Library and Information Science, 47(4): 315-334.)
  7. 김라연, 박은경. 2011. 독서 감상문의 구성 요소 분석 연구. 교육과학연구, 17: 17-30.
  8. 남춘호. 2016. 일기자료 연구에서 토픽모델링 기법의 활용가능성 검토. 비교문화연구, 22(1): 89-135.
  9. 박동진. 2010. 독서 감상문 쓰기의 실태 구성 요소 분석을 중심으로. 새국어교육 , 84: 109-125.(Dong Jin Park. 2010. "Condition of Writing Book Reports." The Academy for Korean Language Education, 84: 109-125.)
  10. 박자현, 송민. 2013. 토픽모델링을 활용한 국내 문헌정보학 연구동향 분석. 정보관리학회지, 30(1): 7-32.(Ja-Hyun Park, Min Song. 2013. "A Study on the Research Trends in Library & Information Science in Korea using Topic Modeling." Journal of the Korean Society for Information Management, 30(1): 7-32.) https://doi.org/10.3743/KOSIM.2013.30.1.007
  11. 안주영, 안규빈, 송민. 2016. 텍스트 마이닝을 이용한 매체별 에볼라 주제 분석. 한국문헌정보학회지, 50(2): 289-307.(Juyoung An, Kyubin Ahn, Min Song. 2016. "Text Mining Driven Content Analysis of Ebola on News Media and Scientific Publications." Journal of the Korean Society for Library and Information Science, 50(2): 289-307.) https://doi.org/10.4275/KSLIS.2016.50.2.289
  12. 유소영. 2015. 자아 중심 네트워크 분석과 동적 인용 네트워크를 활용한 토픽모델링 기반 연구동향 분석에 관한 연구. 정보관리학회지, 32(1): 153-169. https://doi.org/10.3743/KOSIM.2015.32.1.153
  13. 이기헌, 정효정, 송민. 2015. 문헌정보학 분야 핵심 학술지들의 가중 주제-방법 네트워크 분석. 한국문헌정보학회지, 49(3): 457-488.(Keehoen Lee, Hyojung Jung, Min Song. 2015. "Weighted Subject - Method Network Analysis of Library and Information Science Studies." Journal of the Korean Society for Library and Information Science, 49(3): 457-488.) https://doi.org/10.4275/KSLIS.2015.49.3.457
  14. 이원상, 손소영. 2015. 공간빅데이터 연구 동향 파악을 위한 토픽모형 분석. 대한산업공학회지, 41(1): 64-73. https://doi.org/10.7232/JKIIE.2015.41.1.064
  15. 이수상. 2016. 독후감 텍스트의 언어 네트워크 분석에 관한 기초연구, 한국도서관.정보학회지, 47(3): 95-114.
  16. 이재연. 2016. 키워드와 네트워크 : 토픽 모델링으로 본 개벽의 주제 지도 분석. 상허학보, 46: 277-334.(Lee, Jae-yon. 2016. "Keywords and Networks - Exploring the Thematic Maps of Kaebyok through Topic Modelling." Sanghur Hakbo - The Journal of Korean Modern Literature, 46: 277-334.)
  17. 정한조. 2015. 온톨로지와 토픽모델링 기반 다차원 연계 지식맵 서비스 연구. 지능정보연구, 21(4): 79-92.(Hanjo Jeong. 2015. "A Study on Ontology and Topic Modeling-based Multidimensional Knowledge Map Services." Journal of Intelligent Information Systems, 21(4): 79-92.)
  18. 진설아 등. 2013. 트위터 데이터를 이용한 네트워크 기반 토픽 변화 추적 연구. 정보관리학회지, 30(1): 285-302.
  19. 협성문화재단 (2013). 책 읽는 당신이 아름답습니다: 제2회 협성독서왕 선발대회 독후감수상작품집. 해성.

Cited by

  1. 토픽 모델링을 활용한 도서관, 기록관, 박물관간의 연구 주제 분석 vol.50, pp.4, 2016, https://doi.org/10.16981/kliss.50.4.201912.339
  2. 토픽 모델링을 이용한 컴퓨팅 사고력 관련 연구 동향 분석 vol.23, pp.6, 2019, https://doi.org/10.14352/jkaie.2019.23.6.607
  3. What is New in Social Innovation Projects in Korea : Social Network Analysis of 〈Social Innovation SSIN〉(2018-2019) vol.56, pp.1, 2016, https://doi.org/10.17208/jkpa.2021.02.56.1.52