DOI QR코드

DOI QR Code

Subject Association Analysis of Big Data Studies: Using Co-citation Networks

빅데이터 연구 논문의 주제 분야 연관관계 분석: 동시 인용 관계를 적용하여

  • 곽철완 (강남대학교 산업데이터사이언스학부)
  • Received : 2018.02.11
  • Accepted : 2018.03.21
  • Published : 2018.03.30

Abstract

The purpose of this study is to analyze the association among the subject areas of big data research papers. The subject group of the units of analysis was extracted by applying co-citation networks, and the rules of association were analyzed using Apriori algorithm of R program, and visualized using the arulesViz package of R program. As a result of the study, 22 subject areas were extracted and these subjects were divided into three clusters. As a result of analyzing the association type of the subject, it was classified into 'professional type', 'general type', 'expanded type' depending on the complexity of association. The professional type included library and information science and journalism. The general type included politics & diplomacy, trade, and tourism. The expanded types included other humanities, general social sciences, and general tourism. This association networks show a tendency to cite other subject areas that are relevant when citing a subject field, and the library should consider services that use the association for academic information services.

본 연구의 목적은 빅데이터 연구 논문의 주제 분야 간의 연관관계를 분석하는데 있다. 동시 인용관계를 적용하여 분석 대상의 주제 분야를 추출하였으며, R 프로그램의 Apriori 알고리즘을 이용하여 연관관계의 규칙을 분석하고, arulesViz 패키지를 사용하여 시각화하였다. 연구 결과 22개 주제 분야가 추출되었는데, 이들 주제 분야는 3가지 군집으로 구분되었다. 주제 분야의 연관관계 유형을 분석한 결과, 연관관계의 복잡성에 따라 '전문형', '일반형', '확대형'으로 구분되었다. 전문형에는 문헌정보학, 신문방송학 등이 포함되었고, 일반형에는 정치외교학, 무역학, 관광학 등이 포함되었고, 확대형에는 기타인문학, 사회과학일반, 관광학일반 등이 포함되었다. 이 연관관계는 빅데이터 연구자가 한 주제분야를 인용할 때 관계가 있는 다른 주제 분야를 인용하는 경향을 보여주는 것으로, 도서관에서 학술정보서비스를 위해 연관관계를 활용한 서비스를 고려해야 할 필요가 있다.

Keywords

Acknowledgement

Supported by : 한국연구재단

References

  1. 고재창, 조근태, 조윤호 (2013). 키워드 네트워크 분석을 통해 살펴본 기술경영의 최근 연구동향. 지능정보연구, 19(2), 101-123. Kho, Jaechang, Cho, Kuentae, & Cho, Yoonho (2013). A study on recent research trend in management of technology using keywords network analysis. Journal of Intelligence and Information Systems, 19(2), 101-123. https://doi.org/10.13088/jiis.2013.19.2.101
  2. 곽선영, 정은경 (2012). 복수저자기반 동시인용분석을 활용한 지적구조 분석: 경제학을 중심으로. 정보관리학회지, 29(1), 115-134. http://dx.doi.org/10.3743/KOSIM.2012.29.1.115 Kwak, Sun-Young, & Chung, EunKyung (2012). Domain analysis on economics by utilizing cocitation analysis of multiple authorship. Journal of the Korean Society for Information Management, 29(1), 115-134. http://dx.doi.org/10.3743/KOSIM.2012.29.1.115
  3. 김용 (2012) Apriori 알고리즘 기반의 개인화 정보 추천시스템 설계 및 구현에 관한 연구. 한국비블리아학회지, 23(4), 283-308. Kim, Yong (2012). A study on design and implementation of personalized information recommendation system based on Apriori algorithm. Journal of the Korean Biblia Society for Library and Information Science, 23(4), 283-308. https://doi.org/10.14699/kbiblia.2012.23.4.283
  4. 김희정 (2011). 네트워크 분석을 기반으로 한 웹 아카이빙 주제영역 연구. 한국비블리아학회지, 22(2), 235-248. Kim, Heejung (2011). A study on web archiving subject analysis based on network analysis. Journal of the Korean Biblia Society for Library and Information Science, 22(2), 235-248. https://doi.org/10.14699/KBIBLIA.2011.22.2.235
  5. 박옥남 (2011). 정보조직 지식구조에 대한 연구: 2000년-2011년 학술논문을 중심으로. 한국비블리아학회지, 22(3), 247-267. Park, Ok Nam (2011). Knowledge structures in knowledge organization research: 2000-2011. Journal of the Korean Biblia Society for Library and Information Science, 22(3), 247-267. https://doi.org/10.14699/KBIBLIA.2011.22.3.247
  6. 백봉현, 하일규 (2017). XML 구조를 이용한 공공 빅데이터의 선별 저장 및 시각화 방법. 한국정보통신학회논문지, 21(12), 2305-2311. https://doi.org/10.6109/jkiice.2017.21.12.2305 Back, Bong Hyun, & Ha, Il-Kyu (2017). A method for selective storing and visualization of public big data using XML structure. Journal of the Korea Institute of Information and Communication Engineering, 21(12), 2305-2311. https://doi.org/10.6109/jkiice.2017.21.12.2305
  7. 손혜인, 남영준 (2016). 기록관리학 분야 국내 학술지의 연구동향에 관한 연구: 한국기록관리학회지와 기록학연구를 중심으로. 정보관리학회지, 33(1), 85-110. http://dx.doi.org/10.3743/KOSIM.2016.33.1.085 Sohn, Hye In, & Nam, Young Joon (2016). A study on the research trends of archives management in Korea: Focused on the Journal of Records Management & Archives Society of Korea and the Korean Journal of Archival Studies. Journal of the Korean Society for Information Management, 33(1), 85-110. http://dx.doi.org/10.3743/KOSIM.2016.33.1.085
  8. 이기헌, 정효정, 송민 (2015). 문헌정보학 분야 핵심 학술지들의 가중 주제-방법 네트워크 분석. 한국문헌정보학회지, 49(3), 457-488. http://dx.doi.org/10.4275/KSLIS.2015.49.3.457 Lee, Keehoen, Jung, Hyojung, & Song, Min (2015). Weighted subject-method network analysis of library and information science studies. Journal of the Korean Society for Library and Information Science, 49(3), 457-488. http://dx.doi.org/10.4275/KSLIS.2015.49.3.457
  9. 이보람, 정은경 (2016). 학술지 단위 서지결합분석을 통한 빅데이터 연구분야의 학제적 구조에 관한 연구. 정보관리학회지, 33(3), 133-154. http://dx.doi.org/10.3743/KOSIM.2016.33.3.133 Lee, Boram, & Chung, Eunkyung (2016). A study on interdisciplinary structure of big data research with journal-level bibliographic-coupling analysis. Journal of the Korean Society for Information Management, 33(3), 133-154. http://dx.doi.org/10.3743/KOSIM.2016.33.3.133
  10. 이수상 (2013). 연구자 네트워크의 중심성과 연구성과의 연관성 분석: 국내 기록관리학 분야 학술논문을 중심으로. 한국도서관․정보학회지, 44(3), 405-428. Lee, Soo-Sang (2013). Analytical study on the relationship between centralities of research networks and research performances. Journal of Korean Library and Information Science Society, 44(3), 405-428.
  11. 이재윤 (2015). 문헌동시인용 분석을 통한 한국 문헌정보학의 연구 전선 파악. 정보관리학회지, 32(4), 77-106. http://dx.doi.org/10.3743/KOSIM.2015.32.4.077 Lee, Jae Yun (2015). Identifying the research fronts in Korean library and information science by document co-citation analysis. Journal of the Korean Society for Information Management, 32(4), 77-106. http://dx.doi.org/10.3743/KOSIM.2015.32.4.077
  12. 이정미 (2013). 빅데이터의 이해와 도서관 정보서비스에의 활용. 한국비블리아학회지, 24(4), 53-73. http://dx.doi.org/10.14699/kbiblia.2013.24.4.053 Lee, Jeong-Mee (2013). Understanding big data and utilizing its analysis into library and information services. Journal of the Korean Biblia Society for Library and Information Science, 24(4), 53-73. http://dx.doi.org/10.14699/kbiblia.2013.24.4.053
  13. 이환수, 임동원, 조항정 (2013). 빅데이터 시대의 개인정보 과잉이 사용자 저항에 미치는 영향. 지능정보연구, 19(1), 125-139. Lee, Hwansoo, Lim, Dongwon, & Zo, Hangjung (2013). Personal information overload and user resistance in the big data age. Journal of Intelligence and Information System, 19(1), 125-139. https://doi.org/10.13088/JIIS.2013.19.1.125
  14. 장임숙, 장덕현, 이수상 (2011). 다문화연구의 지식구조에 관한 네트워크 분석. 한국도서관․정보학회지, 42(4), 353-374. Jang, Im-Sook, Chang, Durk-Hyun, & Lee, Soo-Sang (2011). The knowledge structure of multicultural research papers in Korea. Journal of Korean Library and Information Science Society, 42(4), 353-374.
  15. 정동열 (2016). 한국문헌정보학 학문영역의 변천 과정에 관한 고찰: 학술지 논문 주제분석을 기반으로. 한국문헌정보학회지, 50(4), 5-34. http://dx.doi.org/10.4275/KSLIS.2016.50.4.005 Jeong, Dong Youl (2016). A study on the historical process of library and information science domain in Korea: Based on the subject analysis of academic journal. Journal of the Korean Society for Library and Information Science, 50(4), 5-34. http://dx.doi.org/10.4275/KSLIS.2016.50.4.005
  16. 조수권, 김성범 (2012). 텍스트마이닝을 활용한 산업공학 학술지의 논문 주제어간 연관관계 연구. 대한산업공학회지, 38(1), 67-73. Cho, Su Gon, & Kim, Seoung Bum (2012). Finding meaningful pattern of key words in IIE transactions using text mining. Journal of the Korean Institute of Industrial Engineers, 38(1), 67-73. https://doi.org/10.7232/JKIIE.2012.38.1.067
  17. 조재인 (2011). 네트워크 텍스트 분석을 통한 문헌정보학 최근 연구 경향 분석. 정보관리학회지, 28(4), 65-83. http://dx.doi.org/10.3743/KOSIM.2011.28.4.065 Cho, Jane (2011). A study for research area of library and information science by network text analysis. Journal of the Korean Society for Information Management, 28(4), 65-83. http://dx.doi.org/10.3743/KOSIM.2011.28.4.065
  18. 최이랑 (2015). 국내 기록관리학 연구동향에 관한 연구: 최근 10년간(2004-2013) 학술논문을 중심으로. 기록학연구, 43, 147-177. Choi, Yilang (2015). A study on the research trends of archival studies in Korea: Focused on research papers between 2004 and 2013. The Korean Journal of Archival Studies, 43, 147-177.
  19. Mishra, D., Luo, Z., Jiang, S., Papadopoulos, T., & Dubey, R. (2017). A bibliographic study on big data: Concepts, trends and challenges. Business Process Management Journal, 23(3), 555-573. https://doi.org/10.1108/BPMJ-10-2015-0149
  20. Peng, T., Zhang, L., Zhong, Z., & Zhu, J. J. (2012). Mapping the landscape of internet studies: Text mining of social science journal articles 2000-2009. New Media & Society, 15(5), 644-664. https://doi.org/10.1177/1461444812462846
  21. Zhao, D., & Strotmann, A. (2008). Evolution of research activities and intellectual influences in information science 1996-2005: Introducing author bibliographic-coupling analysis. Journal of the American Society for Information Science and Technology, 59(13), 2070-2086. https://doi.org/10.1002/asi.20910
  22. Zhao, D., & Strotmann, A. (2014). The knowledge base and research front of information science 2006-2010: An author cocitation and bibliographic coupling analysis. Journal of the Association for Information Science and Technology, 65(5), 995-1006. https://doi.org/10.1002/asi.23027