DOI QR코드

DOI QR Code

An Investigation on Scientific Data for Data Journal and Data Paper

Scientific Data 학술지 분석을 통한 데이터 논문 현황에 관한 연구

  • 정은경 (이화여자대학교 사회과학대학 문헌정보학과)
  • Received : 2019.02.17
  • Accepted : 2019.03.27
  • Published : 2019.03.30

Abstract

Data journals and data papers have grown and considered an important scholarly practice in the paradigm of open science in the context of data sharing and data reuse. This study investigates a total of 713 data papers published in Scientific Data in terms of author, citation, and subject areas. The findings of the study show that the subject areas of core authors are found as the areas of Biotechnology and Physics. An average number of co-authors is 12 and the patterns of co-authorship are recognized as several closed sub-networks. In terms of citation status, the subject areas of cited publications are highly similar to the areas of data paper authors. However, the citation analysis indicates that there are considerable citations on the journals specialized on methodology. The network with authors' keywords identifies more detailed areas such as marine ecology, cancer, genome, database, and temperature. This result indicates that biology oriented-subjects are primary areas in the journal although Scientific Data is categorized in multidisciplinary science in Web of Science database.

데이터 학술지와 데이터 논문이 오픈과학 패러다임에서 데이터 공유와 재이용이라는 학술활동이 등장하여 지속적으로 성장하고 있다. 본 논문은 영향력있는 다학제적 분야의 데이터 학술지인 Scientific Data에 게제된 총 713건의 논문을 대상으로 저자, 인용, 주제분야 측면을 분석하였다. 그 결과 저자의 주된 주제 영역은 생명공학, 물리학 등으로 나타났으며, 공저자 수는 평균 12명이다. 공저 형태를 네트워크로 살펴보면, 특정 연구자 그룹이 패쇄적으로 공저활동을 수행하는 것으로 나타났다. 인용의 주제영역을 살펴보면, 데이터 논문 저자의 주제영역과 크게 다르지 않게 나타났으나, 방법론을 주로 다루는 학술지의 인용 비중이 높은 것은 데이터 논문의 특징으로 볼 수 있다. 데이터 논문 저자의 키워드를 사용하여 동시출현단어분석 네트워크로 살펴본 데이터 논문의 주제영역은 생물학이 중심이며, 구체적으로 해양생태, 암, 게놈, 데이터베이스, 기온 등의 세부 주제 영역을 확인할 수 있다. 이러한 결과는 다학제학문 분야를 다루는 데이터 학술지이지만, 데이터 학술지 출간에 관한 논의를 일찍부터 시작해온 생명공학 분야에 집중된 현상을 보여준다.

Keywords

JBGRBQ_2019_v36n1_117_f0001.png 이미지

<그림 1> 연도별 논문 발행 건수

JBGRBQ_2019_v36n1_117_f0002.png 이미지

<그림 2> 논문별 저자수 분포

JBGRBQ_2019_v36n1_117_f0003.png 이미지

<그림 3> 데이터 논문의 공저자 네트워크(노드의 크기는 공저 빈도수 비례)

JBGRBQ_2019_v36n1_117_f0004.png 이미지

<그림 4> 데이터 논문 저자 키워드 네트워크와 13 군집(노드의 크기는 출현빈도 비례)

<표 1> 논문 발행 건수 상위 30명 저자

JBGRBQ_2019_v36n1_117_t0001.png 이미지

<표 2> 인용된 저작물 상위 20건

JBGRBQ_2019_v36n1_117_t0002.png 이미지

<표 3> 인용된 저자 상위 21명

JBGRBQ_2019_v36n1_117_t0003.png 이미지

<표 4> 데이터 논문 저자 키워드 군집의 주제

JBGRBQ_2019_v36n1_117_t0004.png 이미지

References

  1. 이재윤. WNET v.0.4.1 소프트웨어.
  2. Amorim, R. C., Castro, J. A., Da Silva, J. R., & Ribeiro, C. (2017). A comparison of research data management platforms: architecture, flexible metadata and interoperability. Universal Access in the Information Society, 16(4), 851-862. https://doi.org/10.1007/s10209-016-0475-y
  3. Assante, M., Candela, L., Castelli, D., & Tani, A. (2016). Are scientific data repositories coping with research data publishing? Data Science Journal, 15. https://doi.org/10.5334/dsj-2016-006
  4. Assante, M., Candela, L., Castelli, D., Manghi, P., Pagano, P., & Nazionale, C. (2015). Science 2.0 repositories: Time for a change in scholarly communication. D-Lib Magazine, 21(1/2), 1-14. https://doi.org/10.1045/january2015-assante
  5. Borgman, C. L. (2012). The conundrum of sharing research data. Journal of the American Society for Information Science and Technology, 63(6), 1059-1078. https://doi.org/10.1002/asi.22634
  6. Candela, L., Castelli, D., Manghi, P., & Tani, A. (2015). Data journals: A survey. Journal of the Association for Information Science and Technology, 66(9), 1747-1762. https://doi.org/10.1002/asi.23358
  7. Chard, K., Pruyne, J., Blaiszik, B., Ananthakrishnan, R., Tuecke, S., & Foster, I. (2015, August). Globus data publication as a service: Lowering barriers to reproducible science. In e-Science (e-Science), 2015 IEEE 11th International Conference on (pp. 401-410). IEEE.
  8. Chavan, V., & Penev, L. (2011). The data paper: A mechanism to incentivize data publishing in biodiversity science. BMC Bioinformatics, 12(15), S2. https://doi.org/10.1186/1471-2105-12-s15-s2
  9. Costello, M. J., Michener, W. K., Gahegan, M., Zhang, Z. Q., & Bourne, P. E. (2013). Biodiversity data should be published, cited, and peer reviewed. Trends in Ecology & Evolution, 28(8), 454-461. https://doi.org/10.1016/j.tree.2013.05.002
  10. Fienberg, S. E., Martin, M. E., & Straf, M. L. (1985). Sharing research data. National Academy Press.
  11. Klump, J., Bertelmann, R., Brase, J., Diepenbroek, M., Grobe, H., Hock, H., ..., & Wachter, J. (2006). Data publication in the open access initiative. Data Science Journal, 5, 79-83. https://doi.org/10.2481/dsj.5.79
  12. Lawrence, B., Jones, C., Matthews, B., Pepler, S., & Callaghan, S. (2011). Citation and peer review of data: Moving towards formal data publication. International Journal of Digital Curation, 6(2), 4-37. https://doi.org/10.2218/ijdc.v6i2.205
  13. Tenopir, C., Allard, S., Douglass, K., Aydinoglu, A., Wu, L., Read, E., ..., & Frame, M. (2011) Data sharing by scientists: Practices and perceptions. PLoS ONE 6(6): e21101. https://doi.org/10.1371/journal.pone.0021101