DOI QR코드

DOI QR Code

A Study on the Procedure for Constructing Linked Open Data of Records Information by Using Open Source Tool

오픈소스 도구를 이용한 기록정보 링크드 오픈 데이터 구축 절차 연구

  • 하승록 (명지대학교 기록정보과학전문대학원 기록관리전공) ;
  • 임진희 (정보인권연구소) ;
  • 이해영 (명지대학교 기록정보과학전문대학원)
  • Received : 2017.02.19
  • Accepted : 2017.03.27
  • Published : 2017.03.30

Abstract

Recently, the web service environment has changed from document-centered to data-oriented focus, and the Linked Open Data (LOD) exists at the core of the new environment. Specific procedures and methods were examined to build the LOD of records information in accordance with this trend. With the service sustainability of small-scale archive in consideration, an exemplification on LOD building process by utilizing open source software was developed in this paper. To this end, a 5-step service framework for LOD construction was proposed and applied to a collection of diary records from 'Human and Memory Archive'. Proof of Concept (POC) utilizing open source softwares, Protege and Apache Jena Fuseki, was conducted according to the proposed 5 step framework. After establishing the LOD of record information by utilizing the open source software, the connection with external LOD through interlinking and SPARQL search has been successfully performed. In addition, archives' considerations for LOD construction, including improvement on the quality of content information, the role of the archivist, were suggested based on the understanding obtained through the LOD construction process of records information.

웹을 통해 제공되는 서비스는 현재 문서중심에서 데이터 중심으로 변화를 겪고 있으며, 그 변화의 중심에는 Linked Open Data(LOD)가 존재한다. 본 연구는 이러한 흐름에 부응하여 기록정보의 LOD 구축을 위한 구체적인 절차와 방법을 살펴보고자 하였다. 또한 소규모 아카이브의 서비스 지속가능성을 염두에 두고, 오픈소스 소프트웨어를 활용하여 LOD 구축 절차를 진행하는 범례를 제시하고자 했다. 이에 본 연구에서는 LOD 구축을 위한 5단계의 프레임워크를 제안했다. 그리고 일상아카이브인 '인간과 기억 아카이브'의 일기 기록물 컬렉션을 수집하여, 제안된 5단계 프레임워크에 따라 오픈소스 소프트웨어인 Protege와 Apache Jena Fuseki를 활용하여 POC(Proof of concept)를 진행하였다. 오픈소스를 활용하여 기록정보의 LOD를 구축한 뒤, 상호연결(Interlinking)과 SPARQL 검색을 통해서 외부 LOD와 연결되는 모습을 확인할 수 있었다. 또한 기록정보의 LOD 구축 절차 진행과정의 경험을 바탕으로 내용정보 기술의 품질 향상, 아키비스트의 역량 고도화, 기록정보의 접근성 향상을 위한 상호연결 고도화, LOD 서비스의 수준 결정, LOD 구축을 위한 도구 선정 등, 기록관 LOD 구축을 위한 필요요건을 제시했다.

Keywords

References

  1. 곽건홍 (2011). 일상 아카이브(Archives of everyday life)로의 패러다임 전환을 위한 소론. 기록학연구, 29, 3-33. (Kwak, Kun-Hong (2011). A study on a paradigm shift to archives of everyday life. The Korean Journal of Archival Studies, 29, 3-33.)
  2. 김성혁 (2011). 도서관 자료 공개와 활용을 위한 링크드 데이터 기술. 국회도서관보, 48(3), 24-33. (Kim, Sung-Hyuk (2011). Linked data technologies for disclosing and utilizing library materials. National Assembly Library Review, 48(3), 24-33.)
  3. 김영천 (2011). 온톨로지를 이용한 시맨틱 웹 기술의 사례연구. 석사학위논문, 건국대학교 정보통신대학원, 정보통신학과. (Kim, Young Cheon (2011). A case study on the semantic web technology using ontology. Master's thesis, Graduate School of Konkuk University, Department of Information and Communications.)
  4. 김은경 (2004). 시맨틱웹을 위한 온톨로지 구축방법에 관한 비교연구. 석사학위논문, 중앙대학교 대학원, 문헌정보학과. (Kim, Eunkyong (2004). A comparative study on methodologies of building ontologies towards semantic web. Master's thesis, Graduate School of Chung-Ang University, Department of Library and Information Science.)
  5. 노상규, 박진수 (2007). 온톨로지. 서울: 가즈토이. (Rho, Sangkyu, & Park, Jinsoo (2007). Ontology. Seoul: God's Toy Business.)
  6. 박옥남 (2012). 기록물 전거통제 기반 Linked data 구축에 대한 연구. 한국비블리아학회지, 23(2), 5-25. https://doi.org/10.14699/kbiblia.2012.23.2.005 (Park, Ok Nam (2012). The design and development of linked data from authority data in national archives of Korea. Journal of the Korean Biblia Society for Library and Information Science, 23(2), 5-25. https://doi.org/10.14699/kbiblia.2012.23.2.005)
  7. 박종호 (2011). 온톨로지(Ontology) 기반 한국어 동사 의미망 구축 방법 연구. 박사학위논문, 청주대학교 대학원, 국어국문학과. (Bak, Jong-Ho (2011). The study of establishing a method for semantic network of Korean verb based on ontology. Ph.D. dissertation, Graduate School of Cheongju University, Department of Korean Literature.)
  8. 박현근 (2005). Owl 시멘틱웹 기반 온톨로지 상에서의 규칙 - 사실 생성에 관한 추론. 박사학위논문, 중앙대학교 대학원, 컴퓨터공학과. (Park, Hyeongeun (2005). Reasoning on production of rules and facts using OWL-based semantic web ontology. Ph.D. dissertation, Graduate School of Chung-Ang University, Department of Computer Science and Engineering.)
  9. 안대진, 김익한 (2015). AtoM 시스템의 구축과 커스터마이징 방법에 관한 연구. 기록학연구, 45, 5-50. (An, Dae-Jin, & Kim, Ik-Han (2015). A study on constructing and customizing an AtoM system. The Korean Journal of Archival Studies, 45, 5-50.)
  10. 안세열 (2011). 온톨로지 기반 지식 검색 시스템 개발. 석사학위논문, 고려대학교 컴퓨터정보통신대학원, 디지털정보․미디어공학전공. (An, Seyeol (2011). Development of an ontology-based knowledge search system: The case of KT call center. Master's thesis, Graduate School of Computer & Information Technology at Korea University.)
  11. 이병길, 김희섭 (2013). 새마을운동 기록물의 개체기반 온톨로지 검색시스템 설계 및 평가. 한국기록관리학회지, 13(3), 67-97. https://doi.org/10.14404/jksarm.2013.13.3.067 (Lee, Byung Gil, & Kim, Heesop (2013). Design and evaluation of an individual instance-based ontology retrieval system for archival records of the "saemaul movement." Journal of Korean Society of Archives and Records Management, 13(3), 67-97. https://doi.org/10.14404/jksarm.2013.13.3.067)
  12. 이유빈, 이해영 (2017). 온톨로지 기반의 기록물 검색 시스템을 위한 인터페이스 제안. 한국기록관리학회지, 17(1), 217-244. (Lee, Yu-Been, & Rieh, Hae-Young (2017). A suggestion of interface for ontology-based record retrieval system. Journal of Korean Society of Archives and Records Management, 17(1), 217-244.) https://doi.org/10.14404/JKSARM.2017.17.1.217
  13. 이정현, 이윤용, 방기영, 김용 (2015). Linked open data기반 대통령기록관 기록정보 서비스 확장에 관한 연구. 한국기록관리학회지, 15(2), 55-82. https://doi.org/10.14404/jksarm.2015.15.2.055 (Lee, Jeong Hyeon, Lee, Youn Yong, Bang, Ki Young, & Kim, Yong (2015). A study on the extension of archival information service based on linked open data in the presidential archives. Journal of Korean Society of Archives and Records Management, 15(2), 55-82. https://doi.org/10.14404/jksarm.2015.15.2.055)
  14. 이현정 (2015). 링크드 데이터 활용을 위한 멀티소스 검색시스템 구축에 관한 연구. 박사학위논문, 중앙 대학교 대학원, 문헌정보학과. (Yi, Hyun Jung (2015). A study on the implementation of multi-source search system for linked data utilization. Ph.D. dissertation, Graduate School of Chung-Ang University, Department of Library and Information Science.)
  15. 정갑주 (2015). JENA ARQ and FUSEKI Basics. Retrieved from https://www.youtube.com/watch?v=8F3TWJvgmBU (Jeong, Gab-Ju (2015). JENA ARQ and FUSEKI Basics. Retrieved from https://www.youtube.com/watch?v=8F3TWJvgmBU)
  16. 최효진, 임진희 (2015). 개인 일기의 연구 자료로서의 가치와 전망. 기록학연구, 46, 95-152. (Choi, Hyo Jin, & Yim, Jin Hee (2015). Value and prosect of individual diary as research materials: Based on "The 12th May Diaries Collection." The Korean Journal of Archival Studies, 46, 95-152.)
  17. 하상범, 한은영, 최호준 (2005). Owl 기반의 sparql을 이용한 시맨틱 검색. 한국정보과학회 학술발표논문집, 32(2), 706-708. (Ha, Sangbum, Han, Eunyoung, & Choi, Hojun (2005). OWL-based semantic search using SPARQL. Korean Institute of Information Scientists and Engineers Workshop Presentation File, 32(2), 706-708.)
  18. 한국정보화진흥원 지식자원활용부 (2014a). 2014 링크드오픈데이터 국내 구축 사례집. 서울: 한국정보화진흥원. (National Information Society Agency (2014a). 2014 linked open data internal build case. Seoul: National Information Society Agency.)
  19. 한국정보화진흥원 지식자원활용부 (2014b). 링크드 데이터 구축 공정 가이드 v1.0. 서울: 한국정보화진흥원. (National Information Society Agency (2014b). Linked data build guide v1.0. Seoul: National Information Society Agency.)
  20. 한상은 (2014). 오픈데이터의 링크드데이터(Linked data) 발행방법 간 유용성 비교평가에 관한 연구. 석사학위논문, 성균관대학교 대학원, 문헌정보학과. (Han, Sang Eun (2014). Evaluating usability of linked data publishing methods on open data: Focusing on the RDF triple store and RDB-to-RDF LD publishing methods. Master's thesis, Graduate School of Sungkyunkwan University, Department of Library and Information Science.)
  21. Antoniou, G., & Van Harmelen, F. (2008). A semantic web primer. Cambridge, Mass.: MIT Press.
  22. Bauer, F., & Kaltenbock, M. (2011). Linked open data: The essentials. Retrieved from https://www.semantic-web.at/LOD-TheEssentials.pdf
  23. Berners-Lee, T. (2006). Linked data. Retrieved from https://www.w3.org/DesignIssues/LinkedData.html
  24. Berners-Lee, T. (2009). The next web. Retrieved from https://www.ted.com/talks/tim_berners_lee_on_the_next_web
  25. Berners-Lee, T., Hendler, J., & Lassila, O. (2001). The semantic web. Scientific American, 284(5), 28-37. https://doi.org/10.1038/scientificamerican0501-28
  26. Gracy, K. F. (2015). Archival description and linked data: A preliminary study of opportunities and implementation challenges. Archival Science, 15(3), 239-294. https://doi.org/10.1007/s10502-014-9216-2
  27. Gruber, T. R. (1993). A translation approach to portable ontology specifications. Knowledge Acquisition, 5(2), 199-220. https://doi.org/10.1006/knac.1993.1008
  28. Josef, H. (2016). Cellfie-plugin user's guide. Retrieved from https://github.com/protegeproject/cellfie-plugin/wiki/User%27s-Guide
  29. Heath, T., & Bizer, C. (2011). Linked data: Evolving the Web into a global data space. San Rafael, Calif.: Morgan & Claypool.
  30. Noy, N. F., & McGuinness, D. L. (2001). Ontology development 101: A guide to creating your first ontology. Retrieved from http://www.ksl.stanford.edu/people/dlm/papers/ontology-tutorial-noy-mcguinness.pdf
  31. O'connor, M. J., Halaschek-Wiener, C., & Musen, M. A. (2010). Mapping master: A flexible approach for mapping spreadsheets to OWL. In Patel-Schneider P.F. et al. (Eds.). The semantic Web - ISWC 2010. ISWC 2010. Lecture Notes in Computer Science, vol 6497. Springer, Berlin, Heidelberg
  32. 공공데이터포털 홈페이지. Retrieved from https://www.data.go.kr
  33. 인간과기억아카이브 홈페이지. Retrieved from http://hmarchives.org/
  34. 주소데이터LOD 제주도 웹페이지. Retrieved from http://jusodata.kr/resource/Jeju-do
  35. 한국관광공사LOD 제주도 웹페이지. Retrieved from http://data.visitkorea.or.kr/resource/CATEGORY:390000
  36. 한국사LOD 홈페이지. Retrieved from http://lod.koreanhistory.or.kr/lodIntro.do
  37. DBPedia 제주도 웹페이지. Retrieved from http://ko.dbpedia.org/page/제주도
  38. KData 제주도 웹페이지. Retrieved from http://data.kdata.kr/administrative_section/Jeju
  39. Mass Observation 프로젝트 홈페이지. Retrieved from http://www.massobs.org.uk/write-for-us/12th-may
  40. Omeka Homepage. Retrieved from http://omeka.org