XPOS: XPath-based OWL Storage Model for Effective Query Processing

XPOS: 효율적인 질의 처리를 위한 XPath 기반의 OWL 저장 모델

  • Published : 2008.06.15

Abstract

With rapid growth of Internet, the amount of information in the Web is increasing exponentially. However, information on the current Web is understandable only for human, and thus it makes the exact information retrieval difficult. For solving this problem, the Semantic Web is suggested and we must use ontology languages that can endow data to semantics for implementing it. One of the representative ontology languages is OWL(Web Ontology Language) adopted as a recommendation by the World-Wide Web Consortium. OWL has richer expression power and formal semantics than other ontology languages such as RDF and RDF-S. In addition, OWL includes hierarchical structure information between classes or properties. Therefore, an efficient OWL storage model considering hierarchical structure for effective information retrieval on the Semantic Web is required. In this paper, we suggest the XPOS(XPath-based OWL Storage) model including hierarchy information between classes or properties as XPath form and enabling intuitive and effective information retrieval. Also, we show the comparative evaluation results on the performance of XPOS model, Sesame, and the XML storage-based storage model regarding query processing.

최근 인터넷의 급속한 발달로 인해 웹 상의 정보 양이 엄청나게 증가하고 있다. 하지만 현재 웹 상의 정보들은 사람이 읽고 해석하기에만 편리하게 설계되어 원하는 정보에 대한 정확한 검색이 어려워지고 있다. 이러한 문제점을 해결하기 위해 시맨틱 웹이 제안되었으며, 이를 구축하기 위해서는 데이타에 의미를 부여하는 온톨로지 언어를 사용해야 한다. 대표적인 은톨로지 언어는 RDF, RDF-S, OWL 등이 있다. 이러한 언어들 중 OWL은 W3C에서 권고안으로 채택한 언어로써 다른 온톨로지 언어에 비해 풍부한 표현력과 형식적인 의미론을 지닌다. 또한 OWL 데이타는 클래스/프로퍼티들 간의 계층 구조 정보를 포함한다. 따라서, 시맨틱 웹 상에서 데이타의 효율적인 검색을 위해서는 계층적 구조를 고려한 효율적인 OWL 저장 모델이 필요하다. 이 논문에서는 OWL 데이타의 클래스/프로퍼티들 간 계층 정보를 XPath 형태로 포함하며, 직관적이고 효율적인 질의 처리가 가능한 저장 모델(XPOS Model) 및 시스템을 제안한다. 또한, 제안 모델, Sesame, XML 저장소 기반 저장 시스템을 질의 처리 측면에서 성능에 대한 비교 평가 결과를 보인다.

Keywords

References

  1. Tim Berners-Lee, James Hendler, and Oral Lassila, 'The Semantic Web,' Scientific American, May 2001
  2. Stefan Decker, Sergey Melnik, Frank van Harmelen, Dieter Fensel, Michel Klein, Jeen Broekestra, Michael Erdmann, and Ian Horrocks, 'The Semantic Web: The Roles of XML and RDF,' IEEE Internet Computing, Vol. 15, no. 3, pp. 63-74, Oct. 2000
  3. Ismail Fahmi, Junte Zhang, Henk Ellermann, Gosse Bouma, 'System Description: A Case Study in Information Retrieval, Inference, and Visualization in the Semantic Web,' LNCS 4519, pp. 769-778, Jun. 2007
  4. H. Stuckenschmidt, F. van Harmelen, A deWaard, T. Scerri, R. Bhogal, J. van Buel, I. Crowlesmith, C. luit, A. Kampman, J.Broekstra, and E. van Mulligen, 'Exploring large document repositories with RDF technology: the DOPE project,' Intelligent Systems, IEEE, Vol.19, No.3, pp.34-40, 2004
  5. Resource Description Framework(RDF), http://www.w3.org/RDF/
  6. Dave Buckett, 'RDF/XML Syntax Specification,' W3C Recommendation, Feb. 2004
  7. Ioanna Koffina, Giorgos Serfiotis, Vassilis Christophides, Val Tannen, Alin Deutsch, 'Integrating XML Data Sources using RDF/S Schemas: The ICS-FORTH Semantic Web Integration Middleware (SWIM),' Semantic Interoperability and Integration 2005
  8. Zhuan Li, Yuanzhen Wang, 'An Approach for XML Inference Control Based on RDF,' LNCS 4080, pp. 338-347, Sep. 2006
  9. Jeremy J. Carroll, Patrick Stickler, 'RDF Triples in XML,' Extreme Markup Languages Conference 2004, Aug. 2004
  10. Michael K. Smith, Chris Welty, and Deborah L. McGuinness, 'OWL Web Ontology Language Guide,' W3C Recommendation, Feb. 2004, http://www.w3c.org/Tr/2004/REC-owl-guide-20040210/
  11. Jian Zhou, Li Ma, Qiaoling Liu, Lei Zhang, Yong Yu, Yue Pan, 'Minerva: A Scalable OWL Ontology Storage and Inference System,' ASWC 2006, pp. 429-443, Set. 2006
  12. Jeen Broekstra, and Arjohn Kampman, 'Sesame: An Architecture for Storing and Querying RDF Data and Schema Information,' LNCS 2342, pp. 54-68, Jun. 2002
  13. 우은미, 박명제, 정진완, 'OWL 데이타 검색을 위한 효율적인 저장 스키마 구축 및 질의 처리 기법', 정보과학회논문지: 데이타베이스 제34권, 제3호, pp. 206-216, 2007. 06
  14. Hyunchul Jang, Youngil Kim, Dongwook Shin, 'An Effective Mechanism for Index Update in Structured Documents,' ACM CIKM 1999, pp. 383-390, Nov. 1999
  15. Kazuhito Kobayashi, Wenxin Liang, Dai Kobayashi, Akitsugu Watanabe, Haruo Yokota, 'VLEI code: An Efficient Labeling Method for Handling XML Documents in an RDB,' ICDE 2005, pp. 386-387, Apr. 2005
  16. Jingtao Zhou, Mingwei Wang, Shusheng Zhang, Hongwei Sun, 'Semi-Structure Data Management by Bi-Directional Integration Between XML and RDB,' CSCWD 2006, pp. 1077-1081, May. 2006
  17. Yuanbo Guo, 'Univ-Bench Artificial data generator(UBA),' http://swat.cse.lehigh.edu/projects/lubm/
  18. Yuanbo Guo, Zhengxiang Pan, and Jeff Heflin, 'LUBM: A Benchmark for OWL Knowledge Base Systems,' Journal of Web Semantics, Vol.3, No.2, pp. 158-182, 2005 https://doi.org/10.1016/j.websem.2005.06.005