DOI QR코드

DOI QR Code

A Join Operations Benchmark in Users' Perspective

사용자 관점에서의 조인 연산 평가 방법론

  • 정회진 (숭실대학교 대학원 컴퓨터학과) ;
  • 이상호 (숭실대학교 컴퓨터학부)
  • Published : 2005.02.01

Abstract

The join operation is an important, fundamental operation in database systems, and it costs much to execute. In the literature, there are a number of technical attempts on development and evaluation of efficient join operations, all of which have been carried out In developers' perspective. This paper proposes a join operations benchmark that is dedicated to the evaluation of the join operations in database systems in users' perspective. This benchmark helps users select a database system that performs the join operations well in their work environment. The benchmark consists of 42 join queries, which are derived from on six performance factors that are picked out in two join categories. We have implemented this benchmark with two commercial database systems. The experimental results are also reported.

조인 연산은 데이터베이스 시스템의 가장 기본적이고 중요한 연산이며, 큰 수행 비용을 필요로 하는 연산이다. 지금까지 효율적인 조인 연산의 구현과 평가를 위한 다양한 연구가 진행되었다. 기존의 조인 연산 평가는 구현자 관점에서 우수한 알고리즘을 규명하기 위해 개발되었다. 본 논문은 사용자 관점에서 조인 연산 성능을 평가하는 조인 연산 평가 방법론을 기술한다. 본 성능 평가는 사용자가 자신의 업무에 적합한 조인 연산을 수행하는 데이터베이스 시스템을 선택하는데 도움을 준다. 본 논문에서는 두 가지 조인 범주와 여섯 가지의 조인 성능 영향 요소를 고려하여 42개의 평가 질의를 제안한다. 마지막으로 제안된 방법론에 따라 두 개의 상용 데이터베이스 시스템을 대상으로 구현하고 성능 평가 결과를 기술하였다.

Keywords

References

  1. Y. Kambayashi, 'Processing Cyclic Queries, In : Query Processing in Database Systems,' W. Kim, D. S. Reiner, and D.S. Batory Ed., Springer-Verlag, pp.62-78, 1985
  2. M. W. Balsgen and K. P. Eswaran 'Storage and Access in Relational Databases,' IBM Systems Journal, Vol.16, No.4, pp363-377, 1977 https://doi.org/10.1147/sj.164.0363
  3. T. Nakayama, M. Hirakawa, and T. Ichikawa, 'Architecture and Algorithm for Parallel Execution of a Join Operation,' Proceedings of the 1st International Conference on Data engineering, pp.160-166, 1984
  4. L. F. Mackert and G. M. Lohman, 'R Optimizer: Validation and Performance Evaluation for Distributed Queries,' Proceedings of the 12th International Conference on Very Large Data Bases, pp.149-159, 1986
  5. J. M. Patel and D. J. DeWitt, 'Partition Based Spatial-Merge Join,' Proceedings of the ACM SIGMOD International Conference on Management of Data, pp.259-270, 1996 https://doi.org/10.1145/235968.233338
  6. R. Mishra and M. H. Eich, 'Join Processing in Relational Databases,' ACM Computing Survey, Vol.24, No.1, pp.63-113, 1992 https://doi.org/10.1145/128762.128764
  7. Y. Yang and M. Singhal, 'A Comprehensive Survey of Join Techniques in Relational Databases,' Computer and Information Science TR. 48, The Ohio State University, 1997
  8. D. J. DeWitt, 'The Wisconsin Benchmark: Past, Present, and Future,' In : The Benchmark Handbook for Database and Transaction Processing Systems 2nd Ed., J. Gray Ed., pp.269-316, Morgan Kaufmann, 1993
  9. P. O'Neil, 'The Set Query Benchmark,' In : The Benchmark Handbook for Database and Transaction Processing Systems 2nd Ed., J. Gray Ed., pp.359-396, Morgan Kaufmann, 1993
  10. S. H. Lee, S. J. Kim, and W. Kim, 'The BORD Benchmark for Object-Relational Databases,' Proceedings of the 11th Database and Expert Systems Applications Conference, pp.6-20, 2000
  11. The TPC home page, http://www.tpc.org/
  12. H. J. Jeong and S. H. Lee, 'An Integrated Benchmark Suite for Database Systems,' Proceedings of the IASTED International Conference on Information Systems and Databases, pp.74-79, 2002
  13. G. Graefe, A. Linville, and L. D. Shapiro, 'Sort versus Hash Revisited,' IEEE Transactions on Knowledge and Data Engineering, Vol.6, No.6, pp.934-944, 1994 https://doi.org/10.1109/69.334883
  14. Microsoft Korea Co., 조인 기술의 비교, http://support.microsoft.com/korea/, 1999