DOI QR코드

DOI QR Code

Applications of Transaction Log Analysis for the Web Searching Field

웹 검색 분야에서의 로그 분석 방법론의 활용도

  • 박소연 (덕성여자대학교 문헌정보학과) ;
  • 이준호 (숭실대학교 정보과학대학 컴퓨터학부)
  • Published : 2007.03.30

Abstract

Transaction logs capture the interactions between online information retrieval systems and the users. Given the nature of the Web and Web users, transaction logs appear to be a reasonable and relevant method to collect and investigate information searching behaviors from a large number of Web users. Based on a series of research studies that analyzed Naver transaction logs, this study examines how transaction log analysis can be applied and contributed to the field of web searching and suggests future implications for the web searching field. It is expected that this study could contribute to the development and implementation of more effective Web search systems and services.

웹 검색 분야에서 사용되고 있는 다양한 연구 방법들 중 로그 분석 방법은 이용자의 실제 검색 행위를 사실적으로 반영한다. 로그 분석을 통하여 대다수 이용자의 전반적인 이용 행태를 분석할 수 있으므로, 로그 분석 방법은 이용자 계층이 다양하고 이질적인 웹 검색 분야의 연구에 적합한 방법이라고 할수 있다. 이에 본 연구에서는 네이버의 트랜잭션 로그를 분석한 일련의 연구를 중심으로 로그 분석 방법론이 웽 검색 분야에 어떻게 활용되고 기여할 수 있는지를 파악하고 향후 활용 분야를 제시하고자 한다. 본 연구의 결과는 웹 검색 분야의 학문적 발전과 보다 효율적인 웹 검색 시스템 개발과 서비스 구축에 기여할 수 있을 것으로 기대된다.

Keywords

References

  1. 곽승진. 2003. 청소년 대상 과학 분야 디지털도서관 구축을 위한 관련 사이트 분석 및 평가에 관한 연구. '한국문헌정보학회지', 37(3): 197-215
  2. 김지승. 2005. '확률 모델에 근거한 검색 질의의 문자열 유사도 계산'. 박사학위 논문, 숭실대학교 대학원, 컴퓨터학부
  3. 박미성. 2005. 서지마크 데이터베이스로부터의 색인어 추출과 색인어의 검색 활용에 관한 연구 - 경북대학교 도서관 학술정보시스템 사례를 중심으로 -. '한국도서관․정보학회지', 36(2): 327-348
  4. 박소연, 이준호. 2006a. 국내 주요 검색 포탈들의 백과사전 서비스 비교 평가. '한국도서관. 정보학회지', 37(2): 217-230
  5. 박소연, 이준호. 2006b. 국내 주요 검색 포탈들의 통합 검색 서비스 만족도 비교 평가. NHN 기술보고서
  6. 박소연, 이준호. 2005. 국내 웹 이용자의 검색 행태 추이 분석. '한국문헌정보학회지', 39(2): 147-160
  7. 박소연, 이준호. 2002. 로그 분석을 통한 이용자의 웹 문서 검색 행태에 관한 연구. '정보관리학회지', 19(3): 111-122
  8. 박소연, 이준호, 김지승. 2005. 클릭 로그에 근거한 네이버 검색 질의의 형태 및 주제 분석. '한국문헌정보학회지', 39(1): 265-278
  9. 박소연, 이준호, 전지운. 2006. 지식 검색 서비스 개선을 위한 문서의 적합도 및 신뢰도 분석. '한국문헌정보학회지', 40(2): 299-314
  10. 손용배, 이응봉. 2002. 웹마이닝을 통한 도서관 홈페이지의 사용편의성에 관한 연구 - 육군대학 도서관 홈페이지를 중심으로 -. '제9회 한국정보관리학회 학술대회 논문집', 213-218
  11. 유사라. 2002. 국가과학기술전자도서관 이용자 정보요구와 이용 행태 분석. '한국문헌정보학회지', 36(1): 25-40
  12. 이준호, 박소연, 권혁성. 2003. 질의 로그 분석을 통한 네이버 이용자의 검색 행태 연구. '정보관리학회지', 20(2): 27-40
  13. Arkin, H., and Colton, R. 1963. Tables for Statisticians. New York: Barnes & Noble Inc
  14. Cacheda, F., & Vinã, Á. 2001. Experiences retrieving information in the World Wide Web. In K. Jeffay, & R. Steinmetz (Eds.), Proceedings of the 6th IEEE Symposium on Computers and Communications(pp.72-79). Piscataway, NJ: IEEE
  15. Jansen, B. J., & Pooch, U. 2001. 'A review of web searching studies and a framework for future research.' Journal of the American Society for Information Science and Technology, 52(3): 235- 246 https://doi.org/10.1002/1097-4571(2000)9999:9999<::AID-ASI1607>3.0.CO;2-F
  16. Jansen, B. J., Spink, A., and Pedersen, J. 2005. 'A temporal comparison of Alta-Vista web searching.' Journal of the American Society for Information Science and Technology, 56(6): 559- 570 https://doi.org/10.1002/asi.20145
  17. Jansen, B. J., and Spink, A. 2005. 'An analysis of Web searching by European AlltheWeb.com users.' Information Processing and Management, 41(2): 361-381 https://doi.org/10.1016/S0306-4573(03)00067-0
  18. Jansen, B. J., Spink, A., and Saracevic, T. 2000. 'Real life, real users, and real needs: a study and analysis of user queries on the web.' Information Processing and Management, 36(2): 207-227 https://doi.org/10.1016/S0306-4573(99)00056-4
  19. Lee, J. Y., & Paik, W. 2006. Analysis of Korean Patent & Trademark Retrieval Query Log to Improve Retrieval and Query Reformulation Efficiency. '정보관리학회지', 23(2): 61-80
  20. Park, S., Lee, J., & Bae, H. 2005. 'End user searching: A web log analysis of NAVER, a Korean web search engine.' Library and Information Science Research, 27(2): 203-221 https://doi.org/10.1016/j.lisr.2005.01.013
  21. Peters, T. A. 1993. 'The history and development of transaction log analysis.' Library Hi Tech, 11(2): 41-66 https://doi.org/10.1108/eb047884
  22. Ross, N. C. M., and Wolfram, D. 2000. 'End user searching on the Internet: An analysis of term pair topics submitted to the Excite search engine.' Journal of the American Society for Information Science and Technology, 51(10): 949-958 https://doi.org/10.1002/1097-4571(2000)51:10<949::AID-ASI70>3.0.CO;2-5
  23. Silverstein, C., Henzinger, M., Marais, H., and Moricz, M. 1999. 'Analysis of a very large web search engine query log.' SIGIR Forum, 33(1): 6-12 https://doi.org/10.1145/331403.331405
  24. Spink, A., Wolfram, D., Jansen, M. B. J., and Saracevic, T. 2001. 'Searching the web: The public and their queries.' Journal of the American Society for Information Science and Technology, 52(3): 226-234 https://doi.org/10.1002/1097-4571(2000)9999:9999<::AID-ASI1591>3.0.CO;2-R
  25. Spink, A., Jansen, B. J., Wolfram, D., and Saracevic, T. 2002. 'From e-sex to e-commerce: Web search changes.' IEEE Computer, 35(3): 133-135 https://doi.org/10.1109/2.976928
  26. Wang, P., Berry, M. W., and Yang, Y. 2003. 'Mining Longitudinal Web Queries: Trends and Patterns.' Journal of the American Society for Information Science and Technology, 54(8): 743- 758 https://doi.org/10.1002/asi.10262

Cited by

  1. A Relation Analysis between NDSL User Queries and Technical Terms vol.39, pp.3, 2008, https://doi.org/10.1633/JIM.2008.39.3.163