DOI QR코드

DOI QR Code

A Personalized Retrieval System Based on Classification and User Query

분류와 사용자 질의어 정보에 기반한 개인화 검색 시스템

  • 김광영 (한국과학기술정보연구원 정보기술연구실) ;
  • 심강섭 (한국과학기술정보연구원 정보기술연구실) ;
  • 곽승진 (충남대학교 사회과학대학 문헌정보학과)
  • Published : 2009.09.30

Abstract

In this paper, we describe a developmental system for establishing personal information tendency based on user queries. For each query, the system classified it based on the category information using a kNN classifier. As category information, we used DDC field which is already assigned to each record in the database. The system accumulates category information for all user queries and the user's personalized feature for the target database. We then developed a personalized retrieval system reflecting the personalized feature to produce search result. Our system re-ranks the result documents by adding more weights to the documents for which categories match with the user's personalized feature. By using user's tendency information, the ambiguity problem of the word could be solved. In this paper, we conducted experiments for personalized search and word sense disambiguation (WSD) on a collection of Korean journal articles of science and technology arena. Our experimental result and user's evaluation show that the performance of the personalized search system and WSD is proved to be useful for actual field services.

본 논문은 사용자가 검색에 사용한 질의어를 기반으로 개인의 성향정보를 분석하고자 한다. 이를 위하여 사용자가 검색을 하기 위해서 입력한 질의어를 문서분류기를 이용하여 범주를 부여한다. 본 연구에서는 각 레코드에 미리 부여된 DDC 분류코드를 분류정보로 활용하였다. 이러한 방식을 사용하여 사용자의 질의어를 기반으로 개인의 특징을 분석한다. 분석된 개인의 성향정보를 검색 결과에 반영하고 개인의 의도에 맞는 문서를 재순위화시키는 개인화 검색시스템을 개발하였다. 또한 개인의 성향정보를 이용하여 단어의 중의성 문제를 해결할 수 있었다. 본 논문에서는 한국과학기술정보연구원이 운영 중인 과학기술학회마을 데이터베이스를 이용하여 개인화와 단어중의성 해소에 관한 실험을 수행하였다. 실험과 사용자 평가를 통해서 개인화 검색 및 단어중의성 해소 성능을 제시하였다.

Keywords

References

  1. 김성진. 2006. 이용자 중심 웹 정보탐색 연구의 실체이론 분석. "정보관리학회지", 23(3): 127-146. https://doi.org/10.3743/KOSIM.2006.23.3.127
  2. 김희섭, 박용재. 2004. 정보시스템의 이용자만족지수 모형 개발 및 측정. "정보관리학회지", 21(4):153-171. https://doi.org/10.3743/KOSIM.2004.21.4.153
  3. 남궁황. 2003. 학습시스템에 기반한 개인화 정보 서비스에 관한 연구. "정보관리학회지", 20(4):113-134. https://doi.org/10.3743/KOSIM.2003.20.4.113
  4. 윤성희. 2007. 질의어 의미정보와 사용자 피드백을 이용한 웹 검색엔진의 성능향상. "한국산학기술학회논문지", 8(2): 280-285.
  5. 이소영, 정영미. 2006. 웹 포털 이용자 로그 데이터에 기반한 개인화 검색 서비스 모형의 설계 및 평가. "정보관리학회지", 23(4): 179-196. https://doi.org/10.3743/KOSIM.2006.23.4.179
  6. 이소영, 조영환. 2004. 검색 포탈에서 사용자 질의분석을 통한 검색형태 연구. "정보과학회지",22(4): 47-51.
  7. 허정, 서희철, 장명길. 2006. 상호정보량과 복합명사 의미사전에 기반한 동음이의어 중의성 해소. "정보과학회논문지", 33(12): 1073-1088.
  8. 허정, 옥철영, 2000. 사전의 뜻풀이말에서 추출한 의미정보에 기반한 동형이의어 중의성 해결 시스템. "정보과학회논문지", 28(9): 688-698.
  9. Bonnet, Monica. 2001 “Personalization of Web Services: Opportunities and Challenages." Ariadne Issue 28. [online]. [cited 2009.08.17] .
  10. Glover, E. J., Lawrence, S., Gordon, M. D., Bormingham, W. P., & Giles, C. L. 2000. “Web Search - Your Way." Communications of the ACM, 44(12): 97-102.
  11. Jeh, G., & Widom, J. 2003. “Scaling Personalized Web Search." In Proceedings of the 12th International World Wide Web Conference, 271-279.
  12. Riecken, D.. 2000 “Personalized Views of Personalization." Communication of the ACM, 43(8):27-28.
  13. Shahabi, Cyrus, & Chen, Yi-Shin. 2003. “Web Information Personalization: Challenges and Approaches." In Proceedings of 3rd Workshop on Databases in Networked Information System(DNIS): 5-15.

Cited by

  1. A Study on Personalized Search System Based on Subject Classification vol.45, pp.4, 2011, https://doi.org/10.4275/KSLIS.2011.45.4.077
  2. Customized Web Search Rank Provision vol.39, pp.2, 2013, https://doi.org/10.7232/JKIIE.2013.39.2.119