DOI QR코드

DOI QR Code

A Reranking Method Using Query Expansion and PageRank Check

페이지 랭크지수와 질의 확장을 이용한 재랭킹 방법

  • 김태환 (한양대학교 컴퓨터공학과) ;
  • 전호철 (한양대학교 컴퓨터공학과) ;
  • 최중민 (한양대학교 컴퓨터공학과)
  • Received : 2011.01.12
  • Accepted : 2011.05.02
  • Published : 2011.08.31

Abstract

Many search algorithms have been implemented by many researchers on the world wide web. One of the best algorithms is Google using PageRank technology. PageRank approach computes the number of inlink of each documents then ranks documents in the order of inlink members. But it is difficult to find the results that user needs, because this method find documents not valueable for a person but valueable for the public. To solve this problem, We use the WordNet for analysis of the user's query history. This paper proposes a personalized search engine using the user's query history and PageRank Check. We compared the performance of the proposed approaches with google search results in the top 30. As a result, the average of the r-precision for the proposed approaches is about 60% and it is better as about 14%.

사람들은 월드 와이드 웹 상에서 사용자가 원하는 정보를 검색하는 여러 알고리즘들을 구현해 왔다. 이렇게 구현된 검색 알고리즘 중 가장 좋은 기술을 가지고 있는 곳은 페이지랭크(PageRank)방식의 구글이다. 하지만 외부에서 참조하는 링크가 많은 문서를 가지고 있는 문서 즉, 대중들이 관심을 가지는 문서를 상위에 보여주는 페이지랭크 방식으론 사용자가 원하는 문서를 찾아서 제공하지 못할 수 있다. 개인에게 가치가 있는 문서를 찾기보다 대중에게 가치가 있는 문서를 찾기 때문이다. 이러한 문제를 해결하기 위하여 본 논문에서는 어휘의 의미를 정확히 표현하고 있는 워드넷을 이용하여 사용자 질의 이력 정보를 분석하여 현재 질의를 확장한 개인적 가치와 페이지 랭크지수를 이용한 대중적 가치를 모두 고려한 방법을 제안한다. 실험결과 제안한 방법은 상위 30개의 검색결과 중 평균 약 60% 결과들에 대해 만족하는 것으로 나타났으며, 구글 검색 결과에 비해 평균 약 14% 향상된 만족도를 나타내었다.

Keywords

References

  1. SouMen Charkrabati., "mining the web Discovering Knowledge from Hypertext Data", Morgan Kaufmann Publishers. 2003.
  2. B. J. Jansen., A. Spink., T. Saracevic., "Real life, real users, and real needs: astudy and analysis of user queries on the web." Information Processing and Management. Vol.36, pp.207-227, 2000 https://doi.org/10.1016/S0306-4573(99)00056-4
  3. A. N. Langville., C. D. Meyer., "Google's PageRank and Beyond : The Science of Search Engine Rankings". Princeton University Press, 2006.
  4. F. Tanudjaja., L. Mui., "Persona: A Contextualized and Personalized Web Search." Proc. Of Int. Conf. on System Sciences, Vol.3, pp.53-61, 2002.
  5. Y. Sun., H. Li., I. G. Councill., J. Huang., "Personalized Ranking for Digital Libraries Based on Log Analysis." WIDM'08, pp.133-140, 2008. https://doi.org/10.1145/1458502.1458524
  6. Z. Zhuang., S. Cucerzan., "Re-ranking search results using query logs", CIKM'06, pp.860-861, 2006 https://doi.org/10.1145/1183614.1183767
  7. U. Rohini., V. Ambati., "A collaborative filtering based re-ranking strategy for search in digital libraries", Lecture notes in computer science, pp.194-203, 2005.
  8. T. H. Haveliwala., "Topic-Sensitive PageRank: A Context-Sensitive Ranking Algorithm for Web Search", IEEE Transaction on Knowledge and Data Engineering, Vol. 15, No.4, pp.784-796, 2003. https://doi.org/10.1109/TKDE.2003.1208999
  9. D. Fogaras., B. Racz., K. Csalogany., T. Sarlos., "Towards Scaling Fully Personalized PageRank: Algorithms, Lower Bounds and Experiments," Internet Math., Vol.2, No.3, pp.333-358, 2005. https://doi.org/10.1080/15427951.2005.10129104
  10. F. Qiu, J. Cho., "Automatic Identification of User Interest For Personalized Search", WWW 2006, pp.22-26, May, 2006.
  11. http://www.dmoz.org
  12. Mingjun. Lan., Shui. Yu., Ruth. Backer., Walei. Zhou., "A Co-Recommendation Algorithm for Web Searching.", Fifth International Conference on Algorithms and Architectures for Parallel Processing(ICA3PP'02). IEEE International Conference. 2002 https://doi.org/10.1109/ICAPP.2002.1173621