Ranking Methods of Web Search using Genetic Algorithm

유전자 알고리즘을 이용한 웹 검색 랭킹방법

  • 정용규 (을지대학교 의료IT마케팅학과) ;
  • 한송이 (을지대학교 의료산업학부 의료전산학전공)
  • Received : 2010.06.05
  • Published : 2010.06.30

Abstract

Using artificial neural network to use a search preference based on the user's information, the ranking of search results that will enable flexible searches can be improved. After trained in several different queries by other users in the past, the actual search results in order to better reflect the use of artificial neural networks to neural network learning. In order to change the weights constantly moving backward in the network to change weights of backpropagation algorithm. In this study, however, the initial training, performance data, look for increasing the number of lessons that can be overfitted. In this paper, we have optimized a lot of objects that have a strong advantage to apply genetic algorithms to the relevant page of the search rankings flexible as an object to the URL list on a random selection method is proposed for the study.

검색엔진을 사용하는 이용자의 정보 즉 선호도에 따른 지속적인 피드백으로 검색 결과의 랭킹을 향상시켜 유연한 검색이 가능하게 하는 방법에는 학습된 인공 신경망을 이용한다. 인공 신경망 학습은 신경망이 여러 다른 검색어로 학습된 후 다른 사용자들이 과거에 실제 검색했던 결과를 좀 더 반영하기 위한 것이다. 가중치의 지속적인 변경을 위해서는 네트워크에서 역방향으로 움직이면서 가중치를 변경하는 역전파 알고리즘을 이용하여 학습한다. 그러나 이러한 학습은 초기에는 훈련데이터에 적합한 성능을 보이나 학습의 횟수가 증가할수록 점점 과대적합되는 것을 알 수 있다. 따라서 본 논문에서는 최적화해야 할 개체가 많을 때 강한 장점을 가지고 있는 유전자 알고리즘을 적용하여 검색어에 관련성이 높은 페이지들 유연하게 랭킹하기 위해 URL리스트를 개체로 랜덤으로 선택하여 학습하는 기법을 제안한다.

Keywords

References

  1. Deerwester, S., Dumais, S. T., Furnas, G. W., Landauer, T. K., & Harshman, R. "Indexing By Latent Semantic Analysis", Journal of the American Society For Information Science, 41, 391-407. (1990) https://doi.org/10.1002/(SICI)1097-4571(199009)41:6<391::AID-ASI1>3.0.CO;2-9
  2. D. Mertz, "Spam Filtering Techniques. Six approaches to eliminating unwanted e-mail.", Gnosis Software Inc., September, 2002. Ciencias Físicas, Universidad de Valencia, 1992.
  3. Ian H. Witten, Frank Eibe, "Data Mining: Practical Machine Learning Tools and Techniques" Morgan Kaufmann, 2000
  4. Jiawei Han, Micheline Kamber, "Data mining - Concepts and Techniques", Morgan Kaufmann Publishers, 2001.
  5. M. Sahami, S. Dumais, D. Heckerman, and E. Horvitz, "A Bayesian Approach to Filtering Junk E-Mail," AAAI Technical Report WS-98-05, 1998
  6. M. Vinther, "Junk Detection using neural networks", MeeSoft Technical Report, June 2002. Available: http://logicnet.dk/reports/JunkDetection/JunkDetection.htm.
  7. Nils J. Nilsson, 1998. Artificial Intelligence. Morgan Kaufmann, Inc.
  8. Pang-Ning Tan & Michael Steinbach & Vipin Kumar, "Introduction to Data Mining", ELSEVIER, 2006
  9. Toby Segaran. Parent Directory - searchindex [cited 2009.3.28]
  10. Toby Segaran, "Programming collective intelligence", O'REILLY, 2007