DOI QR코드

DOI QR Code

Performance Improvement of Collaborative Filtering System Using Associative User′s Clustering Analysis for the Recalculation of Preference and Representative Attribute-Neighborhood

선호도 재계산을 위한 연관 사용자 군집 분석과 Representative Attribute -Neighborhood를 이용한 협력적 필터링 시스템의 성능향상

  • 정경용 (인하대학교 대학원 전자계산공학과) ;
  • 김진수 (인하대학교 대학원 전자계산공학과) ;
  • 김태용 (문경대학교 웹마스터과) ;
  • 이정현 (인하대학교 컴퓨터공학부)
  • Published : 2003.06.01

Abstract

There has been much research focused on collaborative filtering technique in Recommender System. However, these studies have shown the First-Rater Problem and the Sparsity Problem. The main purpose of this Paper is to solve these Problems. In this Paper, we suggest the user's predicting preference method using Bayesian estimated value and the associative user clustering for the recalculation of preference. In addition to this method, to complement a shortcoming, which doesn't regard the attribution of item, we use Representative Attribute-Neighborhood method that is used for the prediction when we find the similar neighborhood through extracting the representative attribution, which most affect the preference. We improved the efficiency by using the associative user's clustering analysis in order to calculate the preference of specific item within the cluster item vector to the collaborative filtering algorithm. Besides, for the problem of the Sparsity and First-Rater, through using Association Rule Hypergraph Partitioning algorithm associative users are clustered according to the genre. New users are classified into one of these genres by Naive Bayes classifier. In addition, in order to get the similarity value between users belonged to the classified genre and new users, and this paper allows the different estimated value to item which user evaluated through Naive Bayes learning. As applying the preference granted the estimated value to Pearson correlation coefficient, it can make the higher accuracy because the errors that cause the missing value come less. We evaluate our method on a large collaborative filtering database of user rating and it significantly outperforms previous proposed method.

추천 시스템에 있어서 협력적 필터링 기술은 많은 연구가 되고 있다. 그러나 협력적 필터링 기술을 이용한 추천 시스템은 초기 평가 문제와 희박성 문제가 발생한다. 이를 해결하기 위해서 본 논문에서는 선호도 재 계산을 위한 연관 사용자 군집과 베이지안 추정치를 이용한 사용자 선호도 예측 방법을 제안한다. 제안한 방법에서는 협력적 필터링 시스템에서 아이템의 속성을 고려하지 않는 단점을 보완하기 위해서 선호도에 가장 크게 영향을 미치는 대표 장르를 추출하여 유사한 이웃을 찾아 낼 때 예측에 이용하는 Representative Attribute-Neighborhood 방법을 사용한다. 협력적 필터링의 알고리즘에 군집 아이템 백터 내의 특정 아이템의 선호도를 재계산 하기 위한 연관 사용자 군집 분석을 적용하여 성능 향상을 하였다. 또 초기 평가 문제와 희박성 문제를 해결하기 위하여 Association Rule Hypergraph Partitioning 알고리즘을 사용하여 사용자를 장르별로 군집한다. 새로운 사용자는 Naive Bayes 분류자에 의해 이들 장르 중 하나로 분류된다. 또한, 분류된 장르 내에 속한 사용자들과 새로운 사용자의 유사도를 구하기 위해 Naive Bayes 학습을 통해 사용자가 평가한 아이템에 추정치를 달리 부여한다. 추정치가 부여된 선호도를 피어슨 상관 관계에 적용할 경우 결측치(Missing Value)로 인한 예측의 오류를 적게하여 예측의 정확도를 높일 수 있다. 제안된 방법은 기존의 방법보다 높은 성능을 나타냄을 보인다.

Keywords

References

  1. R. Agrawal and R. Srikant, 'Fast Algorithms for Mining Association Rules,' Proceedings of the 20th VLDB Conference, Santiago,Chile, 1994
  2. R. Agrawal, T. Imielinski and A. Swami, 'Mining association rules between sets of items in large databases,' In Proceedings of the 1993 ACM SIGMOD Conference, Washington DC, USA, 1993 https://doi.org/10.1145/170035.170072
  3. C. Basu, H. Hirsh and W. W. Cohen, 'Recommendation as classification : Using social and content-based information in recommendation,' In Proceedings of the Fifteenth National Conference on Artificial Intelligence, Madison,WI, pp.714-720, 1998
  4. D. Billsus, M. J. Pazzani, 'Learning Dollaborative Information Filters,' Proceeding of ICML, pp.46-53, 1998
  5. J. S. Breese, D. Heckerman and C. Kadie, 'Empirical Analysis of Predictive Algorighms for Collaborative Filtering,' Proc. of the 14th Conference on Uncertainty in Artificial Intelligence, 1998
  6. Y. H. Chien and E. I. George, 'A Bayesian Model for Collaborative Filtering,' In Proceedings of the Seventh International Workshop on Artificial Intelligence and Statistics, San Francisco, 1999
  7. R. Cooley, et al., 'Data Preparation for Mining World Wide Wed Browsing Patterns,' Knowledge and Information Systems, Vol.1, No.1, 1999
  8. M. O. Connor and J. Herlocker, 'Clustering Items for Collaborative Filtering,' Proceeding of the ACM SIGIR Workshop on Recommender Systems, Berkeley, CA, 1999
  9. N. Good, B. Schafer, J. Konstan, A. Borchers, B. Sarwar, J. Riedl, 'Combining Collaborative filtering with Personal Agents for Better Recommendation,' AAAI/IAAI, 1999
  10. E. H. Han, et al., 'Clustering Based On Assosiation Rule Hypergraphs,' Proc. of SIGMOD Workshop on Research Issues in Data Mining and Knowledge Discovery(DMKD), May, 1997
  11. J. Herlocker, J. Konstan, A. Borchers and J. Riedl, 'An Algorithm Framework for Performing Collaboative Filtering,' In Proceedings of ACM SIGIR'99 https://doi.org/10.1145/312624.312682
  12. K. Y. Jung, J. K. Ryu and J. H. Lee, 'A New Collaborative Filtering Method using Representative Attributes-Neigh-borhood and Bayesian Estimated Value,' Proceedings of International Conference on Artificial Intelligence : Las Vegas, USA, pp.24-27, June, 2002
  13. K. Y. Jung, Y. J. Park and J. H. Lee, 'Integrating User Behavior Model and Collaborative Filtering Methods in Recommender Systems,' International Conference on Computer and Information Science, Seoul, Korea, August, 2002
  14. K. Y. Jung, J. H. Lee, 'Prediction of User Preference in Recommendation System using Association User Clustering and Bayesian Estimated Value,' Lecture Notes in Computer Science 2557, 15th Australian Joint Conference on Artificial Intelligence, December, 2002
  15. G. Karypis, V. Kumar, 'Multilevel k-way Hypergraph Partitioning,' DAC, pp.343-348 https://doi.org/10.1109/DAC.1999.781339
  16. G. Karypis, 'Evaluation of Item-Based Top-N Recommendation Algorithms,' Technical Report CS-TR-00-46, Computer Science Dept. University of Minnesota, 2000
  17. S. J. Ko and J. H. Lee, 'Feature Selection using Association Word Mining for Classification,' In Proceedings of the Conference on DEXA2001, LNCS2113, pp.211-220, 2001
  18. J. Konstan, B. Miller, D. Maltz, J. Herlocker, L. Gordon and J. Riedl, 'GroupLens : Applying Collaborative Filtering to Usenet News,' Communications of the ACM, Vol.40, No.3, pp.77-87, 1997 https://doi.org/10.1145/245108.245126
  19. P. McJones, EachMovie collaborative filtering dataset, URL : http://www.research.digital.com/SRC/eachmovie, 1997
  20. T. Michael, Maching Learning, McGraq-Hill, pp.154-200, 1997
  21. P. Resnick, et al., 'GroupLens : An Open Architecture for Collaborative Filtering of Netnews,' Proc. of ACM CSCW '94 Conference on Computer Supported Cooperative Work, pp.175-186, 1994 https://doi.org/10.1145/192844.192905
  22. 정영미, 정보 검색론, 구미무역 출판부, 1993
  23. 정경용, 김진현, 이정현, '연관 사용자 군집과 베이지안 분류를 이용한 사용자 선호도 예측 방법', 제 28회 한국 정보과학회 추계 학술 발표 논문집(II), pp.109-111, 2001
  24. 김진현, 정경용, 김태용, 이정현, '연관 관계 군집에 의한 협력적 여과 방법', 제 29회 한국 정보과학회 추계 학술 발표 논문집(II), pp.331-333, 2001
  25. 양신모, 정경용, 김진수, 최성용, 이정현, '아이템의 범주적 속성과 수량적 속성에 기반한 연관규칙 발견,' 제12회 한국 정보과학회 HCI CG DESIGN 학술대회, pp.456-461, 2003