DOI QR코드

DOI QR Code

Managing Duplicate Memberships of Websites : An Approach of Social Network Analysis

웹사이트 중복회원 관리 : 소셜 네트워크 분석 접근

  • Kang, Eun-Young (Graduate School of Business IT, Kookmin University) ;
  • Kwahk, Kee-Young (School of Management Information Systems, College of Business Administration, Kookmin University)
  • 강은영 (국민대학교 비즈니스IT 전문대학원) ;
  • 곽기영 (국민대학교 경영대학 경영정보학부)
  • Received : 2010.12.23
  • Accepted : 2011.01.16
  • Published : 2011.03.31

Abstract

Today using Internet environment is considered absolutely essential for establishing corporate marketing strategy. Companies have promoted their products and services through various ways of on-line marketing activities such as providing gifts and points to customers in exchange for participating in events, which is based on customers' membership data. Since companies can use these membership data to enhance their marketing efforts through various data analysis, appropriate website membership management may play an important role in increasing the effectiveness of on-line marketing campaign. Despite the growing interests in proper membership management, however, there have been difficulties in identifying inappropriate members who can weaken on-line marketing effectiveness. In on-line environment, customers tend to not reveal themselves clearly compared to off-line market. Customers who have malicious intent are able to create duplicate IDs by using others' names illegally or faking login information during joining membership. Since the duplicate members are likely to intercept gifts and points that should be sent to appropriate customers who deserve them, this can result in ineffective marketing efforts. Considering that the number of website members and its related marketing costs are significantly increasing, it is necessary for companies to find efficient ways to screen and exclude unfavorable troublemakers who are duplicate members. With this motivation, this study proposes an approach for managing duplicate membership based on the social network analysis and verifies its effectiveness using membership data gathered from real websites. A social network is a social structure made up of actors called nodes, which are tied by one or more specific types of interdependency. Social networks represent the relationship between the nodes and show the direction and strength of the relationship. Various analytical techniques have been proposed based on the social relationships, such as centrality analysis, structural holes analysis, structural equivalents analysis, and so on. Component analysis, one of the social network analysis techniques, deals with the sub-networks that form meaningful information in the group connection. We propose a method for managing duplicate memberships using component analysis. The procedure is as follows. First step is to identify membership attributes that will be used for analyzing relationship patterns among memberships. Membership attributes include ID, telephone number, address, posting time, IP address, and so on. Second step is to compose social matrices based on the identified membership attributes and aggregate the values of each social matrix into a combined social matrix. The combined social matrix represents how strong pairs of nodes are connected together. When a pair of nodes is strongly connected, we expect that those nodes are likely to be duplicate memberships. The combined social matrix is transformed into a binary matrix with '0' or '1' of cell values using a relationship criterion that determines whether the membership is duplicate or not. Third step is to conduct a component analysis for the combined social matrix in order to identify component nodes and isolated nodes. Fourth, identify the number of real memberships and calculate the reliability of website membership based on the component analysis results. The proposed procedure was applied to three real websites operated by a pharmaceutical company. The empirical results showed that the proposed method was superior to the traditional database approach using simple address comparison. In conclusion, this study is expected to shed some light on how social network analysis can enhance a reliable on-line marketing performance by efficiently and effectively identifying duplicate memberships of websites.

오늘날 기업의 마케팅에 있어 인터넷 환경의 이용은 필수적이며, 좀 더 효율적인 마케팅을 위해 다양한 방법들이 시도되고 있다. 기업들은 온라인마케팅을 통해 다양한 경품이나 포인트 등의 마케팅 비용을 사용하는 것으로 제품이나 서비스를 알려왔다. 특히 웹 2.0의 등장과 함께 기업은 좀 더 적극적으로 고객과 소통하기 위한 노력을 아끼지 않고 있다. 고객들은 회사의 웹사이트에 개인정보를 제공하는 형태로 회원가입을 하여 회사가 제공하는 혜택을 받으면서 제품 광고나 프로모션에 참여하게 된다. 그러나 온라인 마케팅의 운영측면에서 볼 때 현재의 회원관리 시스템은 회원의 모집과 운영에 있어서 효과적이지 못한 문제점이 나타나고 있다. 온라인 환경에서의 고객들은 오프라인 환경에서보다 명확한 자아를 덜 드러내기 때문에 회원가입 과정 중에 일부 악의적인 목적을 가진 고객들이 주변인의 개인정보를 이용하거나 조작하여 중복 아이디를 만들어 활동할 수 있게 된다. 이러한 취약점을 이용하여 중복가입 회원들은 고객들에게 돌아가야 할 경품이나 포인트 등을 가로채어 기업 마케팅 비용의 효율을 떨어뜨리고 있다. 그러나 증가하고 있는 마케팅 비용에 비해 중복회원의 선별 및 이들에 대한 제재를 위한 효과적 방법은 뚜렷하게 제시되지 않고 있다. 따라서 이를 방지하기 위한 체계적인 회원관리 시스템이 요구된다. 본 연구에서는 소셜 네트워크 분석 기법을 이용한 중복회원 식별방법을 제시하고 실제 온라인 고객데이터를 이용하여 그 효과성을 검증한다. 소셜 네트워크는 노드들의 관계를 표현하며, 관계의 유무, 방향 및 강도 등으로 연결 형태를 나타낼 수 있다. 특히 컴포넌트 분석방법은 소셜 네트워크 하위그룹 분석방법으로 네트워크의 내부 그룹을 구분하여 다양한 네트워크 특성을 식별하여 준다. 회원정보 분석에 있어 컴포넌트 분석방법은 전제회원 데이터 내의 의미 있는 정보를 이루고 있는 그룹을 식별하게 된다. 본 연구는 H사의 서로 다른 회원가입 기준을 가진 3개 웹사이트의 회원정보를 사용하여 진행되었다. 제안된 분석방법은 중복회원의 실체를 분석하고 시각화함으로써, 실무적인 측면에서 효율적인 마케팅의 증진을 도울 뿐만 아니라 신뢰성 있는 고객의 의견수렴 및 의사결정에도 도움이 될 것으로 기대된다.

Keywords

References

  1. 김용학, 사회연결망 분석, 박영사, 2003a.
  2. 김용학, 사회연결망 이론, 박영사, 2003b.
  3. 김형도, "일관성 기반의 신뢰도 정의에 의한 협업 필터링", 한국전자거래학회지, 14권 1호(2009).
  4. 박종학, 조윤호, 김재경, "사회연결망:신규고객 추천문제의 새로운 접근법", 지능정보연구, 15권 1호(2009).
  5. 손동원, 사회 네트워크 분석, 경문사, 2002.
  6. 안수산, 신경식, "데이터마이닝 기법을 활용한 스팸메일 분류 및 예측모형 구축에 관한 연구", 한국지능정보시스템학회, 7권 1호(2000).
  7. 위키백과사전, http://ko.wikipedia.org/wiki/협업 필터링.
  8. 이승훈, 김지혁, 김흥남, 조근식, "가상 커뮤니티에서 사회 관계 추론을 위한 시맨틱 웹 접근 방법", 한국지능정보시스템학회 2007년도 추계학술대회(2007), 343-352.
  9. 이승훈, 김지혁, 김흥남, 조근식, "웹 기반 소셜 네트워크에서 시맨틱 관계 추론 및 시각화", 지능정보연구, 15권 1호(2009).
  10. Albert, R. and A.-L. Barabasi, "Statistical mechanics of complex networks", Rev. Mod. Phys., Vol.74(2002).
  11. Butts, C. T., "Social network analysis : A methodological introduction", Asian Journal of Social Psychology, 2008.
  12. Chen, C., "Visualizaing Semantic Spaces and Author Co-Citation Networks in Digital Libraries", In Information Processing Management, Vol.35, No.3(1999).
  13. Domingos, P. and M. Richardson, "Mining the network value of customers", KDD, (2001), 57-66.
  14. Faloutsos, C., K. McCurley and A. Tomkins, "Connection Subgraphs in Social Networks", SIAM International Conference on Data Mining, 2004.
  15. Fawcett, T., "'In vivo' spam filtering : A challenge problem for data mining", Hewlett-Packard Laboratories 1501 Page Mill Road Palo Alto, CA USA, 2004.
  16. Frey, B. J. and D. Dueck, "Clustering by Passing Messages Between Data Points", Science, Vol.315(2007), 972-976. https://doi.org/10.1126/science.1136800
  17. Girvan, M. and M. E. J. Newman, "Community structure in social and biological networks", Proc Natl Acad Sci USA, 2002.
  18. Jaewon, C., H. J. Lee and Y. C. Kim, "The Influence of Social Presence on Evaluating Personalized Recommender System", 한국경영과학회 추계학술대회, 2008.
  19. Joshi, D. and D. GaticaPerez, "Discovering Groups of People in Google News", Proceedings of the 1st ACM international workshop on Human-centered multimedia, 2006.
  20. Kerschbaum, F. and A. Schaad, "Privacy-Preserving Social Network Analysis for Criminal Investigations", Alexandria, Virginia, USA, 2008.
  21. Mccallum, A., A. Corrada-Emmanuel, and X. Wang, "Topic and Role Discovery in Social Networks", IJCAI, 2005.
  22. Newman, M. E. J., "The structure and function of complex networks", SIAM Review, Vol. 45, No.2(2003), 167-256. https://doi.org/10.1137/S003614450342480
  23. Newman, M. E. J., "Detecting community structure in networks", Eur. Phys. J. B., Vol.38 No.2(2004), 321-330. https://doi.org/10.1140/epjb/e2004-00124-y
  24. Newman, M. E. J., "Finding community structure in networks using the eigenvectors of matrices", Physical Review E., (2006), 74.
  25. Palla, G., I. Derenyi, I. Farkas and T. Vicsek, "Uncovering the overlapping community structure of complex networks in nature and society", Nature, Vol.433(2005), 392-395. https://doi.org/10.1038/nature03248
  26. Rahman, M. A., A. El Saddik and W. Gueaieb, "Building Dynamic Social Network From Sensory Data Feed", IEEE Transactions on Instrumentation and Measurement, Vol.59, No.5(2010), 1327-1341. https://doi.org/10.1109/TIM.2009.2038307
  27. Velardi, P., R. Navigli, A. Cucchiarelli and F. D'Antonio, "A New Content-Based Model for Social Network Analysis", Proceedings of the 2008 IEEE International Conference on Semantic Computing, (2008), 18-25.
  28. Wennerberg, P. O., "Ontology Based Knowledge Discovery in Social Networks", Final Report, JRC Joint Research Center, 2005.
  29. Xu, J. and H. Chen, "Criminal Network Analysis and Visualization", Communications of the ACM, Vol.48, No.6(2005).
  30. Zhang, C., W. B. Chen, X. Chen, R. Tiwari, L. Yang and G. Warner, "A Multimodal Data Mining Framework for Revealing Common Sources of Spam Images", Journal of Multimedia, 2009.
  31. Zhou, C., D. Frankowski, P. Ludford, S. Shekhar and L. Terveen, "Discovering Personal Gazetteers : An Interactive Clustering Approach", Proceedings of ACM GIS, 2004.

Cited by

  1. 네트워크 중심성 척도가 추천 성능에 미치는 영향에 대한 연구 vol.27, pp.1, 2021, https://doi.org/10.13088/jiis.2021.27.1.023