QualityRank : Measuring Authority of Answer in Q&A Community using Social Network Analysis

QualityRank : 소셜 네트워크 분석을 통한 Q&A 커뮤니티에서 답변의 신뢰 수준 측정

  • 김덕주 (국방대학교 전산정보학과) ;
  • 박건우 (국방대학교 전산정보학과) ;
  • 이상훈 (국방대학교 전산정보학과)
  • Received : 2010.08.23
  • Accepted : 2010.09.28
  • Published : 2010.12.15

Abstract

We can get answers we want to know via questioning in Knowledge Search Service (KSS) based on Q&A Community. However, it is getting more difficult to find credible documents in enormous documents, since many anonymous users regardless of credibility are participate in answering on the question. In previous works in KSS, researchers evaluated the quality of documents based on textual information, e.g. recommendation count, click count and non-textual information, e.g. answer length, attached data, conjunction count. Then, the evaluation results are used for enhancing search performance. However, the non-textual information has a problem that it is difficult to get enough information by users in the early stage of Q&A. The textual information also has a limitation for evaluating quality because of judgement by partial factors such as answer length, conjunction counts. In this paper, we propose the QualityRank algorithm to improve the problem by textual and non-textual information. This algorithm ranks the relevant and credible answers by considering textual/non-textual information and user centrality based on Social Network Analysis(SNA). Based on experimental validation we can confirm that the results by our algorithm is improved than those of textual/non-textual in terms of ranking performance.

질문(Question)과 답변(Answer)을 하는 커뮤니티 기반의 지식검색서비스에서는 질의를 통해 원하는 답변을 얻을 수 있지만, 수많은 사용자들이 참여함에 따라 방대한 문서 속에서 신뢰성있는 문서를 찾아내는 것은 점점 더 어려워지고 있다. 지식검색서비스에서 기존 연구는 사용자들이 생성한 데이터 즉 추천수, 조회수 등의 비텍스트 정보를 이용하거나 답변의 길이, 자료첨부, 연결어 등의 텍스트 정보 이용하여 문서의 품질을 평가하고, 이를 검색에 반영하여 검색성능을 향상시키는 데 활용했다. 그러나 비텍스트 정보는 질의/응답의 초기에 사용자들에 의해 충분한 정보를 확보할 수 없는 단점이 있으며, 텍스트 정보는 전체의 문서를 답변의 길이, 연결어등과 같은 일부요인으로 판단해야하기 때문에 품질평가의 한계가 있다고 볼 수 있다. 본 논문에서는 이러한 비텍스트 정보와 텍스트 정보의 문제점을 개선하기 위한 QualityRank 알고리즘을 제안한다. QualityRank는 텍스트/비텍스트 정보와 소셜 네트워크 분석 기반의 사용자 중앙성을 고려하여 질문에 적합하고 신뢰성 있는 답변을 랭킹화 한다 실험결과 제안한 알고리즘을 사용했을 경우 텍스트/비텍스트 모델 보다 랭킹성능에 있어 향상된 결과를 얻을 수 있었다.

Keywords

References

  1. 박소연, 이준호, 전지운, "지식검색 서비스 개선을 위한 문서의 적합도 및 신뢰도 분석", 한국문헌정보학회지, vol. 40, no.2, p.300, 2006년
  2. 이정태, 송영인, 임해창, "신뢰도 자질을 이용한 지식검색 문서의 품질평가", 한국정보학회지 학술발표 논문집, pp. 63-65, 2007년 10월.
  3. Jiwoon Jeon, W.Bruce Croft, Joon Ho Lee, Soyeon Park, "A Framework to Predict the Quality of Answers with Non-Textual Features," In Proceedings of the 29th Annual International AGM SIGIR Conference on Research and Development in Information Retrieval, pp.22S-235, 2006.
  4. 김희연, "정보사회에서의 지식과 지직검색에 대한 고찰", 정보통신정책, vol.18, no.14, 통권398호, pp.6-8, 2006년 8월.
  5. Szuba T, "Computational Collective Intelligence," Wiley and Sons NY, 2001.
  6. M. V. Vieira, B. M. Fonseca, R. Damazio, P. B. Golgher, D. de Castro Reis and B. Ribeiro-Neto, "Efficient Search Ranking in Social Networks," In Proceedings of the 16th ACM Conference on Information and Knowledge Management (CIKM), pp.563-572, 2007.
  7. Freeman L, "Centrality in Social Networks : A Conceptual Classification," Social Networks, no.1, 1979.
  8. 김용학, "사회연결망 분석", 박영사, pp.7-36, pp.8-122, 2003년.
  9. Berger, A. L., Pietra, V.J.D., and Pietra S.A.D., "A maximum entropy approach to natural language processing," Compt. Linguist.m vol.22, no.1, pp.39-71, 1996
  10. Lada A.Adamic, Jun Zhang, Eytan Bakshy, Mark S.Ackerman, "Knowledge Sharing and Yahoo Answers : Everyone Knows Something," WWW 2008, pp.667-570, April 2008.
  11. Kekalainen, J. and Jarvelin, K., "Using graded relevance assessments in IR evaluation," Journal of the American Society for Information Science and Technology, vol.53, no.13, pp.1120-1129, 2002. https://doi.org/10.1002/asi.10137
  12. Kalervo Jarvelin, Jaana Kekalainen, "Cumulated Gain-based Evaluation of IR Techniques," ACM, pp.2-22, 2002.