Understanding WeboNaver: API-based Search Tool for The Naver Search Engine

API를 활용한 검색 프로그램 WeboNaver의 이해와 적용 -18대 국회의원의 웹 가시성 분석-

  • Park, Han-Woo (Department of Media & Communication, YeungNam University) ;
  • Park, Se-Jung (Department of Media & Communication, YeungNam University) ;
  • Stuart, David (Statistical Cybermetrics Research Group, University of Wolverhampton) ;
  • Lee, Seung-Wook (Department of Information and Communication of Engineering, YeungNam University)
  • 박한우 (영남대학교 언론정보학과) ;
  • 박세정 (영남대학교 언론정보학과) ;
  • ;
  • 이승욱 (영남대학교 정보통신공학과)
  • Published : 2009.12.31

Abstract

With the rise of Web 2.0, API-based software has appeared. This article examines the API-based search tool created for the Korean search engine Naver: Webonaver (Webometrics Tool for Naver). The software is able to collect large amounts of data automatically and can easily distinguish between different types of information on the web, which was impossible before. In particular, Internet researchers can improve efficiency of data analysis within a specified timeframe using this tool. This paper illustrates how to use WeboNaver and tries to verify the usability and reliability through several case studies. In this article, Korean National Assembly Members' web presence was analyzed, as was the web presence of the term H1N1.

Web 2.0의 도래와 함께 Open API를 응용한 소프트웨어 프로그램이 등장하면서 더 이상 사용자들은 웹에서 정보를 수동으로 검색하면서 일일이 살펴보는 번거로움을 겪지 않아도 된다. 공개된 API를 활용해 몇 번의 간단한 조작으로 방대한 데이터를 체계적으로 수집하고 관리할 수 있다. 본 논문은 Open API를 응용해 개발한 검색전문 프로그램 WeboNaver(Webometrics Tool for Naver)를 소개한다. 이는 한국에서 가장 영향력 있는 검색엔진 중의 하나인 네이버를 이용해 방대한 데이터를 카테고리별로 자동수집하여 저장해주는 프로그램이다. 연구자들은 이를 활용해 데이터 관리와 처리, 분석 과정에 정확성과 고도의 효율성을 기할 수 있을 것이다. 논문의 목적은 WeboNaver의 사용을 원하는 학생, 일반인, 연구자의 이해를 돕고자 실제 사례들을 통하여 분석절차를 구체적으로 제시해 그 유용성을 입증하는 것이다. 이 프로그램을 사용하여 18대 국회의원 292명의 웹 가시성을 조사하였다. 또한 신종플루와 관련된 단어들의 웹 가시성을 분석하였다.

Keywords

References

  1. 강창완, 김규곤, 김태완 (2009). 한국자료분석학회 웹사이트에 대한 웹로그 분석, Journal of the Korean Data Analysis Society, Vol. 11, No. 1, February 2009, pp. 361-370.
  2. 김상배 (2008). 인터넷과 한국정치네트워크의 부상과 지식질서의 변동, 한국 인터넷 문화의 특성과 발전방안 심포지엄, 2008년 11월, pp. 163-198.
  3. 남기성 (2004). 사회과학에서 통계분석방법의 선택에 관한 연구, Journal of the Korean Data Analysis Society, Vol. 6, No. 5, pp. 1255-1265.
  4. 박한우 (2009). 인터넷 연구방법으로 e-사이언스: 유형별 특징, 2009 한국자료분석학회 가을철 학술대회 논문집, pp.
  5. 송복섭, 권수갑 (2007). Web 2.0 개념 및 서비스 동향, 주간기술동향, 통권, 1314호, pp. 12-24.
  6. 조동환 (2008). 웹2.0과 기업의 비즈니스 모델 활용방안, 한국콘텐츠학회논문지, 제8권 제4호, pp. 108-116.
  7. 최승배, 김규곤, 강창완, 조성기, 손종관 (2002). 로그(Web Log) 분석기들의 비교연구, Journal of the Korean Data Analysis Society, Vol. 4, No. 3, September 2002, pp. 327-340.
  8. 최경호, 박한우 (2005). 통계적 방법을 활용한 정치 웹사이트를 대상으로 한 웹공간 분석: 17대 국회의원 선거를 중심으로, Journal of the Korean Data Analysis Society, Vol. 7, No. 3, 905-916.
  9. Bar-Ilan, J. A. (2007). Informetrics at the beginning of the 21st century-A review, Journal of Informetrics, Volume 2, Issue 1, January 2008, pp. 1-52.
  10. Mayr, P. and Tosques, T. (2005). Webometrische Analysen mit Hilfe der Google Web APIs, Information: Wissenschaft und Praxis, 56(1), pp. 41-48.
  11. Mayr, P. (2009) Re-Ranking auf Basis von Bradfordizing fuur die verteilte Suche in Digitalen Bibliotheken, Philosophische Fakultaat I, Institut fuur Bibliotheks- und Informationswissenschaft. Berlin, Humboldt-Universitaat zu Berlin. Dissertation.
  12. Scacchil, W., Feller, J., Fitzgerald, B., Hissam, S. and Lakhani, K. (2006). Understanding Free/Open Source Software Development Processes, Software Process Improvement and Practice, 11: pp. 95-105. https://doi.org/10.1002/spip.255
  13. Thelwall, M. & Stuart, D. (2006). Web crawling ethics revisited: Cost, privacy, and denial of service Source, Journal of the American Society for Information Science and Technology, Volume 57, Issue 13, pp. 1771-1779. https://doi.org/10.1002/asi.20388
  14. Thelwall, M., Thelwall, T., Fairclough, R. (2006). Automated Web issue analysis: A nurse prescribing case study, Information Processing and Management, 42, pp. 1471–1483. https://doi.org/10.1016/j.ipm.2006.03.011
  15. Retreived: http://www.sisapress.com/news/articleView.html?idxno=50437
  16. Retreived: http://cyber.law.harvard.edu/rss/announceRss2.html