Introduction to Big Data and the Case Study of Its Applications

빅데이터에 대한 소개와 활용사례에 관한 연구

  • 한건희 (용인한국외국어대학교부설고등학교) ;
  • 진서훈 (고려대학교 세종캠퍼스 과학기술대학 응용통계학과)
  • Received : 2014.05.15
  • Accepted : 2014.06.20
  • Published : 2014.06.30

Abstract

We are living in a world with vast amount of information flooding around us more than ever. The era of big data has arrived. This can be attributed to the spread of information technology, including mobile phones, internet services and various social networking sites. Big data refers to not only typified numerical data but mass scale, fast and atypical data including texts, videos, and images. The ability to deal with big data has evolved as a mainstream concept in IT field. Earlier in 2011, big data was nothing more than one of the prospective trends in the field of IT. Then, the big data began to receive attention. In 2012 World Economic Forum Annual Meetings, big data grabbed the world's attention as one of the important technologies that will open up new potentials for global development. Big data will be the main subject of this paper, including its definition, origin, related technology. The paper will also examine a variety of big data applications by collecting the data from various social networking sites and articles that deal with this issue. Finally, the paper will suggest its prospective applications.

최근 들어 우리 주변에는 정보통신의 발달, 모바일, 인터넷 및 소셜미디어(social media)의 확산 등으로 엄청난 양의 데이터와 정보가 생성되고 있다. 즉, 범람하는 데이터와 정보의 증가로 인한 빅데이터(big data) 시대가 도래 한 것이다. 이로 인해 빅데이터를 처리할 수 있는 빅데이터 처리기술이 IT 분야의 가장 중요한 화두로 떠오르고 있다. 빅데이터란 생성되는 규모가 방대하고, 생성 속도 또한 매우 빠르고, 생성되는 데이터의 형태도 정형화된 수치 데이터뿐 아니라 휴대전화와 SNS(social network service)에서 생성되는 문자, UCC(user created contents)를 비롯한 동영상 콘텐츠, 이미지 등의 비정형화된 데이터를 포함하는 대규모 데이터를 말한다. 본 논문에서는 최근 이슈가 되고 있는 빅데이터와 관련하여 빅데이터의 정의와 탄생배경, 빅데이터 관련 기술 등에 대해 최근의 동향을 소개하였다. 또한 빅데이터의 다양한 활용 사례들을 살펴보고, 국내의 블로그(blog)나 다양한 보도에서 얻어지는 실제 텍스트 데이터를 이용하여 빅데이터 분석을 수행하여 이에 대한 결과와 활용방안에 대해 연구하였다.

Keywords

References

  1. Ahn, H. Y., Kang, H. C., Choi, H. S., Han, S. T. (2011). A Study on Purchase Amount Predictions in Dong Units Using Small Area Estimation Methods, Journal of the Korean Data Analysis Society, 13(4B), 1837-1848. (in Korean).
  2. Chang, F., Dean, J., Ghemaway, S., Hsieh, W. C., Wallach, D. A., Burrows, M., Chandra, T., Fikes, A., Gruber, R. E. (2006). Bigtable: A Distributed Storage System for Structured Data. Google, Inc.
  3. Economist Intelligence Unit (2011). Big Data Harnessing a Game-Changing Asset.
  4. Ham, Y. G., Chae, S. B. (2012). Big Data, Changes Management. Seoul, South Korea: Samsung Economy Research Center. (in Korean).
  5. Han, S. T., Kang, H. C., Kim, D. H. (2004). A Study of Data Quality Management and Data Integration Methodology, Journal of the Korean Data Analysis Society, 6(5B), 1225-1240. (in Korean).
  6. http://zeronova.kr/2013/08/07/seoul-bus-route-optimization/#comments
  7. Jhun, W. J., Kim, J. H., Kim, J. H. (2010). A Development of Scoring Model for the Promotion of Financial Product, Journal of the Korea Cadastral Information Society, 12(2B), 249-264. (in Korean).
  8. Jung, Y. C. (2012). Big Data. Seoul, South Korea: Communication Books. (in Korean).
  9. Kim, J. S., Jin, S. (2013). A Study on the Application of Opinion Mining Based on Big Data, Journal of the Korean Data Analysis Society, 15(1B), 101-113. (in Korean).
  10. Lee, H. S., Kang, H. C., Choi, H. S., Han, S. T. (2013). A Development of Scoring Model for the Promotion of Financial Product, Journal of the Korean Data Analysis Society, 15(4B), 295-306. (in Korean).
  11. Lee, S. H., Kang, H. C., Choi, H. S., Han, S. T. (2012). Customer Segmentation by Using Two-step Cluster Analysis, Journal of the Korean Data Analysis Society, 14(4B), 1849-1860. (in Korean).
  12. Oh, S. W., Jin, S. (2012). A Study on Analysis of Internet Shopping Mall Customers' Reviews by Text Mining, Journal of the Korean Data Analysis Society, 14(1B), 125-137. (in Korean).
  13. Song, G. Y. (2012). Here Your Ambition is Revealed. Seoul, South Korea: Sam and Parkers. (in Korean).