DOI QR코드

DOI QR Code

Entrepreneur Speech and User Comments: Focusing on YouTube Contents

기업가 연설문의 주제와 시청자 댓글 간의 관계 분석: 유튜브 콘텐츠를 중심으로

  • 김성범 (금오공대 IT융합학과 부교수) ;
  • 이정환 (충북대 경영정보학과 조교수)
  • Received : 2020.02.25
  • Accepted : 2020.03.13
  • Published : 2020.05.28

Abstract

Recently, YouTube's growth started drawing attention. YouTube is not only a content-consumption channel but also provides a space for consumers to express their intention. Consumers share their opinions on YouTube through comments. The study focuses on the text of global entrepreneurs' speeches and the comments in response to those speeches on YouTube. A content analysis was conducted for each speech and comment using the text mining software Leximancer. We analyzed the theme of each entrepreneurial speech and derived topics related to the propensity and characteristics of individual entrepreneurs. In the comments, we found the theme of money, work and need to be common regardless of the content of each speech. Talking into account the different lengths of text, we additionally performed a Prominence Index analysis. We derived time, future, better, best, change, life, business, and need as common keywords for speech contents and viewer comments. Users who watched an entrepreneur's speech on YouTube responded equally to the topics of life, time, future, customer needs, and positive change.

최근 유튜브의 성장이 주목받고 있다. 유튜브는 콘텐츠를 소비하는 채널일 뿐만 아니라 소비자의 의사를 표시하는 공간이 되고 있다. 소비자들은 댓글이라는 형식으로 유튜브 안에서 그들의 의견을 표출한다. 이 연구는 유튜브에 업로드되어 시청되는 글로벌 기업가 연설문과 영상을 시청하고 작성한 댓글의 텍스트를 연구대상으로 한다. 텍스트 마이닝 소프트웨어인 Leximancer를 사용하여 각각의 연설문과 댓글을 대상으로 내용 분석(content analysis)을 시행하였다. 각 기업가 연설문의 주제는 대응분석(correspondence analysis)을 사용하여 분석하였고 기업가 개인의 성향과 특성과 관련 있는 주제를 도출하였다. 댓글에서는 각 연설문의 내용과는 관계없이 공통적으로 money, work, need의 주제를 발견하였다. 텍스트의 길이가 다름을 고려하여 추가로 중요도 지표 (Prominence Index) 분석을 실행하였고 연설문 내용과 시청자 댓글의 공통적인 주제를 구성하는 핵심어로 time, future, better, best, change, life, business, need를 도출하였다. 유튜브 연설문의 시청자는 인생과 시간, 미래, 고객의 니즈, 긍정적 변화에 대한 메시지에 대하여 동일한 주제로 반응하는 것으로 나타났다.

Keywords

I. 서론

조직 내의 구성원들은 리더 또는 기업가의 말과 행동에 다양한 방식으로 반응한다. 리더의 커뮤니케이션 스타일은 조직의 창의성에 영향을 주며[1][2] 리더의 효율적인 커뮤니케이션과 조직의 성과와의 관계[3]는 조직을 연구하는 분야에서 주요 연구과제로 다루어져 왔다.

조직 밖에서는 정치적 리더의 연설과 행동에 대하여, 또는 유명 글로벌 CEO의 연설에 대한 대중의 반응을 연구하여 왔다. 서로가 서로를 직접적으로 알지 못하는 상황에서 청취자는 연설가의 기존 이미지와 연설가의 사용 언어와 내용에 다양하게 반응 한다[4-6]. 대중 리더와 청중의 관계에 대한 분석은 특히 선거 전략에 다양한 의미를 부여하며 정치 커뮤니케이션 분야에서 다양하게 연구주제가 되고 있다[7].

발화자와 반응자의 관계는 정보통신의 발달로 새로운 모습을 띠게 되었으며 온라인상에서 커뮤니케이션의 확대로 나타났다. 온라인상에서의 커뮤니케이션은 익명성과 실시간 반응이라는 변수가 더해지면서 새로운 모습으로 전개된다[8].

최근 유튜브의 미디어로서의 역할이 커지면서 유튜브는 콘텐츠를 소비하는 매체일 뿐만 아니라 콘텐츠 소비자의 의사를 표시하는 공간이 되고 있다[9-11]. 유튜브와 같은 동영상 콘텐츠 플랫폼의 확장으로 다양한 영상 콘텐츠가 소비되고 소비자들은 댓글이라는 형식으로 그들의 의견을 표출한다.

이 연구는 연설자와 이에 반응하는 익명 시청자의 반응을 탐색하는 것을 목적으로 한다. 특별히 온라인상에서 연설자의 연설을 시청하고 시청자가 어떻게 반응하는지를 탐색한다. 동영상 플랫폼인 유튜브에서 방송되는 콘텐츠를 대상으로 하며 이에 반응하는 댓글을 시청자의 반응으로 간주한다. 특별히 유튜브 콘텐츠 중에서 글로벌로 성공한 기업가들의 연설문 내용과 해당 콘텐츠에 반응하는 소비자의 댓글을 분석한다. 온라인상에서 기업가의 연설문과 이에 반응하는 청중 간의 관계에서 다음과 같은 연구 질문을 제기하고 이에 대한 해답을 텍스트 마이닝을 사용하여 분석하였다.

첫째, 글로벌 비즈니스(Global business)에서 성공했다고 인정되는 기업가들은 일반적인 삶과 진로와 관련된 연설문에서 어떤 주제를 이야기하는가?

둘째, 기업가들의 연설문을 시청한 후에 시청자들은 댓글을 통해서 어떤 단어와 주제로 반응하는가? 시청자가 연설문의 내용에 대하여 공통으로 반응하는 주제들은 무엇인가?

II. 선행연구

1. 기업가, 정치적 리더와 연설문

연설문을 대상으로 하는 연구는 기업가보다는 정치인의 메시지를 분석하거나, 리더의 연설을 조직 전략의 맥락에서 이해하고 접근하려고 한 연구가 많았다. 이 분야의 연구는 초기에는 정치가의 연설문을 중심으로 진행되었으며[12][13], 방법론적으로는 텍스트를 대상으로 정성적 접근, 또는 텍스트 마이닝을 이용한 정량적인 연구로 발전해 왔다[12][14].

기업 고위직 여성들에 관한 인터뷰 기사를 통해서 언론에 비친 여성 경제 지도자를 탐구한 연구도 연설문은 아니지만, 언론에 재현된 여성 경제 지도자의 모습을 텍스트를 대상으로 접근하였다는 측면에서 취지나 방법론 측면에서 유사하다[15]. 정치가나 리더의 연설에 관한 연구는 연설 내용의 주제를 주로 연구하였으며, 언어학 분야에서는 텍스트의 수사학적인 관점에서 정성적인 분석을 시도하였다[16][17]. (마윈의 CEO 퇴임 연설). 연설문을 분석한 연구는 대통령의 연설문이 특정 이벤트를 기준으로 어떻게 변화했는지를 감성분석으로 접근하거나[18], 사기업 분야에서 기업의 연간 보고서에(Annual report) 등장한 대표이사의 글(CEO letter)을 분석하여 기업의 전략을 탐색하는 주제(Thematic) 중심의 연구로 확장되었다[19].

기업가 분야에서는 ‘Strategy profiles of Ashoka Fellows’ 자료를 토대로 텍스트 마이닝 분야의 토픽모델링(LDA)을 방법론으로 이용한 연구가 있다. 이 연구는 사회적 기업가정신 전략(social entrepreneurship strategy)의 주제를 연구한 Chandra et. al 의 연구로서[14] 정량적인 텍스트 마이닝 방법론을 이용해 기업가의 전략을 분석한 의미 있는 연구이다. 앞에서 언급한 논문들은 발화 주체로서 연설가의 연설문 주제를 정성적 또는 정량적으로 분석한 연구들이다.

기업가 연설문을 연구의 소재로 사용하여 기업가의 성향을 찾기는 쉽지 않다. 기업가는 초기 기업을 운영하는 자로서 성공해서 기업을 계속 유지하지 않는 한 조기에 기업경영 일선에서 퇴장하는 일이 많으며 기업가들이 연설문을 남기는 일도 흔한 일은 아니다. 또한, 기업가의 연설문이 기업가의 성향을 드러낸다고 가정을 할 수 있지만 증명하기는 쉽지 않다. 다만, 존재하는 유명 기업가의 연설문이 기업가의 성향을 대표할 수는 없지만, 기업가별로 그들이 무엇을 강조하며 말하는지, 주제의 차이를 비교하는 좋은 자료가 될 수는 있다.

2. 연설자와 청중의 반응

상대방이 누구인지를 인지할 수 있는 조직 안에서는 리더의 언어적 비언어적 정서 표현이 팀 구성원의 정서 경험에 유의하게 영향을 미친다[20]. 이러한 연구는 리더와 구성원 간의 상호작용 존재를 전제로 한다.

반면에 같은 조직의 구성원이 아닌 대중적으로 알려진 사람의 연설과 이것을 청취하는 시청자는 공간적으로 시간상으로 떨어져 있고 익명성이 보장되는 상황이다. 이러한 공간에서 온라인상의 청취자가 대중 연설에 어떻게 반응하는지를 고민하고 이것을 측정하는 방법을 모색하는 것은 우리의 연구에서 매우 중요한 부분이다.

온라인 커뮤니케이션이라는 상황에서의 연구는 두 가지의 형태로 전개되었다. 첫째는 소셜네트워크서비스 (Social Network Service:SNS)에서 글을 쓰는 자를 대상으로 하는 연구 유형이다. 작성자를 중심으로 작성자의 행동, 그리고 그 글의 내용을 연구하는 분야이다 [21]. SNS에서 메시지를 전달하는 전달자의 관점에서 자아를 표현하는 글을 쓸수록 본인 스스로가 공감 경험이 높아지고 인터넷에서의 친 사회적 행동이 증가한다는 연구가 있다[21]. 이 연구는 발화자가 자아 자신을 표현하는 주제를 이야기하는 상황에 주목하여 발화자의 행동과 변화를 탐색하는 첫 번째 유형의 연구이다. 둘째는 SNS 등의 온라인에서 표현하는 주체와 SNS에서 글을 읽는 자들과의 상호작용을 분석하는 연구이다 [22]. 이 연구 범주에 해당하는 것으로서 온라인 커뮤니티의 사회적 익명성의 긍정성을 제시한 연구[8], SNS 집단에서 적극적 자기 노출 집단이 관심 분야, 취향, 취미 등에서 동질성 인식 정도가 높게 나타나지만, 의견 등에 있어서는 동질성 인식이 낮게 나타났다는 연구가 있다[22].

우리의 연구는 익명성이 보장되는 온라인상의 커뮤니케이션을 가정하고 있으며 1회의 연설자의 연설문에 대한 분석과 다수의 익명 청취자의 댓글 반응 분석을 포함하고 있다.

3. 유튜브 댓글에 관한 연구

일반적인 온라인 커뮤니케이션이 참여자 각자가 모두 동일한 텍스트로 커뮤니케이션하는 상황이 지배적이라면 유튜브 커뮤니케이션은 유튜브의 발화자는 유튜브 동영상으로 메시지를 보내며 거기에 대해서 시청자는 댓글로서 커뮤니케이션하는 점에 근본적인 차이가 존재한다.

유튜브 댓글에 관한 연구 중 첫 번째 유형은 유튜브 댓글의 내용에 집중한 연구이다. “좋아요”와 “싫어요”가 많은 영상의 댓글을 베이즈 분류기로 분석하여 핵심 키워드를 도출하거나[23], 유튜브의 사용자 댓글과 비구조적 설문을 사용하여 감성 어휘를 추출한 연구[24] 등이다. 두 번째 유형으로는 댓글과 이에 반응하는 사용자, 댓글이 다른 댓글에 미치는 영향에 집중한 연구로서 이들 연구에서는 설문과 실험을 방법론으로 사용하였다. 온라인 댓글에 대한 인식과 댓글 활동을 설문을 사용하여 탐색한 연구[25], 유튜브 댓글은 아니지만,  인터넷 뉴스의 베스트 댓글을 사용하여 베스트 댓글이 일반 댓글에 미치는 영향을 동조효과의 개념으로 접근한 연구가 있다[26]. 세 번째 유형은 유튜브 댓글을 직접적인 연구대상으로 하여 콘텐츠에 대한 시청자의 반응을 고민한 내용분석 연구이다. 이수범과 서민혜 (2017)는 매뉴얼에 의한 수작업 코딩을 사용한 내용분석(content analysis)을 통해 외국인에 대한 한국인의 인식을 분석하였으며[9], 김선우(2018)는 유튜브 댓글을 대상으로 구매 여정 단계별 사전을 만들어 제품별, 시계열 단계별 유튜브 댓글의 빅데이터 분석을 시행하기도 하였다[27].

본 연구는 유튜브 댓글을 직접 소재로 사용하여 댓글의 내용을 분석하며 댓글의 내용과 연설문의 내용을 비교한다는 점에서 세 번째 유형의 범주에 속한다. 댓글은 연설문의 내용과 앞에 쓰인 댓글에 영향을 받을 수 있지만, 기본적으로 이 연구에서는 연설문의 내용에만 영향을 받는다는 것으로 가정하여 접근하였다.

III. 방법론

1. 데이터

기업가의 연설문은 유튜브에 업로드되어 있는 기업가 연설의 스크립트를 수집하였으며 추가로 해당 연설 콘텐츠에 대한 댓글을 수집하여 분석하였다. 기업가의 선별은 글로벌 유명 기업의 창업자이며 현재 회사의 실적 및 대중적으로 가장 주목받고 있는 기업을 중심으로 선정하였다. 마이크로소프트의 빌 게이츠, 페이스북의 저커버그, 애플의 스티브 잡스, 구글의 순다르 피차이, 알리바바의 잭마, 아마존의 제프 베저스, 테슬라의 일론 머스크의 연설문을 분석의 대상으로 하였다. 각각의 연설문은 대학 졸업식과 일반 대중을 위해서 기업의 성공과 기업가로서의 삶 등의 주제로 진행된 연설문이다. 연설문은 유튜브에서 댓글을 달 수 있도록 설정된 기업가들의 최근 10년간의 전체 연설문을 대상으로 하였다. 각 기업가의 연설문별로 댓글의 수를 계산하면 스티브 잡스에 대한 연설문에 대한 댓글이 17,107개로 가장 많았고, 순다르 피차이(Sundar Pichai)의 연설문에 대한 댓글이 691개로 가장 적은 수로 집계되었다. 댓글의 수가 차이가 나기 때문에 기업가별 댓글을 비교 분석하는 경우에는 이를 고려한 분석이 필요하며 이 연구에서는 베이즈 통계에 기초한 PI (Prominence Index)를 사용하였다.

표 1. 분석 데이터(연설문과 댓글)

CCTHCV_2020_v20n5_513_t0001.png 이미지

2. 내용분석(Content analysis)과 텍스트마이닝

내용분석(Content analysis)은 텍스트를 분석해서 의미 있는 카테고리를 도출하고 특정 컨셉이나 주제를 도출하는 방법론이다[28]. 이 분석은 정성적인 분석 방법론으로 출발했지만, 정량적인 연구도 가능하며 정성적인 데이터에서 정량적인 결론을 도출할 수 있다. 내용분석은 정성연구와 정량연구가 적절히 섞일 때 최적의 결과를 도출할 수 있다[29]. 내용분석은 텍스트에서 특정 단위별로 적절한 데이터를 발췌하는 과정으로 시작한다. 텍스트(text)에서 범주(category)를 분류하고 주제(theme)를 도출한다. 이 방법을 사람이 매뉴얼이나 지침, 직관에 따라서 정성적으로 할 수도 있으며 컴퓨터의 도움을 받아서 사람이 직관적으로 진행하고 분류하되, 결과는 컴퓨터가 정리해주는 방법을 사용할 수 도있다(예: Nvivo). 순수하게 정량적인 방법을 사용하는 경우에는 컴퓨터가 특정 단어의 빈도(frequency)와 단어의 동시 출현(co-occurrence) 등을 내재된 알고리즘을 통해 분석한다.

이 연구는 정량적인 방법론으로서 텍스트마이닝을 사용하였다. 텍스트마이닝은 텍스트 데이터로부터 의미 있는 정보를 추출하고 분석하며 문서에서 주제를 탐색하고 텍스트에 담겨있는 감성을 분석하는 통계적 기법이다. 텍스트 마이닝을 통해서 정성적 자료로부터 정량적 분석을 할 수 있게 된다. 비정형 형태의 텍스트 데이터는 정형 형태의 숫자로 바뀌고 군집, 분류 분석의 기법으로 확대 발전한다. 텍스트 마이닝은 내용분석 (content analysis)의 범주에서 분석자의 선입견과 편견을 극복하고 일관성(Consistency)과 재생산성( Replicability)을 향상시키며 최종적으로 신뢰성과 타당성을 확보하는 방법론이다. 이 분석을 통해서 정성분석으로 접근하기 어려운 보다 많은 데이터를 처리할 수있다. 특별히 자연어 처리 기법 (Natural language processing)의 발전으로 다양한 분석과 해석을 가능하게 하고 있다[30]. 컴퓨터 알고리즘 기반의 정량적 기반의 내용분석은 정성적으로 분석할 수 있는 수준보다 훨씬 깊고 미묘한 수준까지 분석을 가능하게 하며 체계적이고 신뢰성을 높이는 방법이다[31]. 이 연구에서는 Leximancer 프로그램을 사용하여 단어의 출현 빈도와 동시출현기반의 분석을 진행하였다.

3. Leximancer 프로그램

Leximancer는 통계적 알고리즘을 사용하여 텍스트 데이터를 분석할 수 있도록 고안된 텍스트마이닝 소프트웨어 툴이다[32]. 이 방법론은 내용분석 분야에 많이 차용되어 사용되고 있으며[33],말뭉치(corpus)를 기초로 한 언어학 관찰에 기반하고 있다[34]. Leximancer 는 분석자가 데이터로부터 주제와 테마를 설정할 때 인간으로서 가지는 편견과 오류를 극복하게 한다[35]. Leximancer를 사용하여 데이터로부터 컨셉(concept)과 주제(theme)를 자동적으로 도출할 수 있고 이를 통해 풍부한 해석을 할 수 있다[35]. Leximancer에서 도출되는 컨셉은 상호 연결된 단어들로 구성되는 키워드를 의미한다. 단어가 두 문장 안에 동시에 출현했거나 유사 단어와 같이 등장하면 단어들을 상호 연결되었다고 정의한다. 컨셉(concept)이 모여 집합을 이루면 주제(theme)가 형성되며 주제의 이름은 도출된 컨셉 중에서 가장 많이 연결된 컨셉을 자동으로 선정한다.

4. 분석절차

4.1 컨셉(Concept)과 주제(Theme)의 도출

Leximancer에서 컨셉(concept)의 도출은 나란히 있는 두 문장 내에서 동시에 출현하는 단어의 횟수를 세어 매트릭스로 만든 후 도출된다. 영어의 관사나 접속사는 자동으로 제외되며 대명사는 지시하는 단어와 동일한 것으로 간주하여 셈하여지고 관련어와 유사어는 한 개의 컨셉으로 전환되어 도출된다[36]. Leximancer에서 주제는 컨셉이 모여서 만들어지며 컨셉 단어 중 가장 연관성이 높은 단어가 주제가 된다. 수집된 데이터가 범주별로 구분될 수 있는 경우에는 다변량 범주형 자료의 대응분석 (correspondence analysis)을 Leximancer를 통해서 진행할 수 있다. 대응분석은 x, y간의 변수간 관계를 탐색하는 것으로 이 연구에서는 주제와 연설자와의 관계를 카이제곱 거리로 도출한다.

4.2 Prominence의 분석

카테고리별로 비교 분석을 하면서 각 연설문과 댓글의 분량이 달라서 발생하는 오류를 조정해야 한다. 이것을 조정하기 위해 Leximancer 프로그램에서 제공하는 PI (Prominence index)를 계산하여 사용하였다[37][38]. Prominence Index는 범주와 속성(attribute)의 상관관계이며 비교의 목적으로 사용되는 지표로서 베이지언 통계에 기초하고 있다[38].

Prominence Index(PI)=P(C and T)/P(C)* P(T)

P(C) 는 텍스트 영역이 특정 컨셉으로 도출될 확률이고, P(T)는 텍스트 영역이 특정 범주(category)로 도출될 확률이다. 이 연구에서 특정 범주는 각각의 기업가 연설문을 의미하므로 7개의 연설문이 범주가 된다. P(C & T)는 텍스트 영역이 동시에 특정 컨셉과 특정 범주로 도출될 확률이다.

귀무가설은 ‘P(C)와 P(T)가 상관관계가 없다’. 로 설정된다. PI가 1보다 작으면 컨셉(concept)과 범주(특정 연설문)가 부의 상관관계(Negative correlation)가 있는 것이다. 즉 컨셉(concept)과 범주(category)의 동시 출현(co-occurrence)이 귀무가설(Ho)에서 기대 되는 것보다 적은 것이다. PI가 1보다 크다면 이것은 컨셉과 범주가 정의 상관관계가 있음을 의미한다. 즉 컨셉과 범주의 동시 출현(co-occurrence)이 귀무가설 (Ho)에서 기대되는 것보다 큰 것이다. PI가 2보다 크면 주목할 만한 크기로 간주하며, 6보다 크면 특정 카테고리와 특정 컨셉의 강한 상관관계를 의미하는 것으로 해석한다[38]. Prominence분석은 연설문의 수와 글자수가 다름에서 발생하는 분석상의 오류를 보정하기 위한 방법론이다.

IV. 결과

1. 기업가 연설문의 주제

먼저 각각 연설문을 Leximancer를 사용하여 컨셉과 주제를 도출하였다. 주제는 컨셉의 단어들이 모여 만들어지며 컨셉들을 대표하는 단어로 설정된다. 공통적으로 등장하는 주제로서 People은 1명을 제외한 6명의 연설문에서 상위권에 등장하는 주제어이며 time(s)가 5명의 연설문에서 공통적인 주제로 드러났다. 반면에 차별적인 몇 몇의 주제도 도출되었다. 잭마의 연설문에서는 그의 인생과 관련이 있는 rejected, believe, opportunity가 도출되었으며, 일론 머스크의 연설문에서는 create가, 제프 베저스의 연설문에서는 energy가 차별화된 주제로 나타났다. 기술과 관련된 주제로는 software가 빌 게이츠, 스티브 잡스의 연설문에서 보이며, 구글의 순다르 피차이의 연설문에서 technology 가 명시적으로 주제로 도출되었다. [표 2]의 결과는 각각의 연설문을 각각 개별적으로 Leximancer를 사용하여 주제를 도출한 것이다. 각각의 주제의 순위는 각 연설문 내에서의 위치를 의미한다. 각 주제가 다른 기업가의 연설문과 상대적으로 비교하여 어느 정도의 중요도로 도출되었는지를 분석하기 위해 추가로 Leximancer를 이용해 대응분석을 시행하였다. [그림 1]은 각 연설문을 대응분석(correspondence analysis) 을 사용하여 기업가 연설문별로 각 주제어가 어떻게 연결되는지를 보여준다. 페이스북의 CEO인 마크 주크버그는 access, question, lives, world라는 컨셉과 연결되어 있고, 알리바바의 CEO인 잭마는 world에, 마이크로소프트 CEO인 빌게이츠는 future, lives, 애플의 스티브 잡스는 best, everything에, 테슬라의 일론 머스크는 create, technology, 구글의 순다르 피차이는 technology, 아마존의 제프 베저스는 energy, need, business, idea의 컨셉과 연결되어 있다.

표 2. 각 연설문별 주제어 도출

CCTHCV_2020_v20n5_513_t0002.png 이미지

CCTHCV_2020_v20n5_513_f0001.png 이미지

그림 1. 기업가별 연설문 키워드

2. 연설문 댓글의 주제

연설문 댓글의 각 주제가 다른 기업가의 연설문 댓글과 비교하여 상대적으로 어떤 주제와 관련이 높은지를 대응분석을 사용하여 상대적인 연결 관계를 도출하였다. 각 연설가 댓글별로 분류해 보면 스티브 잡스 연설문에 대해서는 그의 연설문에서 등장하는 내용에 대한 반응으로 스티브 잡스의 삶에 대한 청중의 의견을 반영하는 death, foolish에 연결되어 있고, 잭마, 빌 게이츠, 제프 베저스, 마크 주크버그, 일론 머스크는 모두 money, need. work의 핵심 키워드와 연결된 것으로 나타났다. 기업가 연설문의 주제는 다양한 키워드와 연결되었지만, 댓글의 주제는 비교적 단순하게 몇 개의 주제에 집중된 것으로 나타났다. 댓글의 주제는 대부분이 love, better, hope 등의 긍정적인 단어로 구성되어 있었으나 스티브 잡스의 연설에서 death와 foolish, die라는 부정적 단어가 등장하였으며 fuck와 shit 등의 부정적의미의 욕설은 스티브 잡스의 죽음을 묘사하는 문장에서 다수 등장하였다. [그림 1]과 [그림 2]에서 Folder로 표시된 부분은 각 연설자와 댓글의 데이터를 모아 놓은 것을 의미하며 원의 크기는 동시출현 한 단어가 모인 주제의 크기를 표현하고, 연결된 선은 동시출현으로 단어간의 연결을 표현한 것이다.

CCTHCV_2020_v20n5_513_f0002.png 이미지

그림 2. 기업가 연설문 댓글별 주제

3. 기업가 연설문과 댓글 주제의 관계

방법론에서 언급한 것처럼 연설문의 길이와 댓글의 길이가 서로 다르기 때문에 두 텍스트의 주제를 상호 비교하는 경우에는 텍스트의 길이를 조정하여 주제의 강도를 비교할 필요가 있다. 방법론에서 설명한 PI(Prominence Index)를 도출하여 연설문(speech)과 댓글(comments)의 주제 차이를 비교하였다.

먼저 빌 게이츠의 경우 연설문의 PI가 댓글에 비해서 높은 것으로 분석되었으며 연설문과 댓글에서 동시에 강조된 핵심어는 best (PI>2)이고 비교적 주목을 받은 단어로는 change, best 가 있고, money는 연설문에서는 10위안에 들지 못하였으나 댓글에서는 10위안에 순위 매김을 하였다. 일론 머스크의 경우 future가 연설문과 댓글에서 강한 연관 관계를 보이면서 동시에 주제어로서 등장하였고, 그 뒤를 이은 단어는 better로 나타났다. 빌 게이츠의 경우와 동일하게 money가 댓글에서만 주요 주제어로 등장하였고 shit과 같은 속어가 댓글 주제 10위안에 나타났다. 알리바바의 잭마의 경우 best 가 양 쪽 모두의 텍스트에서 PI 값이 2가 넘었으며 그 뒤를 이어 life, world가 10위안에 공통으로 양 텍스트에서 순위 안에 들었다. 역시 money는 시청자의 댓글에서만 10위 순위 안에 나타났다. 아마존의 제프 베저스의 경우 댓글의 PI가 연설문보다 비교적 높은 것으로 나타났으며 연설문에 등장하는 business가 댓글에서도 높은 PI를 보였다. 그 뒤를 이어 need, time, world가 양쪽 모두의 핵심어로 등장했다. Money는 이 분야에서도 댓글에서만 주제어로 등장했다. 마크 주크버그의 경우에도 money는 댓글에서만 등장하는 핵심 주제이며, time과 world가 양쪽 모두의 주제어로 등장하였다. 스티브 잡스 연설문의 댓글에서만 나오는 특이한 핵심어는 death와 foolish이다. 이 단어는 연설문 댓글을 대상으로 한 주제 분석에서도 도출되었으며 PI 분석에서도 등장한다. 연설문과 댓글에서 공통적으로 등장하는 단어는 change, life, best이다. 구글의 순다르 피차이의 연설문과 댓글에서는 life, better, time이 공통적으로 등장한다. 이상의 결과를 다시 요약하여 연설문과 댓글에 공통적으로 등장하는 핵심어만을 표로 정리하면 다음 [표 4]와 같이 정리된다. best, future, change가 연설문과 댓글에서 모두 PI가 2가 넘는 핵심어이며 better, time, world, business, need가 연설문과 댓글에서 공통으로 나타나는 핵심 키워드이다.

표 3. 기업가 연설문과 댓글 간 주제 차이점 분석

CCTHCV_2020_v20n5_513_t0003.png 이미지

표 4. 연설문과 댓글 주제의 공통 핵심어

CCTHCV_2020_v20n5_513_t0004.png 이미지

V. 결론

1. 시사점

이 연구에서는 유튜브에 업로드되어 있는 기업가별 연설문의 주제를 도출하고 연설문에 반응하는 청취자의 댓글의 주제를 텍스트마이닝을 이용하여 탐구하였다. 이 연구는 주제와 방법론적 측면에서 몇 가지 이론적 실무적 시사점을 제시한다.

이론적으로는 기업가와 이에 반응하는 일반 청중과의 관계를 실험이나 설문이 아닌 텍스트 마이닝을 이용한 탐색적 연구라는 의미를 가지며, 기업가 성향을 유튜브라는 미디어 콘텐츠를 사용하여 시청자 관점에서 탐색하였다는 점에서 의미가 있다. 또한, 연구 분석 결과에서 도출된 연설문과 댓글의 주제들은 연설문의 전달 효과라는 관점에서 해석할 수 있다. 연설문에서 PI가 높은 단어들은 시청자에게 전달하려고 하는 주제를 포함하는 단어로서 연설자가 청중의 반응을 기대하는 주제로 추정할 수 있다. 이 연설문의 주제에 대하여 시청자 댓글에서 나타난 동일 주제어의 PI크기를 비교하여 연설문의 전달 효과를 간접적으로 추정할 수 있다. 이런 관점에서 결과를 해석해 보면 Bill gates와 Jack Ma의 best, Elon musk의 future, Steve jobs의 change가 전달 효과가 높은 단어로 해석할 수 있다.

실무적으로는 유튜브 콘텐츠 영상과 이에 반응하는 시청자의 반응을 분석함으로써 영상 콘텐츠와 소비자의 반응 양태를 제시하였다는 데에 의미가 있다. 콘텐츠의 종류와 관계없이 반응하는 주제, 콘텐츠의 직접적인 특성에 반응하는 주제, 긍정적 반응과 부정적 반응에 사용하는 단어의 사용례를 발견하여 연설문 사례로 제시하였다는 점이다. 이 연구의 결과는 시청자 또는 소비자를 고려한 마케팅 콘텐츠 제작 방향성과 사후 반응의 결과를 분석하는 방법론의 방향성을 제공한다.

2. 한계와 연구의 확장

우리의 연구는 인터넷상에서 발생하는 커뮤니케이션의 양태를 텍스트 마이닝을 사용하여 본문과 댓글의 비교라는 실험적이고 도전적인 연구로서 의의를 가지고 있지만 그 접근방법에 있어서 내용적, 방법론적으로 몇 가지 한계를 가지고 있다. 첫째는 기업가의 연설이 비교적 유사한 상황에서 이루어진 연설문을 대상으로 하고 있지만 그 상황이 완전히 동일하지 않으며 따라서 기업가들간의 연설문의 주제 차이는 필연적이라고 할 수 있다. 다만, 역설적으로 서로 다른 상황이지만 유사한 주제가 등장한다는 사실을 발굴했다는 데 의의가 있다. 둘째는 댓글의 반응은 두 가지 방향에서 이루어진 것으로 추정할 수 있는데, 첫째는 유튜브에서 방영되는 기업가 연설문의 내용에 대한 반응이며 둘째는 유튜브를 감상한 후 먼저 쓴 시청자의 댓글에 반응하여 쓰여진 댓글의 반응이다. 우리의 연구에서는 전자의 연설문에 대한 반응에 주목하여 연구를 진행하였으며 후자의 반응은 고려하지 않았다. 먼저 쓴 댓글에 대한 반응은 각 개인의 시청 스타일과 댓글을 쓰는 특성에 따라 다르다. 또한, 유튜브를 시청하고 댓글을 쓰는 단말기의 종류에 따라 보이는 선행 댓글의 범위가 달라서 이에 대한 반응을 표준화하여 측정하기 어렵다. 이러한 이유로 방법론적으로 일반화된 방법으로 댓글 간의 인과관계를 추론하기에는 제약이 많다. 댓글에 대한 시청자의 반응을 실험을 통해 접근하는 기존의 연구가 많은 이유는 이런 제약에 기인한다. 이런 측면에서 하나의 반응만을 고려한 이 연구는 한계를 가지고 있다. 유튜브 댓글이 먼저 쓰여 있는 댓글에 영향을 받고 있다고 가정할 때 어느 정도의 시간적 분량에 영향을 받는지를 측정할 수 있다면 자기가 쓴 댓글과 영향을 준 댓글을 비교하여 어떤 주제에 영향을 받고 어떤 주제에는 영향을 받고 있지 않은지를 탐구할 수 있다.

셋째는 유튜브 댓글이 모두 동일한 품질을 확보하고 있지 않다는 점이다. 무성의하게 작성된 댓글이 있고, 개인적 감정에 치우친 댓글도 있다. 그러나 이 연구에서는 모든 댓글의 품질이 동일하다는 가정하에 연구를 진행하였다. 영어로 씌어지지 않은 글과 아이콘으로 처리된 기호를 데이터 전처리를 통하여 제외하였을 뿐이다. 향후 연구에서는 1차 필터링을 통해서 특정 기준을 통과한 댓글만 연구의 대상으로 하는 것도 의미 있는 일일 것이다.

넷째는 이 연구의 방법론상의 특징이긴 하지만 방법론의 정확도와 효율에 대한 평가는 이루어지지 않았다는 점이다. 이 연구에 사용된 동시출현 단어분석과 대응분석을 사용한 모형으로부터 향 후 토픽모델링과 군집분석, 긍정부정의 감성분석을 사용하는 방법론으로 확장하여 접근방법의 다양화를 모색한다면 가장 적절한 방법론을 제안할 수 있을 것이다.

이 연구의 방법론과 대상의 한계를 극복하면서 추가로 유튜브의 장르별, 더 나아가 SNS의 특성별 댓글의 연구로의 확장한다면 다음과 같은 실용적 의미를 추가로 확보할 수 있을 것이다.

첫째, 유튜브에 게재되는 동영상의 종류, 장르에 따라 시청자의 행동 양태가 다를 것이다. 유튜브 콘텐츠는 정보를 전달하는 동영상일 수도 있으며 정치인의 의견을 전달하는 것 있을 수도 있고 유명 팝가수의 뮤직비디오일 수도 있다. 각각의 종류에 따라 시청자의 몰입도가 다르고 댓글의 단어가 다를 수 있다. 장르와 동영상의 종류에 따라 영상에서 제공하는 콘텐츠와 댓글의 주제 간의 관계는 다양하게 변할 수 있다. 따라서 기업가 연설의 주제와 유사한 주제의 댓글이 다른 장르의 콘텐츠에 대해서도 동일하게 생성되지 않을 수 있다. 향후 연구에서는 유튜브 장르별, 종류별 댓글의 양태에 주목한 연구 확장이 의미 있을 것이다.

둘째, 유튜브 댓글, 트위터 포스트, 페이스북의 댓글과 뉴스에 대한 댓글은 서로 다른 결과를 나타낼 것으로 예상한다. 서로 다른 미디어의 댓글에 관한 비교 연구도 미디어로서 성장하는 SNS의 플랫폼 진화를 예측하는 데 도움을 줄 수 있다. 이 분야는 사이버상에서 정치적 커뮤니케이션이 미디어에 따라서 어떻게 전개되는지를 제시하는 주요 주제가 될 수 있다[39].

유튜브 장르별 비교 연구는 유튜브의 콘텐츠를 생산하는 창작자와 유튜브를 마케팅의 도구로 사용하는 기업에 실무적인 시사점을 추가할 것이고, 각 SNS의 미디어 비교 연구는 기업이 사용하는 광고 포트폴리오 전략에 시사점을 줄 것이며, 서로 다른 미디어에 대한 정치적 견해의 표명에 대한 소재로서 댓글에 대한 연구는 정치 커뮤니케이션 연구에 기여할 수 있을 것이다[39].

References

  1. O. C. Brown, C. Paz-Aparicio, and A. J. Revilla, "Leader's communication style, LMX and organizational commitment: A study of employee perceptions in Peru," Leadership & Organization Development Journal, Vol.40, No.2, pp.230-258, 2019. https://doi.org/10.1108/LODJ-03-2018-0129
  2. M. Mayfield and J. Mayfield, "Leader talk and the creative spark: A research note on how leader motivating language use influences follower creative environment perceptions," International Journal of Business Communication, Vol.54, No.2, pp.210-225, 2017. https://doi.org/10.1177/2329488416687057
  3. L. A. Hambley, T. A. O'Neill, and T. J. Kline, "Virtual team leadership: The effects of leadership style and communication medium on team interaction styles and outcomes," Organizational behavior and human decision processes, Vol.103, No.1, pp.1-20, 2007. https://doi.org/10.1016/j.obhdp.2006.09.004
  4. B. Shamir, M. B. Arthur, and R. J. House, "The rhetoric of charismatic leadership: A theoretical extension, a case study, and implications for research, in Leadership Now: Reflections on the Legacy of Boas Shamir," Emerald Publishing Limited, pp.31-49, 2018,
  5. W. Zhang and L. Chang, "Perceived speech conditions and disagreement of everyday talk: A proceduralist perspective of citizen deliberation," Communication Theory, Vol.24, No.2, pp.124-145, 2014. https://doi.org/10.1111/comt.12034
  6. A. Finlayson and J. Martin, "'It ain't what you say…': British political studies and the analysis of speech and rhetoric," British Politics, Vol.3, No.4, pp.445-464, 2008. https://doi.org/10.1057/bp.2008.21
  7. 박민경, 이건호, "온라인 오피니언 리더의 담론 유형 탐구-'세종시'관련 인터넷 토론방 다음 아고라 '선도의견'을 중심으로," 언론정보연구. 제48권, 제4호, pp.114-149, 2011.
  8. 윤수진, 손동영, "사회적 익명성이 온라인 커뮤니티 구성원의 공동체 신뢰도와 인식에 미치는 영향," 사이버커뮤니케이션학보, 제31권, 제4호, pp.189-226, 2014.
  9. 이수범, 서민혜, "유튜브 (Youtube) 댓글을 통해 살펴본 한국인의 외국인 수용성 연구: 백인과 흑인의 인종적 차이를 중심으로," 커뮤니케이션학 연구, 제25권, 제5호, pp.33-57, 2017.
  10. A. U. R. Khan, Khan, and M. B. Khan, Naive Multi-label Classification of YouTube Comments Using Comparative Opinion Mining, in Procedia Computer Science, 2016.
  11. 송정은, 장원호, "유투브 (YouTube) 이용자들의 참여에 따른 한류의 확산: 홍콩의 10-20 대 유투브(YouTube) 이용자조사를 중심으로," 한국콘텐츠학회논문지, 제13권, 제4호, pp.155-169, 2013. https://doi.org/10.5392/JKCA.2013.13.04.155
  12. T. Triadafilopoulos, "Politics, speech, and the art of persuasion: Toward an Aristotelian conception of the public sphere," The Journal of Politics, Vol.61, No.3, pp.741-757, 1999. https://doi.org/10.2307/2647826
  13. 홍주현, 윤해진, "18 대 대통령 선거 후보자의 연설문 네트워크 분석: 단어의 가시성 (visibility) 과 단어 간 연결성 (connectivity) 을 중심으로," 한국콘텐츠학회논문지, 제14권, 제9호, pp.24-44, 2014 https://doi.org/10.5392/JKCA.2014.14.09.024
  14. Y. Chandra, L. C. Jiang, and C. J. Wang, "Mining social entrepreneurship strategies using topic modeling," PLoS ONE, Vol.11, No.3, pp.1-28, 2016.
  15. 김희진, 이수민, "언론에 재현된 여성 경제리더의 모습," 미디어, 젠더 & 문화, 제23호, pp.79-110, 2012.
  16. 나민구, 고은미, "마윈 "CEO 퇴임 연설" 텍스트의 수사학적 분석," 수사학, 제29호, pp.81-110, 2017.
  17. B. S. Lee and M. Y. Kim, "A Rhetorical Analysis of President Roh Moo-Hyun's Inaugural Address," Korean Journal of Rhetoric, No.4, pp.179-209, 2006.
  18. K. M. Davis and W. L. Gardner, "Charisma under crisis revisited: Presidential leadership, perceived leader effectiveness, and contextual influences," The Leadership Quarterly, Vol.23, No.5, pp.918-933, 2012. https://doi.org/10.1016/j.leaqua.2012.06.001
  19. R. N. Conaway and W. J. Wardrope, "Do their words really matter? Thematic analysis of U.S. and Latin American CEO letters," Journal of Business Communication, Vol.47, No.2, pp.141-168, 2010. https://doi.org/10.1177/0021943610364523
  20. 최대정, 최가영, 박동건, "리더의 정서 표현이 팀 구성원의 정서경험에 미치는 영향," 한국심리학회지: 산업 및 조직, 제18권, 제2호, pp.201-224, 2005.
  21. 장현미, "SNS에서 글쓰기가 공감경험과 친사회행동에 미치는 효과," 한국언론학보, 제58권, 제3호, pp.5-35, 2014.
  22. 전범수, "SNS 자기 노출 집단별 동질성 인식 연구," 한국콘텐츠학회논문지, 제12권, 제12호 pp.170-178, 2012 https://doi.org/10.5392/JKCA.2012.12.12.170
  23. 신동민, 고상현, 권민석, 신민수, 이주연, 이주연, 강태원, "youTube 댓글분석을 통한 영상 추천," 한국정보기술학회, Proceedings of KIIT Conference, pp.363-364, 2018(11).
  24. S. Lee and K. Bang, "A Study on the Extraction of Emotional Words for Media Facade," Journal of Digital Contents Society, Vol.16, No.5, pp.741-748, 2015. https://doi.org/10.9728/dcs.2015.16.5.741
  25. 권상희, 김익현, "온라인 댓글 인식과 댓글 활동의 관계에 관한 연구," 한국언론정보학회, 통권, 제42호, pp.44-78, 2008.
  26. 조항수, 문광수, 오세진, "베스트 댓글의 경향이 일반 댓글의 동조효과에 미치는 영향," 한국심리학회 연차학술발표 논문집, 2013년 제1호, p.308, 2013.
  27. 김선우, 안희웅, 장유나, 홍민예, 서민지, 김성태, "유튜브 댓글 빅데이터 분석을 통한 제품별 소비자 구매여정 연구-새로운 방법적 가능성을 제안하며," 영상문화콘텐츠연구, 제16호, pp.57-89, 2019.
  28. K. Fisk, R. Fitzgerald, and J. Cokley, "Controversial new sciences in the media: Content analysis of global reporting of nanotechnology during the last decade," Media International Australia, No.150, pp.156-166, 2014.
  29. R. P. Weber, Basic content analysis, Sage, 1990.
  30. C. H. Yu, A. Jannasch-Pennell, and S. DiGangi, "Compatibility between text mining and qualitative research in the perspectives of grounded theory, content analysis, and reliability," The Qualitative Report, Vol.16, No.3, p.730, 2011.
  31. M. C. Bligh and J. C. Kohles, "Comparing leaders across contexts, culture, and time: Computerized content analysis of leader-follower communications," Leadership, Vol.10, No.2, pp.142-159, 2014 https://doi.org/10.1177/1742715011434109
  32. M. Hume, P. M. Johnston, and C. Hume, "Creating the global greenscape: Developing a global market-entry framework for the green and renewable technologies," Advances in Sustainability and Environmental Justice, Vol.11, pp.151-185, 2013. https://doi.org/10.1108/S2051-5030(2013)0000011011
  33. D. Spry and T. Dwyer, "Representations of Australia in South Korean online news: a qualitative and quantitative approach utilizing Leximancer and Korean keywords in context," Quality and Quantity, Vol.51, No.3, pp.1045-1064, 2017. https://doi.org/10.1007/s11135-016-0387-1
  34. A. Tkaczynski, S. R. Rundle-Thiele, and J. Cretchley, "A vacationer-driven approach to understand destination image: A Leximancer study," Journal of Vacation Marketing, Vol.21, No.2, pp.151-162, 2015. https://doi.org/10.1177/1356766714567796
  35. J. Cretchley, D. Rooney, and C. Gallois, "Mapping a 40-year history with leximancer: Themes and concepts in the journal of cross-cultural psychology," Journal of Cross-Cultural Psychology, Vol.41, No.3, pp.318-328, 2010. https://doi.org/10.1177/0022022110366105
  36. A. E. Smith and M. S. Humphreys, "Evaluation of unsupervised semantic mapping of natural language with Leximancer concept mapping," Behavior Research Methods, Vol.38, No.2, pp.262-279, 2006. https://doi.org/10.3758/BF03192778
  37. L. Young, I. Wilkinson, and A. Smith, "A Scientometric Analysis of Publications in the Journal of Business-to-Business Marketing 1993-2014," Journal of Business-to-Business Marketing, Vol.22, No.1-2, pp.111-123, 2015.
  38. R. E. Kass and A. E. Raftery, "Bayes factors," Journal of the American Statistical Association, Vol.90, No.430, pp.773-795, 1995. https://doi.org/10.1080/01621459.1995.10476572
  39. Y, Hwang, S. Yang, J. W. Rhee, and W. T. Lee, "A Study on the Relationship between Opinion-seeking Propensity and Variables of Political Participation," Journal of Cybercommunication Academic Society, Vol.28, No.2, pp.149-185, 2011.