경영학 연구 분야에서의 인공지능과 빅데이터 활용 동향
- 인사조직, 마케팅 중심으로 -


임충일  ||  비즈솔루션즈 대표
4차 산업은 인류의 정치, 경제, 문화, 사회 전반에 혁신적인 변화를 일으키고 있으며, 4차 산업의 핵심기술인 인공지능과 빅데이터 기술은 의학, 금융, 제조, 서비스, 공공정보 등 다양한 영역에서 인간의 삶에 지대한 영향을 미치고 있다. 한때 이 두 기술은 전 세계적으로 새로운 유행처럼 떠오르는 키워드였으나 이제는 일상생활에서 당연하게 여겨지고 있기도 하다. 빅데이터라는 풍부한 음식 재료가 쏟아져 나오면서, 머신러닝이라는 조리기법이 다양한 영역에서 활용되고 있기 때문이다. 본 고에서는 인공지능과 빅데이터 기술이 과학과 기술 분야 이외의 분야, 특히 경영학 분야(인사조직과 마케팅)에서 어떻게 적용되고 있으며, 어떠한 역할을 수행하고 있고, 어느 방향으로 진행되고 있는지를 살펴보고자 한다.


*   본 내용은 임충일 대표(☎ 070-4250-9880, ciim0419@gmail.com)에게 문의하시기 바랍니다.

**   본 내용은 필자의 주관적인 의견이며 IITP의 공식적인 입장이 아님을 밝힙니다.


I. 서론

 오늘날 우리는 4차 산업혁명의 물결 속에 있다. 인터넷과 컴퓨터 기반의 디지털화인 3차 산업혁명에 인공지능, 빅데이터, 사물인터넷 등의 기술이 융합되어 인류의 정치, 경제, 문화, 사회 전반에서 혁신적인 변화를 일으키는 차세대 기술혁명인 4차 산업혁명은 초연결, 초지능, 초실감의 핵심 패러다임으로 우리 생활에 지대한 영향을 미치고 있다[1].
 4차 산업혁명 시대를 주도하고 있는 핵심기술 중 하나인 인공지능(Artificial Intelligence: AI)은 인간의 지적 능력(인지능력, 학습능력, 추론능력, 이해능력 등)을 기계로 구현하는 과학기술로, 지능에 대한 정의와 마찬가지로 인공지능에 대해서도 다양한 정의가 존재하며, 사람과 유사한 혹은 사람 수준의 기계장치 개발을 궁극적인 목표로 하고 있다[2]. 또 다른 핵심기술인 빅데이터는 형식과 규모가 다양하고 데이터 축적 속도가 매우 빨라 기존의 데이터베이스로 처리할 수 있는 역량을 넘어서는 초대용량(테라바이트 또는 페타바이트급)의 정형, 비정형 데이터를 모두 포함하며, 데이터의 생성, 수집, 저장, 관리 및 분석하여 가치를 추출하고 지능화 서비스의 기반을 지원하는 기술로, 이전에는 거대한 데이터 집합 자체만을 의미하였으나 점차 그 범위가 확대되어 도구, 플랫폼, 분석 기법 등을 포함하는 포괄적 의미로 확대되었다[3]. 이러한 인공지능과 빅데이터 기술은 컴퓨터, 사물인터넷(IoT), 스마트폰과 같은 디바이스에서 발생하는 데이터의 폭발적 증대와 초연결 지능화를 위해 공통으로 소요되는 대용량, 다양성, 실시간, 지능화 기능을 플랫폼으로 제공하는 SW 기술을 의미한다([그림 1] 참조)[4].
 인공지능과 빅데이터의 응용 분야는 [그림 1]과 같이 공공정보부터 자율주행까지 매우 다양한 분야가 있으며, 본 고에서는 인공지능과 빅데이터 기술이 경영학 분야에 어떻게 적용되고 있는지를 설명하고자 한다. II장에서는 경영학의 인사조직 분야에서 빅데이터 활용 동향에 관한 내용을 다루고, III장에서는 경영학의 마케팅 분야에서 머신러닝 활용 동향에 대해 다룬 후, IV장에서 본 고의 결론을 제시한다.

<자료> 권순선, “인공지능과 빅데이터 기술동향”, TTA저널, 187호, 2020, pp.38-43.

[그림 1] 인공지능, 빅데이터 기술 분야 개념도


 


II. 경영학(인사조직)에서 빅데이터 활용 동향

 먼저, 경영학의 인사조직 분야에서 빅데이터 활용 동향을 살펴보면, 2010년 중반을 기점으로 인공지능과 빅데이터 기법이 주목받기 시작하여 현재까지 첫째, 인공지능 및 빅데이터 기술이 조직과 구성원에게 미치는 영향과 둘째, 인공지능과 빅데이터 기술의 연구 방법론적 접목이라는 두 가지 흐름으로 진행되어 오고 있다[5]. 특히, 두 번째 흐름인 인사조직 연구에서 인공지능과 빅데이터 활용은 2014년에 필요성이 대두된 이후, 인사조직 연구에 직접 활용할 수 있는 데이터 형태가 다양해지고 분석 수준과 일치하는 데이터 역시 증대되면서 기존 연구 방법론보다 발전된 시사점 발견과 새로운 연구 주제 도출 가능성이 커짐에 따라 2019년 이후 인공지능과 빅데이터를 활용한 연구가 급증하고 있다[6]. 본 장에서는 2015년부터 2021년 말까지 인사조직 분야에서 빅데이터 활용 동향을 [표 1]과 같이 3가지 데이터 유형에 따라 나누어 소개한다([표 1]은 일반적으로 학문 연구를 위한 데이터의 종류를 나타내고 있다[7].).

[표 1] 학문 연구에 사용되는 데이터 유형

데이터 유형 주요 내용
설계 데이터
(Designed Data)
  • 특정 학문 연구를 위해 설계된 데이터
  • 연구 가설 실증을 위해 연구 대상에 대한 데이터를 직접 수집
이차 문헌 데이터
(Archival Data)
  • 연구 이외 여러 목적으로 형성된 데이터
  • 주로 정부기관, 데이터 수집 전문기관, 기업에 의해 축적된 자료
자생적 데이터
(Organic Data)
  • 연구자의 특별한 노력 없이 자생적으로 생성된 데이터
  • 온라인 상에서 다수의 사용자에 의해서 형성되거나(예; 트위터, 페이스북 등의 텍스트), 스마트폰ㆍ웨어러블 기기ㆍ감지 센서 등에서 자동으로 생성 및 축적된 데이터

<자료> Xu, H., Zhang, N. & Zhou, L., “Validity concerns in research using organic data,” Journal of Management, 46(7), 2020, pp.1257-1274. 재구성


1. 설계 데이터 기반 연구

 일반적으로 인사조직 연구에서는 연구 주제 및 연구 모형 그리고 설정된 가설에 대한 실증연구를 위해 [표 1]의 데이터 유형 중 특정 데이터(설계 데이터, designed data)를 설계하여 직접 수집한 후 통계 분석을 수행하고 그 결과에 대해 해석하고 있으나, 인공지능과 빅데이터 기법을 적용한 인사조직 분야의 실증 연구에서는 설계 데이터보다 이차 문헌 데이터(archival data)와 자생적 데이터(organic data)가 상대적으로 더 많이 활용되는 경향이 있다. 하지만, 여전히 설계 데이터를 활용한 연구도 지속해서 수행되고 있으며, 이와 관련된 대표적 연구 사례는 [표 2]와 같다.

[표 2] 대표적 연구 사례(설계 데이터 활용)

연구 분야 주요 내용 데이터 및 학습 유형 적용 기법
예측분석 성격검사 결과를 기반으로 직무 성과 예측에 관한 연구
  • 1,043명의 성격검사 결과
  • 지도학습
  • 머신러닝
  • Elastic Net Regression
측정검증 인공지능 인터뷰를 통한 성격 측정 방식의 신뢰도, 타당도, 일반화 가능성을 타진하기 위한 연구
  • 1,073건의 비디오 인터뷰 영상
  • 지도/비지도 학습
  • Elastic Net Regression
  • openSMILE
  • OpenFace

<자료> Speer, A. B., Christiansen, N. D., Robie, C., & Jacobs, R. R., “Measurement specificity with modern methods: Using dimensions, facets, and items from personality assessments to predict performance,” Journal of Applied Psychology, 107(8), 2022, p.1428.Hickman, L., Bosch, N., Ng, V., Saef, R., Tay, L. & Woo, S. E., “Automated video interview personality assessments: Reliability, validity, and generalizability investigations,” Journal of Applied Psychology, 107(8), 2022, p.1323. 재구성


 [표 2]의 인사조직 분야에서의 예측 분석은 데이터로 가설을 설정한 후 특정 맥락에서 도출된 분석 결과를 해석하는 절차로 진행되는데, 이것은 기존 이론을 기반으로 미리 가설을 설정한 후 수집된 자료를 통해 가설을 통계적으로 검증하는 절차로 진행되는 가설검정과 차이가 있다는 점에 유의해야 한다[10].

2. 이차 문헌 데이터 기반 연구

 이차 문헌 데이터는 정부기관, 데이터 수집 전문기관, 기업 등이 특정 목적과 문제 해결을 위해 이미 수행한 연구의 결과 데이터로, 인공지능과 빅데이터를 활용한 인사조직 분야에서 많이 활용되고 있다. 이차 문헌 데이터를 획득하는 방법은 크게 3가지로 나뉘는데, 첫째, 공공 데이터베이스에서 연구에 필요한 데이터를 검색하는 방법이 있고, 둘째, 기관 또는 조직에서 제공하는 API(Application Programming Interface)를 사용하는 방법이 있으며, 마지막으로는 기업과 같이 특정 조직 내에 축적된 비공개 빅데이터를 사용하는 방법이 있다. 인사조직 연구 분야에서 많은 연구가 이루어지고 있는 분야는 채용과 관련된 분야로, 산업계에서 먼저 people analytics가 확산되면서 인사조직 학계(조직행동학 및 산업조직심리학)에서도 관심이 증대되었고[10], 이에 따라 인공지능 및 빅데이터 기법을 활용한 연구가 활성화되었다. [표 3]은 이와 관련된 대표적 연구 사례이다.

[표 3] 대표적 연구 사례(이차 문헌 데이터 활용)

연구 분야 주요 내용 데이터 및 학습 유형 적용 기법
채용 채용에서 지원자의 에세이를 점수화하기 위한 연구
  • 일자리 지원자 41,429명의 지원 서류
  • 지도학습
텍스트 분석
SPSS-IBM Modeler
채용 채용에서 지원자의 경력을 활용하여 직무 성과와 이직을 예측한 연구
  • 7년 간 지원 서류(16,071건)
  • 지도학습
텍스트 분석
Naïve Bayes Classifier
CEO 성격 CEO의 외향적인 성격이 인수 합병 의사결정에 미치는 영향 연구
  • 11년 동안 분기 실적 발표 CEO 1,710명 데이터
  • 지도학습
텍스트 분석
SVM(Support Vector Machine) Model

<자료> Campion, M. C., Campion, M. A., Campion, E. D. & Reider, M. H., “Initial investigation into computer scoring of candidate essays for personnel selection,” Journal of Applied Psychology, 101(7), 2016, pp.958-975.Sajjadiani, S., Sojourner, A. J., Kammeyer-Mueller, J. D. & Mykerezi, E., “Using machine learning to translate applicant work history into predictors of performance and turnover,” Journal of Applied Psychology, 104(10), 2019, p.1207.Malhotra, S., Reus, T. H., Zhu, P., & Roelofsen, E. M., “The acquisitive nature of extraverted CEOs,” Administrative Science Quarterly, 63(2), 2018, pp.370-408. 재구성


3. 자생적 데이터 기반 연구

 자생적 데이터는 연구자가 데이터 수집을 위해 특별한 노력을 기울이지 않아도 되는 특징을 가지고 있으며, 온라인 상에서 대중 또는 개개인들의 자발적인 참여로 생성되거나(트위터, 페이스북 등의 텍스트, 소셜 미디어 데이터 등), 온라인 상에서 개인들의 행동 이력 등으로 축적되는 데이터를 말하며, 블루투스 기반 웨어러블 기기나 센서 등에서 자동 생성되는 데이터도 포함된다. 이러한 자생적 데이터를 획득하는 방법은 크게 2가지로 첫째, 소셜 미디어가 제공하는 API를 사용하는 방법, 둘째, 인터넷 브라우저 화면에 나타나는 문자와 숫자를 수집하는 웹 크롤링(web crawling) 방법이 있다.
 자생적 데이터는 대중 개개인의 다양한 생각과 의견, 희로애락과 같은 감정에 관한 연구에 유용할 뿐만 아니라, 연구자가 주목하는 현상을 실시간으로 확인할 수 있는 장점이 있으며, 연구의 분석 수준(unit of analysis)과 일치하는 연구가 가능하다는 점이 특징이고[6], 이와 관련된 대표적 연구 사례는 [표 4]와 같다.
 자생적 데이터는 대표적인 비정형 데이터로, 이와 관련하여 인사조직 분야에서는 질적 방법론인 내용 분석(content analysis)을 사용해 왔는데, 이는 연구자가 텍스트를 직접 읽으면서 분석한 후, 작성된 코딩 규칙을 기반으로 시사점을 도출하고 여기에 전문가적인 해석을 추가하는 과정으로 코딩 과정에서 신뢰도와 타당도를 확보하는 것이 문제로 대두되었다.

[표 4] 대표적 연구 사례(자생적 데이터 활용)

연구 분야 주요 내용 데이터 및 학습 유형 적용 기법
근무 형태 코로나19에 따른 재택근무에 대한 대중들의 감정적 반응에 관한 연구(sentiment analysis)를 수행
  • 70만 명의 백만 건 이상의 트윗
  • 비지도학습
  • 텍스트 분석
  • Deep Learning/BERT
근무 형태 코로나19에 따른 재택근무에 대한 대중들의 감성에 관한 연구
  • 67만 명의 백만 건 이상의 트윗
  • 비지도학습
  • 텍스트 분석
  • Topic Modeling
  • Sentiment Analysis
채용 다국적 기업들의 다양한 나라에서 모집/선발 활동에 따른 나라별 차별적인 신호에 관한 연구
  • Fortune 1,000대 기업
  • 비지도학습
  • 텍스트 분석
  • Topic Modeling

<자료> Min, H., Peng, Y., Shoss, M. & Yang, B., “Using machine learning to investigate the public’s emotional responses to work from home during the COVID-19 pandemic,” Journal of Applied Psychology, 106(2), 2021, p.214.Zhang, C., Yu, M. C. & Marin, S., “Exploring public sentiment on enforced remote work during COVID-19,” Journal of Applied Psychology, 106(6), 2021, p.797.Banks, G. C., Woznyj, H. M., Wesslen, R. S., Frear, K. A., Berka, G., Heggestad, E. D. & Gordon, H. L., “Strategic recruitment across borders: An investigation of multinational enterprises,” Journal of Management, 45(2), 2019, pp.476-509. 재구성


 여기에 대한 대안으로 대량의 텍스트 처리가 가능한 알고리즘이 개발되었는데 그 중의 하나가 토픽 모델링이다. 토픽 모델링은 비정형 데이터를 체계적으로 분석하는 방법으로, 여기서 토픽이란 동일한 맥락이나 문맥에서 드러날 개연성이 있는 단어의 집합을 의미하며, 모델링이란 텍스트로 구성된 문서에 포함된 단어 간의 통계적인 개연성을 추정 후 잠재적 의미구조를 도출한다는 의미이다[17].


 


III. 경영학(마케팅)에서 머신러닝 활용 동향

 다음으로 경영학의 마케팅 학계에서는 1950년부터 연구 분석에서 계량적인 접근을 시도하기 시작하였으며, 이에 따라 계량 경제학적 분석 방법 및 통계적 방법이 널리 통용되어오고 있는데, 최근 4차 산업혁명과 ICT 기술의 발달과 타 학문 분야에서의 방법론 발전에 따라 2015년 이후 머신러닝을 이용한 마케팅 연구가 급증하고 있다([그림 2] 참조)[18]. 본 장에서는 경영학의 마케팅 분야에서 머신러닝 기법 활용 동향과 관련된 연구 유형과 기술을 소개한다.

<자료> Mustak, Mekhail, Joni Salminen, LoicPle and JochenWirtzd, “Artificial Intelligence in Marketing: Topic Modeling, Scientometric Analysis, and Research Agenda,” Journal of Business Research, 124, 2021, pp.389- 404.

[그림 2] 연도별 경영/경제 학술지에 발표된 인공지능 관련 마케팅 연구 논문 수 추이

1. 머신러닝을 통한 변수 추출 및 타 변수와의 관계 연구(유형 1)

 이 유형은 머신러닝을 이용하여 데이터로부터 변수를 추출한 후, 일반적 통계 기법을 사용하여 추출된 변수와 다른 마케팅 변수와의 관계를 연구하는 것으로, 수기로 레이블링하여 정보를 추출하기 어려운 대규모 데이터에 적합하다. 여기에는 사용자 생성 콘텐츠의 비중이 가장 크며, 텍스트를 활용한 연구가 많다. 특히, 마케팅 연구에서 데이터로 사용되는 사용자 생성 콘텐츠로는 소셜 네트워크 서비스, 소셜 미디어, 블로그, 온라인 제품 리뷰, 온라인 구전(electronic word of mouth) 등이 포함되며, 이 유형의 대표적인 연구 사례는 [표 5]와 같다.

[표 5] 대표적 연구 사례(유형 1)

추출 변수 마케팅 변수 주요 내용 사용 기법
온라인 리뷰 주식시장 성과 사용자 생성 콘텐츠가 주식시장 성과에 미치는 영향 나이브 베이지안(Naive Bayesian),
서포트 벡터 머신(SVM)
온라인 리뷰 소비 의사결정 소비자가 리뷰 읽기-검색-구매의 연쇄적인 의사결정 과정에 대한 리뷰 콘텐츠의 영향 부분 딥러닝
(Partial-deep Learning)
평판 수익 온라인 여행 플랫폼 내 평판이 독립형과 체인형의 호텔 분류에 따른 수익에 영향 토픽 모델링(LDA)
속성 소비자 선택 사용자 생성 콘텐츠 내 호텔에 대한 설명 속성이 호텔 서비스 선택에 대한 영향 텍스트 마이닝, 이미지 분류,
소셜 위치 태깅

<자료> Tirunillai, Seshadri, and Gerard J. Tellis, “Does Chatter Really Matter? Dynamics of User-generated Content and Stock Performance,” Marketing Science, 31(2), 2012, pp.198-215.
Liu, J., & Toubia, O., “A semantic approach for estimating consumer content preferences from online search queries,” Marketing Science, 37(6), 2018, pp.930-952.
Hollenbeck, B., “Online reputation mechanisms and the decreasing value of chain affiliation. Journal of Marketing Research,” 55(5), 2018, pp.636-654.
Ghose, A., Ipeirotis, P. G., & Li, B., “Designing ranking systems for hotels on travel search engines by mining user-generated and crowdsourced content,” Marketing Science, 31(3), 2012, pp.493-520. 재구성


2. 머신러닝 기반 신규 데이터 활용 연구(유형 2)

 유형 2는 유형 1과 같이 데이터에서 변수 추출이 목적이지만, 머신러닝이 활성화되기 전에 변수를 추출하기 어려운 형태의 데이터인 비정형 데이터를 다루는 연구로, 그 중에서 이미지가 가장 활발하게 연구된 분야이다. [표 6]은 이 유형의 대표적인 연구 사례이다.

[표 6] 대표적 연구 사례(유형 2)

추출 변수 마케팅 변수 주요 내용 사용 기법
판매자 외형 매출 전자상거래에서 판매자 외형의 매력도가 매출에 미치는 영향 SVM 회귀, 랜덤 포레스트 회귀,
CNN(Convolutional Neural Network)
사람/악기 프로젝트 성공 동영상에 사람 및 악기의 등장 여부가 크라우드 펀딩 프로젝트 성공에 미치는 영향 CNN(Convolutional Neural Network)

<자료> Peng, L., Cui, G., Chung, Y. & Zheng, W., “The faces of success: Beauty and ugliness premiums in e-commerce platforms,” Journal of Marketing, 84(4), 2020, pp.67-85.
Li, X., Shi, M., & Wang, X. S., “Video mining: Measuring visual information using automatic methods,” International Journal of Research in Marketing, 36(2), 2019, pp.216-231. 재구성


3. 머신러닝 기반 신규 방법론 적용 및 기존 방법론 개선 연구(유형 3)

 이번 유형은 방법론의 측면에서 특정 문제를 해결하기 위해 이전에 사용했던 방법 대신에 머신러닝 기법을 새롭게 사용하거나 이전 방법들의 개선을 제안하는 연구로, 각 연구에서 제안한 방법론의 유용성과 우월성을 검증해 오고 있다. 이 유형의 대표적인 연구 사례는 [표 7]과 같다.

[표 7] 대표적 연구 사례(유형 3)

주요 내용 사용 기법
마케팅 인사이트를 얻기 위해 사용자 생성 콘텐츠를 분석할 때, 유용한 정보가 들어 있지 않거나 중복적인 내용이 들어 있는 경우 효과적인 분석이 어려우므로, CNN을 이용하여 유의미한 문장을 식별하는 방법 제안 CNN(Convolutional Neural Network)
소비자의 온라인 서핑 데이터를 바탕으로 사용자 프로필을 분류하고, 정보가 제한적일 때에도 고객 프로필을 예측할 수 있는 접근법 제안 상관관계 토픽 모델
(Correlated topic model; CTM)
복잡한 속성을 가지고 있는 제품에 대한 소비자 선호를 이해하기 위해서 새로운 알고리즘 제안 퍼지 SVM 능동적 학습
(Fuzzy SVM active learning)
소비자의 선호가 검색 활동에 어떻게 반영되는지, 그리고 검색 결과 콘텐츠 선호도와의 관계는 어떠한지 파악하고자 새로운 모형 제안 계층적 이중 LDA(HDLDA)
(Hierarchically Dual LDA)

<자료> Timoshenko, A. & Hauser, J. R., “Identifying customer needs from user-generated content,” Marketing Science, 38(1), 2019, pp.1-20.Trusov, M., Ma, L. & Jamal, Z., “Crumbs of the cookie: User profiling in customer-base analysis and behavioral targeting,” Marketing Science, 35(3), 2016, pp.405-426.
Huang, D. & Luo, L., “Consumer preference elicitation of complex products using fuzzy support vector machine active learning,” Marketing Science, 35(3), 2016, pp.445-464.
Liu, J., & Toubia, O., “A semantic approach for estimating consumer content preferences from online search queries,” Marketing Science, 37(6), 2018, pp.930-952. 재구성


4. 머신러닝을 통한 마케팅 현상의 패턴 설명 연구(유형 4)

 네 번째 유형은 일반적인 마케팅 연구에서 변수들 사이의 상관관계 또는 인과관계 규명 목적이 아닌 마케팅 현상 자체를 기술하고 설명하는 연구로, 기술적 연구(descriptive research)라고 할 수 있다. [표 8]은 이 유형의 대표적인 연구 사례이다.

[표 8] 대표적 연구 사례(유형 4)

주요 내용 사용 기법
온라인 리뷰를 긍정적인 진짜 리뷰, 긍정적인 가짜 리뷰, 부정적인 진짜 리뷰, 부정적인 가짜 리뷰 등 네 가지로 분류 텍스트 마이닝
수백 개의 제품으로 구성된 대규모 시장에서 경쟁 구조를 효과적으로 시각화(전체 시장을 하위 시장으로 분해하고 상대적 위치를 결정한 후 지역 하위 시장 구조를 전체 시장으로 다시 통합) DRMASM
(Decomposition and Reassembly of MArkets by Segmentation)

<자료> Timoshenko, A. & Hauser, J. R., “Identifying customer needs from user-generated content,” Marketing Science, 38(1), 2019, pp.1-20.Trusov, M., Ma, L. & Jamal, Z., “Crumbs of the cookie: User profiling in customer-base analysis and behavioral targeting,” Marketing Science, 35(3), 2016, pp.405-426.
Huang, D. & Luo, L., “Consumer preference elicitation of complex products using fuzzy support vector machine active learning,” Marketing Science, 35(3), 2016, pp.445-464.
Liu, J., & Toubia, O., “A semantic approach for estimating consumer content preferences from online search queries,” Marketing Science, 37(6), 2018, pp.930-952. 재구성


5. 머신러닝 기반 마케팅 현상 예측 및 예측력 향상 연구(유형 5)

 유형 5 연구는 변수 간의 통계적 인과관계를 규명하는 유형 1과 달리, 예측력 향상에 초점을 맞춘 것으로, 머신러닝을 활용하여 특정한 현상에 대한 예측과 분류를 수행하고 예측의 정확도에 영향을 미치는 요인에 관한 연구로, 대부분 정답을 알고 있는 데이터(학습 데이터)를 기반으로 한 지도학습 형태의 연구가 여기에 속한다. 이 유형의 대표적인 연구 사례는 [표 9]와 같다.

[표 9] 대표적 연구 사례(유형 5)

주요 내용 사용 기법
온라인의 유료 검색 광고의 효과 측정
  • 1단계: 고객의 인식과 클릭 성과 측정
  • 2단계: 새로운 광고 효과, 온라인 광고 효과에 영향 요인 분석
(1단계) Elo 알고리즘
(2단계) 텍스트 분석(LDA),벌점회귀(Penalized Regression)
대출 시 차용인이 작성한 텍스트를 분석하여 채무 불이행 예측 나이브 베이즈, LDA
광고와 R&D가 기업의 파산 생존률에 미치는 영향 랜덤 포레스트 기법

<자료> Rutz, O. J., Sonnier, G. P., & Trusov, M., “A new method to aid copy testing of paid search text advertisements,” Journal of Marketing Research, 54(6), 2017, pp.885-900.
Netzer, O., Lemaire, A., & Herzenstein, M., “When words sweat: Identifying signals for loan default in the text of loan applications,” Journal of Marketing Research, 56(6), 2019, pp.960-980.
Jindal, N., “The impact of advertising and R&D on bankruptcy survival: A double-edged sword,” Journal of Marketing, 84(5), 2020, pp.22-40. 재구성


6. 마케팅 문제에 대한 해결책 제시 및 인과관계 규명 연구(유형 6)

 마지막 유형은 타겟팅(targeting) 등의 마케팅 활동을 최적화하는 방안으로 머신러닝 기법을 활용하는 연구로, 머신러닝 기반 방안의 실제 효과성을 검증하기 위해 추가로 실험을 병행하기도 한다. 즉, 머신러닝을 통한 최적화된 활동을 아무 처치도 하지 않은 대조군과 비교하는 것으로 [표 10]은 대표적인 연구 사례이다.

[표 10] 대표적 연구 사례(유형 6)

주요 내용 사용 기법
전자상거래 장바구니 타겟팅(e-Commerce Cart Targeting; ECT)의 효과 검증(고객별 가장 효과적인 터켓팅 방법을 찾기 위해 랜덤 포레스트 기법 활용) 랜덤 포레스트
수익 기반의 손실함수를 설정하여 한 고객 당 고객 유지 활동의 금전적 가치를 예측
(최적화를 위해서 SGB 알고리즘 사용)
확률적 경사 부스팅
(Stochastic Gradient Boosting)

<자료> Luo, X., Lu, X., & Li, J., “When and how to leverage e-commerce cart targeting: the relative and moderated effects of scarcity and price incentives with a two-stage field experiment and causal forest optimization,” Information Systems Research, 30(4), 2019, pp.1203-1227.
Lemmens, A. & Gupta, S., “Managing churn to maximize profits, Marketing Science,” 39(5), 2020, pp.956-973. 재구성



 


Ⅳ. 결론

 4차 산업은 인류의 정치, 경제, 문화, 사회 전반에 혁신적인 변화를 일으키고 있으며, 4차 산업의 핵심기술인 인공지능과 빅데이터 기술은 우리가 인지하고 있든 아니면 인지하고 있지 않든 인간의 삶에 지대한 영향을 미치고 있다.
 본 고에서는 이러한 인공지능과 빅데이터 기술이 현재 경영학 연구 분야 특히 인사조직과 마케팅 분야에서 어떻게 적용되고 있으며, 어떠한 역할을 수행하고 있고, 어느 방향으로 진행되고 있는지를 살펴보았다. 위 두 기술은 과학과 기술 측면 그리고 학계보다는 산업계 측면에서 먼저 등장하고 급진적으로 발전해 오고 있고, 경영학의 인사조직 및 마케팅 분야 학계에서도 2015년을 기점으로 학문 연구에 이 두 기술을 활발히 적용함으로써 학문 연구에 새로운 시도의 적용이 급증하고 있다. 새로운 기술들을 활용하여 연구를 수행함으로써 지식의 폭과 깊이가 확대되는 긍정적인 효과가 예상되는 한편, 연구 수행 시 유념해야 할 사항에 유의해야 할 것이다. 먼저, 인공지능과 빅데이터가 기존에 발견되지 않은 새로운 패턴을 발견할 수 있으나, 그 원인에 대한 설명력은 부족하므로, 올바른 질문에서 시작하여 이론과의 적절한 접목이 병행되어야 한다. 두 번째로 인공지능과 빅데이터가 완벽할 것이라는 믿음에 주의해야 한다. 이미 사회적으로 이슈가 되었던 것으로 잘못되거나 편견이 있는 데이터로 학습된 AI의 차별적, 비윤리적 판단 사례들이 대두되었기 때문이다. 또한, 다양한 원천에서 생성되는 빅데이터는 개인정보 및 지식 보호에 취약점이 있으므로 빅데이터 확보와 관련하여 윤리적인 이슈에도 주의가 필요하다. 앞으로 인공지능과 빅데이터 기술이 더욱 발전됨에 따라 경영학을 비롯한 다양한 학문 연구에 이를 적용한 새로운 연구 시도가 예상되며, 이때 위에서 언급된 점들에 주의하면서 유의미한 결과를 도출할 수 있도록 노력해야 할 것이다.


 



[ 참고문헌 ]

[1] 4차 산업혁명위원회, “4차 산업혁명위원회 주요성과 및 추진방향”, 2018.
[2] 중소기업기술정보진흥원, “중소기업 전략기술로드맵 2021-2023 인공지능”, TIPA, 2021.
[3] 중소기업기술정보진흥원, “소기업 전략기술로드맵 2021-2023 빅데이터”, TIPA, 2021.
[4] 권순선, “인공지능과 빅데이터 기술동향”, TTA저널, 187호, 2020, pp.38-43.
[5] Gregory, R. W., Henfridsson, O., Kaganer, E. & Kyriakou, H., “The role of artificial intelligence and data network effects for creating user value,” Academy of Management Review, 46(3), 2021, pp.534-551.
[6] 김성준, 이중학, “조직 및 인사 연구에서 빅데이터 분석 방법론 활용”, 조직과 인사관리연구, 26(2), 2022, pp.85-122.
[7] Xu, H., Zhang, N. & Zhou, L., “Validity concerns in research using organic data,” Journal of Management, 46(7), 2020, pp.1257-1274.
[8] Speer, A. B., Christiansen, N. D., Robie, C. & Jacobs, R. R., “Measurement specificity with modern methods: Using dimensions, facets and items from personality assessments to predict performance,” Journal of Applied Psychology, 107(8), 2022, p.1428.
[9] Hickman, L., Bosch, N., Ng, V., Saef, R., Tay, L. & Woo, S. E., “Automated video interview personality assessments: Reliability, validity and generalizability investigations,” Journal of Applied Psychology, 107(8), 2022, p.1323.
[10] 김성준, “피플 어낼러틱스(People Analytics), 학계와 실무의 만남,” HRD Issue Paper, 18(4), 2020, pp.1-14.
[11] Campion, M. C., Campion, M. A., Campion, E. D. & Reider, M. H., “Initial investigation into computer scoring of candidate essays for personnel selection,” Journal of Applied Psychology, 101(7), 2016, pp.958-975.
[12] Sajjadiani, S., Sojourner, A. J., Kammeyer-Mueller, J. D. & Mykerezi, E., “Using machine learning to translate applicant work history into predictors of performance and turnover,” Journal of Applied Psychology, 104(10), 2019, p.1207.
[13] Malhotra, S., Reus, T. H., Zhu, P. & Roelofsen, E. M., “The acquisitive nature of extraverted CEOs,” Administrative Science Quarterly, 63(2), 2018, pp.370-408.
[14] Min, H., Peng, Y., Shoss, M. & Yang, B., “Using machine learning to investigate the public’s emotional responses to work from home during the COVID-19 pandemic,” Journal of Applied Psychology, 106(2), 2021, p.214.
[15] Zhang, C., Yu, M. C. & Marin, S., “Exploring public sentiment on enforced remote work during COVID-19,” Journal of Applied Psychology, 106(6), 2021, p.797.
[16] Banks, G. C., Woznyj, H. M., Wesslen, R. S., Frear, K. A., Berka, G., Heggestad, E. D. & Gordon, H. L., “Strategic recruitment across borders: An investigation of multinational enterprises,” Journal of Management, 45(2), 2019, pp.476-509.
[17] Blei, D. M., Ng, A. Y. & Jordan, M. I., “Latent dirichlet allocation,” the Journal of machine Learning research, 3(Jan), 2003, pp.993-1022.
[18] Mustak, Mekhail, Joni Salminen, LoicPle and JochenWirtzd, “Artificial Intelligence in Marketing: Topic Modeling, Scientometric Analysis, and Research Agenda,” Journal of Business Research, 124, 2021, pp.389-404.
[19] Tirunillai, Seshadri and Gerard J. Tellis, “Does Chatter Really Matter? Dynamics of Usergenerated Content and Stock Performance,” Marketing Science, 31(2), 2012, pp.198-215.
[20] Liu, J., & Toubia, O., “A semantic approach for estimating consumer content preferences from online search queries,” Marketing Science, 37(6), 2018, pp.930-952.
[21] Hollenbeck, B., “Online reputation mechanisms and the decreasing value of chain affiliation. Journal of Marketing Research,” 55(5), 2018, pp.636-654.
[22] Ghose, A., Ipeirotis, P. G. & Li, B., “Designing ranking systems for hotels on travel search engines by mining user-generated and crowdsourced content,” Marketing Science, 31(3), 2012, pp.493-520.
[23] Peng, L., Cui, G., Chung, Y. & Zheng, W., “The faces of success: Beauty and ugliness premiums in e-commerce platforms,” Journal of Marketing, 84(4), 2020, pp.67-85.
[24] Li, X., Shi, M., & Wang, X. S., “Video mining: Measuring visual information using automatic methods,” International Journal of Research in Marketing, 36(2), 2019, pp.216-231.
[25] Timoshenko, A. & Hauser, J. R., “Identifying customer needs from user-generated content,” Marketing Science, 38(1), 2019, pp.1-20.
[26] Trusov, M., Ma, L. & Jamal, Z., “Crumbs of the cookie: User profiling in customer-base analysis and behavioral targeting,” Marketing Science, 35(3), 2016, pp.405-426.
[27] Huang, D. & Luo, L., “Consumer preference elicitation of complex products using fuzzy support vector machine active learning,” Marketing Science, 35(3), 2016, pp.445-464.
[28] Liu, J., & Toubia, O., “A semantic approach for estimating consumer content preferences from online search queries.” Marketing Science, 37(6), 2018, pp.930-952.
[29] Moon, S., Kim, M. Y. & Iacobucci, D., “Content analysis of fake consumer reviews by survey-based text categorization,” International Journal of Research in Marketing, 38(2), 2021, pp.343-364.
[30] Ringel, D. M. & Skiera, B., “Visualizing asymmetric competition among more than 1,000 products using big search data,” Marketing Science, 35(3), 2016, pp.511-534.
[31] Rutz, O. J., Sonnier, G. P. & Trusov, M., “A new method to aid copy testing of paid search text advertisements,” Journal of Marketing Research, 54(6), 2017, pp.885-900.
[32] Netzer, O., Lemaire, A. & Herzenstein, M., “When words sweat: Identifying signals for loan default in the text of loan applications,” Journal of Marketing Research, 56(6), 2019, pp.960-980.
[33] Jindal, N., “The impact of advertising and R&D on bankruptcy survival: A double-edged sword,” Journal of Marketing, 84(5), 2020, pp.22-40.
[34] Luo, X., Lu, X., & Li, J., “When and how to leverage e-commerce cart targeting: the relative and moderated effects of scarcity and price incentives with a two-stage field experiment and causal forest optimization,” Information Systems Research, 30(4), 2019, pp.1203-1227.
[35] Lemmens, A., & Gupta, S., “Managing churn to maximize profits, Marketing Science,” 39(5), 2020, pp.956-973.

* 본 자료는 공공누리 제2유형 이용조건에 따라 정보통신기획평가원의 자료를 활용하여 제작되었습니다.