커피전문점 고객의 설문 데이터를 바탕으로, 전통적인 통계 모델(로지스틱 회귀)과 딥러닝(인공신경망) 모델의 고객 만족도 예측 성능을 비교하고, 딥러닝의 우수성을 검증한다.
논문 요약
- 논문 제목: 머신러닝과 딥러닝을 이용한 고객만족 예측모델 개발
- 저자: 박정민 외
- 게재 학술지: 고객만족경영연구
- 발행 연도: 2022
- 핵심 요약: 특정 커피전문점의 고객 만족도에 영향을 미치는 요인(서비스, 가격, 품질 등)을 설문조사 데이터를 통해 분석했다. 고객의 만족 여부를 예측하기 위해 전통적인 통계 모델인 로지스틱 회귀와 TensorFlow 기반의 딥러닝(인공신경망) 모델을 각각 구축하고 성능을 비교했다. 그 결과, 딥러닝 모델이 약 71.8%의 예측 정확도를 보여, 복잡한 고객 만족 요인을 더 효과적으로 학습할 수 있음을 시사했다.
연구 배경
고객 만족은 기업의 생존과 직결되는 핵심 지표이다. 이 연구는 ‘어떤 고객이 만족하고, 어떤 고객이 불만족하는가’를 예측하기 위해, 전통적인 통계의 영역을 넘어 딥러닝이라는 새로운 분석 도구의 가능성을 탐구한다.
**고객 만족도(Customer Satisfaction, CSAT)**는 고객이 기업의 제품이나 서비스에 대해 얼마나 만족하는지를 나타내는 핵심 성과 지표(KPI)이다. 높은 고객 만족도는 브랜드 충성도, 재구매율, 긍정적인 구전 효과로 이어지기 때문에, 모든 기업은 고객 만족도를 높이기 위해 노력한다. 이를 위해서는 먼저 ‘무엇이 고객을 만족시키는가’와 ‘어떤 고객이 현재 불만족 상태인가’를 정확히 파악해야 한다.
과거에는 이러한 고객 만족도 예측 문제를 주로 **로지스틱 회귀(Logistic Regression)**와 같은 전통적인 통계 모델로 분석해왔다. 로지스틱 회귀는 각 요인(예: 커피 맛, 매장 분위기)이 만족도에 얼마나 영향을 미치는지 명확하게 해석할 수 있다는 장점이 있다. 하지만 이 모델은 각 요인들이 만족도에 **선형적(Linear)**으로, 그리고 독립적으로 영향을 미친다고 가정하는 한계가 있다.
하지만 현실에서 고객 만족은 그렇게 단순하지 않다. 예를 들어, ‘커피 맛’의 중요성은 ‘가격’ 수준에 따라 달라질 수 있고, ‘직원의 친절도’는 ‘매장의 혼잡도’와 결합될 때 그 영향력이 변할 수 있다. 이러한 **비선형적(Non-linear)이고 복잡한 상호작용(Interaction)**을 포착하기 위해, 최근에는 딥러닝(Deep Learning) 기술이 주목받고 있다. 본 연구에서는 인간의 뇌 신경망 구조를 모방한 **인공신경망(Artificial Neural Network, ANN)**을 활용하여, 복잡한 고객 만족의 메커니즘을 데이터로부터 직접 학습하고자 한다.
해결하려는 문제
고객 만족도라는 복합적이고 다차원적인 개념을 예측하기 위해, 어떤 분석 모델이 가장 적합한지 비교하고, 딥러닝 기술을 활용하여 예측의 정확도를 높이는 방안을 모색한다.
고객이 한 잔의 커피에 만족감을 느끼기까지, 그 과정에는 수많은 요인들이 복합적으로 작용한다. 커피 원두의 품질, 바리스타의 기술, 매장의 인테리어, 배경 음악, 가격의 합리성, 직원의 미소 등 이 모든 요소들이 서로 얽혀 최종적인 만족도를 결정한다.
이처럼 다차원적인 현상을 분석할 때, 각 요인의 개별적인 영향력만을 보는 전통적인 통계 모델은 현실을 지나치게 단순화할 위험이 있다. 이 연구가 해결하고자 하는 핵심 문제는 바로 이러한 **’복잡성(Complexity)’**이다.
본 연구는 다음과 같은 질문을 던진다.
- 고객 만족도에 영향을 미치는 다양한 요인들을 동시에 고려했을 때, 어떤 분석 모델이 가장 높은 예측 정확도를 보이는가?
- 변수들 간의 비선형적 관계와 복잡한 상호작용을 스스로 학습하는 딥러닝 모델은, 전통적인 통계 모델에 비해 실제로 더 나은 대안이 될 수 있는가?
궁극적으로는 가장 정확한 예측 모델을 찾아내고, 이를 통해 기업이 고객 만족도를 개선하기 위해 어떤 요소에 집중해야 하는지에 대한 데이터 기반의 우선순위를 제시하고자 한다.
연구 모형
커피전문점 고객의 서비스 품질 인식 설문 데이터를 독립변수로, 전반적인 만족/불만족 여부를 종속변수로 설정하고, 로지스틱 회귀 모델과 딥러닝 분류 모델을 각각 구축하여 예측 정확도를 비교한다.
본 연구는 고객 만족도 예측에 있어 두 가지 다른 방법론의 성능을 직접적으로 비교하는 경쟁 모델 평가(Competing Model Evaluation) 프레임워크를 사용했다.
- 데이터 준비:
- 특정 커피전문점 이용 고객을 대상으로 서비스 품질 요인(맛, 가격, 서비스, 환경 등)에 대한 인식을 묻는 설문조사를 실시한다. 이 설문 문항들이 모델의 **독립 변수(X)**가 된다.
- 설문의 마지막에 ‘전반적인 만족도’를 묻고, 이를 ‘만족’ 그룹과 ‘불만족’ 그룹으로 나누어 모델이 맞춰야 할 **종속 변수(Y)**로 설정한다.
- 모델 1 구축 (전통적 접근):
- 준비된 데이터를 사용하여 로지스틱 회귀(Logistic Regression) 모델을 학습시킨다.
- 모델 2 구축 (딥러닝 접근):
- 동일한 데이터를 사용하여 TensorFlow 라이브러리를 기반으로 인공신경망(ANN) 분류 모델을 설계하고 학습시킨다.
- 성능 비교:
- 학습에 사용되지 않은 테스트 데이터셋을 사용하여 두 모델의 **예측 정확도(Accuracy)**를 비교한다. 이를 통해 어떤 모델이 미지의 데이터에 대해 더 일반화된 예측 성능을 보이는지 객관적으로 평가한다.
데이터 설명
국내 특정 커피전문점 브랜드(A사) 이용 고객을 대상으로 실시한 설문조사 데이터를 활용했으며, 서비스 품질 요인에 대한 고객의 인식을 포함하는 오프체인(Off-chain) 데이터이다.
- 출처: 논문에 구체적인 브랜드는 명시되지 않았으나, 국내 특정 커피전문점(A사) 이용 고객 309명을 대상으로 직접 수집한 설문조사 데이터를 사용했다. 이는 고객의 주관적인 인식을 측정한 오프체인(Off-chain) 데이터이다.
- 수집 방법: 연구진이 설계한 설문지를 통해 오프라인 또는 온라인으로 데이터를 수집했을 것으로 추정된다.
- 데이터 변수 설명: 본 연구의 데이터는 고객 만족도를 예측하기 위한 다양한 설문 문항으로 구성되어 있다.
- 종속 변수 (Target Variable):
전반적 만족도
: “전반적으로 이 커피전문점에 만족하십니까?”라는 질문에 대한 응답을 ‘만족’ 또는 ‘불만족’의 이진 변수로 변환.
- 독립 변수 (Input Features): 서비스 품질 측정 모델인 SERVQUAL 등을 참고하여 다음과 같은 요인들을 측정하는 문항들로 구성된다.
- 품질 요인:
커피의 맛
,메뉴의 다양성
,원두의 신선도
. - 가격 요인:
가격의 합리성
,가격 대비 가치
. - 서비스 요인:
직원의 친절도
,서비스의 신속성
,직원의 전문성
. - 환경 요인:
매장의 분위기
,인테리어 디자인
,매장의 청결도
,좌석의 편안함
. - 인구통계학적 정보:
성별
,연령
,직업
등.
- 품질 요인:
- 종속 변수 (Target Variable):
데이터 분석
로지스틱 회귀와 TensorFlow 기반의 인공신경망 모델을 각각 학습시키고 예측 정확도를 비교한 결과, 딥러닝 모델이 약 71.8%의 정확도로 더 나은 예측 성능을 보였다.
본 연구의 데이터 분석은 전통적인 통계 모델과 최신 딥러닝 모델의 성능을 동일한 조건에서 정량적으로 비교하는 것에 초점을 맞췄다.
수집된 설문 데이터를 학습 데이터와 테스트 데이터로 분리한 뒤, 먼저 로지스틱 회귀 모델을 학습시켰다. 그 다음, 동일한 데이터에 TensorFlow 프레임워크를 사용하여 여러 개의 은닉층을 가진 인공신경망(딥러닝) 모델을 구축하고 학습을 진행했다.
두 모델의 성능은 테스트 데이터셋에 대한 **예측 정확도(Accuracy)**를 기준으로 비교되었다. 분석 결과, 로지스틱 회귀 모델보다 **딥러닝 모델이 더 높은 예측 정확도(약 71.8%)**를 기록했다. 이는 딥러닝 모델이 고객 만족도에 영향을 미치는 다양한 요인들 간의 복잡하고 비선형적인 관계를 더 효과적으로 학습했음을 의미한다. 예를 들어, ‘커피 맛’이 만족도에 미치는 영향이 ‘가격’이 합리적이라고 느끼는 고객과 그렇지 않은 고객에게서 다르게 나타나는 복합적인 패턴을 딥러닝 모델이 더 잘 포착했을 가능성을 시사한다.
핵심 결과
딥러닝 모델은 로지스틱 회귀 모델보다 고객 만족도를 더 정확하게 예측했으며, 이는 딥러닝이 서비스 품질, 가격, 환경 등 다양한 요인들 간의 복잡하고 비선형적인 관계를 더 효과적으로 학습했기 때문이다.
본 연구의 핵심 결과는 고객 만족도 예측이라는 복합적인 문제에 있어, 딥러닝 모델이 전통적인 통계 모델보다 더 나은 예측 성능을 보일 수 있음을 실증적으로 확인했다는 점이다.
고객의 만족은 단순히 ‘커피 맛 점수 + 서비스 점수 + 가격 점수’와 같은 단순한 합으로 결정되지 않는다. 각 요인들은 서로 복잡하게 영향을 주고받으며 최종적인 만족도를 형성한다. 딥러닝 모델은 여러 층으로 이루어진 신경망 구조를 통해, 이러한 변수들 간의 복잡한 상호작용 패턴을 데이터로부터 직접 학습할 수 있다.
이 연구의 결과는 딥러닝이 단순히 이미지 인식이나 자연어 처리 같은 특정 분야뿐만 아니라, 고객 만족도 분석과 같은 전통적인 경영학 및 마케팅 연구 분야에서도 매우 강력하고 유용한 분석 도구가 될 수 있음을 증명했다.
시사점
고객 만족도나 구매 의향과 같이 여러 요인이 복합적으로 작용하여 결정되는 대상을 분석할 때, 딥러닝은 숨겨진 패턴을 발견하고 예측 정확도를 높이는 강력한 도구가 될 수 있다.
이 연구는 고객 만족도를 분석하고 예측하려는 기업과 연구자들에게 중요한 시사점을 제공한다.
첫째, 분석 모델의 선택이 결과의 질을 좌우한다. 분석하려는 대상이 복잡하고, 여러 요인들이 비선형적으로 상호작용할 것으로 예상된다면, 전통적인 선형 모델의 한계를 인지하고 딥러닝과 같은 더 유연하고 강력한 모델의 도입을 적극적으로 고려해야 한다.
둘째, 데이터 기반의 선제적 관리가 가능해진다. 고객 만족도를 높은 정확도로 예측할 수 있다는 것은, 불만족 고객이 부정적인 리뷰를 남기거나 서비스를 이탈하기 전에, 그들의 ‘불만족 가능성’을 미리 감지하고 선제적인 조치를 취할 수 있음을 의미한다. 예를 들어, 예측 모델을 통해 ‘불만족’ 확률이 높게 나타난 고객에게 특별 할인 쿠폰을 제공하거나, 서비스 개선에 대한 의견을 묻는 설문을 보내는 등의 선제적 CRM 활동이 가능해진다.
인사이트
고객의 ‘만족’은 단순한 덧셈이 아닌, 복잡한 경험의 ‘함수’다. 그 함수를 딥러닝으로 풀어라.
이 논문은 고객을 이해하는 방식의 근본적인 전환을 요구한다. 고객의 만족도를 개별 요인들의 단순 합으로 보는 선형적 사고에서 벗어나, 모든 경험 요소가 복합적으로 작용하여 만들어내는 하나의 ‘결과 함수’로 바라보아야 한다. 그리고 딥러닝은 인간의 머리로는 계산하기 힘든 그 복잡한 함수를 데이터로부터 근사(approximate)해내는 가장 강력한 도구이다.
- 페르소나 예시: “고수익 추구형 DeFi 농부(Yield Farmer), 이자벨”
- 특징: 이자벨은 자신의 USDC 자산을 여러 DeFi 프로토콜에 분산 예치하여 최고의 수익률을 추구한다. 그녀의 프로토콜에 대한 ‘만족도’는 단순히
APY(수익률)
하나만으로 결정되지 않는다.프로토콜의 보안성(Security)
,UI/UX의 편리성(Usability)
,커뮤니티의 신뢰도(Trust)
,거버넌스 토큰의 가격 안정성(Volatility)
등 여러 요인이 복합적으로 작용한다. APY가 아무리 높아도, 최근 해킹 루머가 도는 프로토콜이라면 그녀는 만족하지 못하고 즉시 자금을 인출할 것이다. - 데이터 기반 행동: 높은 APY를 제공하는 프로토콜 사이를 자주 이동, 프로토콜의 보안 감사 리포트나 트위터 여론에 민감하게 반응하여 자금을 이동하는 패턴.
- 특징: 이자벨은 자신의 USDC 자산을 여러 DeFi 프로토콜에 분산 예치하여 최고의 수익률을 추구한다. 그녀의 프로토콜에 대한 ‘만족도’는 단순히
- 실질적인 마케팅 액션 제안:
- 딥러닝 기반 ‘프로토콜 만족도’ 예측 모델 구축: 이 논문의 모델을 Web3에 적용하여, ‘이자벨’과 같은 DeFi 유저들의 온체인 행동(예치 기간, 자산 이동 빈도, 사용하는 프로토콜의 종류 등)과 오프체인 활동(트위터, 디스코드)을 입력받아, 해당 유저가 현재 이용 중인 프로토콜에 ‘만족’하고 있을 확률을 예측하는 딥러닝 모델을 구축한다.
- 불만족 징후 조기 감지 및 선제적 대응: 모델이 특정 유저의 만족도를 ‘불만족’으로 예측하면(예: APY가 소폭 하락하자마자 자산의 10%를 인출하는 행동 패턴 감지), 해당 유저에게 선제적으로 “최근 완료된 제3자 보안 감사 리포트 공유” 또는 “곧 출시될 V2 버전의 강화된 보험 기능 안내”와 같이, 비가격적(non-financial) 신뢰 요소를 담은 정보를 제공하여 이탈을 방지한다.
- 개인화된 만족도 개선 제안: 딥러닝 모델의 해석(XAI 기법 활용)을 통해, 특정 유저의 만족도에 가장 부정적인 영향을 미치는 요인이 ‘복잡한 UI’로 나타났다면, 해당 유저에게는 “클릭 한 번으로 모든 보상을 수령하고 재예치하는 방법”과 같은 맞춤형 가이드나 기능(예: 원클릭 버튼)을 제공하여 만족도를 직접적으로 개선한다.