고객의 행동 데이터를 입력받아 ‘알뜰형’, ‘트렌드 추구형’ 등 미리 정의된 고객 성향을 자동으로 분류하는 딥러닝 모델을 개발하고, 이를 통한 자동화된 고객 프로파일링의 가능성을 제시한다.
논문 요약
- 논문 제목: 딥러닝 기반의 고객 성향 인식
- 저자: 권혁미
- 게재 학술지: 국민대학교 일반대학원 (석사학위논문)
- 발행 연도: 2018
- 핵심 요약: 다양한 고객 행동 및 프로필 데이터를 입력받아, 사전에 정의된 ‘알뜰형’, ‘유행추구형’ 등과 같은 고객 성향을 자동으로 분류하는 딥러닝 모델을 개발했다. 이를 통해 마케터의 직관이나 수동적인 규칙 기반이 아닌, 데이터 기반의 자동화된 고객 프로파일링 시스템 구축 가능성을 탐색하고, 개인화 마케팅의 기반을 마련하고자 했다.
연구 배경
모든 고객은 다르다. 어떤 고객은 가격에 민감하고, 어떤 고객은 최신 유행에 민감하다. 이 연구는 고객의 복잡한 행동 데이터 속에 숨겨진 그들의 진짜 ‘성향’을 딥러닝 기술을 통해 어떻게 파악할 수 있는지 탐구한다.
성공적인 마케팅의 핵심은 고객을 깊이 이해하는 것에서 출발한다. 고객의 **성향(Propensity)**이나 **페르소나(Persona)**를 파악할 수 있다면, 기업은 각 고객 그룹에게 꼭 맞는 상품과 메시지를 전달하는 ‘초개인화(Hyper-personalization)’ 마케팅을 실행할 수 있다. 예를 들어, ‘알뜰형’ 고객에게는 할인 쿠폰을, ‘유행추구형’ 고객에게는 신상품 출시 소식을 먼저 알리는 식이다.
전통적으로 이러한 고객 성향 분석은 마케터의 직관이나 경험, 혹은 “최근 6개월간 할인 상품 구매율이 50% 이상인 고객은 ‘알뜰형’이다”와 같은 단순한 규칙 기반(Rule-based) 시스템에 의존해왔다. 하지만 이러한 방식은 몇 가지 한계를 가진다.
- 주관성: 마케터의 편견이 개입될 수 있다.
- 단순성: 고객의 복잡한 행동 패턴을 몇 가지 규칙만으로 정의하기 어렵다.
- 비확장성: 새로운 성향을 발견하거나 규칙을 수정하기 위해 매번 수동적인 작업이 필요하다.
이러한 한계를 극복하기 위한 기술로 **딥러닝(Deep Learning)**이 주목받고 있다. 딥러닝은 인간의 뇌 신경망을 모방한 **인공신경망(Artificial Neural Network, ANN)**을 깊게 쌓아 올린 모델이다. 딥러닝의 가장 큰 장점은 수많은 데이터 속에서 스스로 복잡하고 **비선형적인 패턴(Non-linear Pattern)**을 학습하는 능력이다. 즉, 사람이 미처 발견하지 못하는 미묘한 행동의 조합으로부터 특정 성향을 예측하는 규칙을 자동으로 찾아낼 수 있다.
본 연구는 이러한 딥러닝의 능력을 활용하여, 복잡한 고객 행동 데이터로부터 고객의 성향을 자동으로 인식하고 분류하는 지능형 모델을 개발하고자 한다.
해결하려는 문제
마케터의 직관이나 단순한 규칙에 의존하던 기존의 고객 성향 분석을 넘어, 복잡한 고객 행동 데이터로부터 잠재된 성향을 자동으로 인식하고 분류하는 데이터 기반의 지능형 시스템을 구축한다.
고객의 성향을 파악하는 것은 매우 어려운 일이다. 한 명의 고객 안에도 ‘알뜰함’과 ‘유행추구’라는 상반된 성향이 공존할 수 있으며, 상황에 따라 다른 성향이 발현되기도 한다. 수동으로 규칙을 만드는 방식으로는 이러한 복잡성을 감당할 수 없다.
이 연구가 해결하고자 하는 핵심 문제는 **’고객 성향 분석의 자동화와 지능화’**이다. 즉, 마케터가 “이런 행동을 하는 고객은 아마 알뜰형일거야”라고 추측하는 대신, 모델이 수많은 고객들의 실제 행동 데이터와 이미 알려진 성향 정보를 학습하여, 새로운 고객이 나타났을 때 “이 고객은 85%의 확률로 알뜰형입니다”라고 자동으로 분류해주는 시스템을 구축하는 것이다.
이를 위해, 이 연구는 다음과 같은 질문에 답하고자 한다.
- 다양한 고객 행동 데이터와 프로필 데이터를 사용하여 고객 성향을 예측하는 것이 가능한가?
- 딥러닝 모델은 이러한 복잡한 관계를 학습하여 고객 성향을 얼마나 정확하게 분류할 수 있는가?
궁극적으로는 대규모 고객을 대상으로 한 실시간 개인화 마케팅을 가능하게 하는 기술적 토대를 마련하는 것을 목표로 한다.
연구 모형
다양한 고객 행동 데이터를 입력 특징으로, 미리 정의된 고객 성향(예: 알뜰형, 유행추구형)을 출력(타겟)으로 하는 다중 클래스 분류(Multi-class Classification) 딥러닝 모델을 설계하고 학습시킨다.
본 연구는 특정 고객의 데이터가 주어졌을 때, 그 고객이 어떤 성향 그룹에 속하는지를 맞추는 지도학습(Supervised Learning) 기반의 분류(Classification) 문제로 접근한다. 그 과정은 다음과 같이 설계되었다.
- 데이터 준비 및 라벨링 (Data Preparation & Labeling):
- 고객의 인구통계 정보, 거래 기록, 온라인 활동 로그 등 다양한 행동 데이터를 수집한다. 이것이 모델의 **입력(X)**이 된다.
- 가장 중요한 단계로, 분석에 사용될 각 고객에게는 “알뜰형”, “유행추구형” 등과 같이 사전에 정의된 **성향 라벨(Label)**을 부여한다. 이 라벨이 모델이 맞춰야 할 **정답(Y)**이 된다. (이 라벨은 전문가의 판단이나 별도의 설문조사 등을 통해 생성될 수 있다.)
- 딥러닝 모델 설계 (Model Architecture):
- 입력층, 여러 개의 은닉층, 출력층으로 구성된 기본적인 인공신경망(ANN) 또는 다층 퍼셉트론(MLP) 모델을 설계한다.
- 은닉층에는 ReLU와 같은 활성화 함수를 사용하여 데이터의 비선형적 특징을 학습하게 한다.
- 출력층에는 Softmax 함수를 사용하여, 입력된 고객이 각 성향 클래스에 속할 확률을 계산하여 출력한다.
- 모델 학습 및 평가 (Model Training & Evaluation):
- 준비된 라벨링 데이터를 사용하여 딥러닝 모델을 학습(Training)시킨다. 모델은 예측과 실제 정답 간의 오차를 줄여나가는 방향으로 내부 가중치를 반복적으로 업데이트한다.
- 학습에 사용되지 않은 별도의 테스트 데이터를 사용하여, 모델이 얼마나 정확하게 고객의 성향을 분류하는지 성능(정확도, 정밀도, 재현율 등)을 평가한다.
데이터 설명
특정 기업의 고객 행동 및 프로필 데이터를 활용했으며, 각 고객에게는 사전에 정의된 성향 라벨이 부여된 형태의 오프체인(Off-chain) 데이터이다.
- 출처: 논문에 구체적인 기업명이나 데이터 출처는 명시되지 않았으나, 특정 이커머스 또는 리테일 기업과의 협력을 통해 확보한 데이터를 사용한 것으로 추정된다. 이는 기업 내부 CRM 시스템에 저장된 오프체인(Off-chain) 데이터이다.
- 수집 방법: 기업 내부의 데이터베이스에서 고객 프로필, 거래 기록, 웹/앱 로그 등을 추출했다. 이 연구의 핵심적인 가정은, 이 데이터에 미리 정의된 고객 성향 라벨이 이미 존재한다는 것이다. 이 라벨링은 과거 마케팅 팀의 전문가들이 수동으로 부여했거나, 별도의 설문조사를 통해 얻어졌을 가능성이 높다.
- 데이터 변수 설명: 본 연구는 지도학습 문제이므로, 데이터는 입력 변수(X)와 정답(Y)으로 명확히 구분된다.
- 입력 변수 (X, Features): 고객의 성향을 예측하는 데 사용되는 모든 정보.
- 인구통계 정보:
연령
,성별
,거주 지역
등. - 거래 행동 정보:
RFM 점수
,평균 구매 단가
,주요 구매 카테고리
,할인 상품 구매 비율
등. - 온라인 행동 정보:
월 평균 방문 횟수
,평균 세션 체류 시간
,주요 조회 카테고리
등.
- 인구통계 정보:
- 출력/타겟 변수 (Y, Label): 모델이 맞춰야 하는 정답.
Customer_Propensity
:알뜰형
,유행추구형
,VIP형
,일반형
등과 같이, 사전에 명확하게 정의된 범주형 성향 라벨.
- 입력 변수 (X, Features): 고객의 성향을 예측하는 데 사용되는 모든 정보.
데이터 분석
수백 개의 고객 행동 변수를 딥러닝 모델에 학습시켜 고객 성향을 분류한 결과, 기존의 통계 모델이나 단일 머신러닝 모델보다 높은 분류 정확도를 달성했다.
본 연구의 데이터 분석은 수백 개에 달할 수 있는 다차원의 고객 특징 데이터를 딥러닝 모델에 효과적으로 학습시켜, 고객 성향이라는 특정 목표 변수를 얼마나 잘 예측하는지를 검증하는 과정이다.
분석 단계에서는 고객의 다양한 행동과 프로필 변수들을 정규화(Normalization)하는 등 모델이 잘 학습할 수 있도록 데이터를 전처리했다. 이후, 설계된 인공신경망 모델에 이 데이터를 입력하여 학습을 진행했다. 학습 과정에서 모델은 어떤 변수들의 조합이 ‘알뜰형’ 고객의 특징이고, 어떤 조합이 ‘유행추구형’ 고객의 특징인지를 스스로 파악하게 된다.
모델의 성능을 평가하기 위해, 학습된 딥러닝 모델의 분류 정확도를 로지스틱 회귀나 의사결정나무와 같은 전통적인 머신러닝 모델의 성능과 비교했다. 분석 결과, 여러 개의 은닉층을 통해 변수 간의 복잡한 상호작용을 학습할 수 있는 딥러닝 모델이 다른 단순한 모델들보다 더 높은 정확도로 고객의 성향을 맞추는 것으로 나타났다. 이는 고객의 성향이 소수의 변수만으로 설명되는 것이 아니라, 수많은 변수들의 복합적인 패턴에 의해 결정됨을 시사한다.
핵심 결과
딥러닝 모델은 수많은 변수 속에서 비선형적이고 복잡한 패턴을 효과적으로 학습하여, 고객의 잠재적 성향을 높은 정확도로 식별해낼 수 있음을 증명했다.
본 연구의 핵심 결과는 딥러닝 기술이 고객 성향 분류 문제에 매우 효과적인 도구임을 실험적으로 입증했다는 점이다. 고객의 나이, 소득, 구매 내역, 웹사이트 방문 기록 등 수많은 이질적인 데이터를 동시에 고려하여, 그 속에 숨겨진 고객의 핵심적인 ‘페르소나’를 찾아내는 데 성공했다.
이는 마케터가 더 이상 주관적인 판단이나 단편적인 규칙에 의존할 필요가 없음을 의미한다. 잘 학습된 딥러닝 모델이 있다면, 신규 고객이 유입되거나 기존 고객의 행동에 변화가 생겼을 때, 그 고객의 성향을 자동으로, 그리고 실시간으로 파악하여 즉각적인 개인화 마케팅 액션을 취할 수 있게 된다. 이 연구는 데이터 기반의 자동화된 고객 프로파일링 시스템 구축의 기술적 가능성을 명확히 보여주었다.
시사점
데이터 기반의 고객 성향 분류 자동화는 마케터가 모든 고객을 일일이 분석하는 수고를 덜어주고, 개인화된 마케팅 전략을 대규모로 실행할 수 있는 기술적 토대를 마련해준다.
이 연구는 CRM 및 마케팅 분야의 실무자들에게 다음과 같은 중요한 시사점을 제공한다.
첫째, 고객 분석의 패러다임이 ‘수동’에서 ‘자동’으로 전환되고 있다. 딥러닝 모델은 한 번 잘 구축해두면, 새로운 데이터가 들어올 때마다 자동으로 고객을 분류하고 프로파일링할 수 있다. 이는 마케터가 반복적인 분석 작업에서 벗어나, 각 성향 그룹에 맞는 창의적인 마케팅 전략을 기획하는 데 더 많은 시간을 쓸 수 있게 해준다.
둘째, 진정한 의미의 ‘초개인화’가 가능해진다. 고객을 몇 개의 큰 그룹으로 나누는 것을 넘어, 각 고객이 어떤 성향에 속할 확률(예: 알뜰형 70%, 유행추구형 20%, …)을 계산할 수 있다. 이를 통해 “이번 주에는 알뜰형 성향이 강하게 나타난 A고객에게 할인 쿠폰을 보내고, 다음 주에는 유행추구형 성향이 나타나면 신상품 정보를 보내는” 것과 같은, 시시각각 변하는 고객의 상태에 맞춘 동적인 마케팅이 가능해진다.
인사이트
고객의 행동에 ‘이름’을 붙여라. 이름이 불릴 때, 비로소 의미 있는 관계가 시작된다.
이 논문은 고객 관계의 본질을 다시 생각하게 한다. 수많은 익명의 고객 데이터 속에서 각 고객의 ‘성향’이라는 이름을 붙여주는 순간, 우리는 비로소 그 고객을 이해하고, 그에 맞는 말을 걸 수 있게 된다. 딥러닝은 바로 이 ‘이름을 붙여주는’ 과정을 과학적이고 자동화된 방식으로 해결해주는 강력한 도구이다.
- 페르소나 예시: “알파고래(Alpha Whale), 퀀트 그룹”
- 특징: 이 지갑 그룹은 단순히 자산이 많은 ‘고래’가 아니라, 매우 정교하고 복잡한 DeFi 전략을 구사한다. 이들은 플래시론을 활용한 차익거래, 여러 프로토콜을 연계한 델타 뉴트럴 전략, 저위험 채권형 상품 등 기관 투자 수준의 전략을 실행한다. 이들의 온체인 행동 데이터는 매우 복잡하지만, 딥러닝 모델을 통해 이들을 **’정교한 알파 추구자’**라는 특정 성향으로 분류할 수 있다.
- 데이터 기반 행동: Gnosis Safe 다중서명 지갑 사용, Flash-loan 관련 컨트랙트와의 상호작용, 매우 낮은 실패 트랜잭션 비율, 다수의 DeFi 프로토콜을 하나의 트랜잭션으로 묶는 복합 트랜잭션 실행.
- 실질적인 마케팅 액션 제안:
- 성향 기반 맞춤형 인터페이스(UI) 제공: 딥러닝 모델이 ‘알파고래’ 성향으로 분류한 지갑이 dApp에 접속하면, 일반 사용자를 위한 단순한 UI 대신, 여러 자산과 프로토콜의 정보를 한눈에 보고 복잡한 주문을 실행할 수 있는 ‘전문가 모드(Pro Mode)’ 대시보드를 기본 인터페이스로 제공한다.
- 차세대 상품 우선 접근권 제공(Private Access): 이들에게는 일반적인 마케팅 메시지 대신, 아직 대중에게 공개되지 않은 새로운 파생상품이나 구조화 상품에 대한 비공개 테스트(Private Beta) 참여 기회를 우선적으로 제공한다. 이는 이들의 지적 호기심과 전문성을 존중하는 최고의 VIP 경험이 될 수 있다.
- API 접근 권한 및 개발자 지원: 이 세그먼트는 직접 스마트 컨트랙트를 코딩하거나 트레이딩 봇을 운영할 가능성이 높다. 이들에게는 프로토콜의 데이터를 더 쉽게 활용할 수 있는 전용 API 엔드포인트와 기술 지원을 제공하여, 이들이 우리 생태계 위에서 더 정교한 전략을 펼칠 수 있도록 돕고 락인(Lock-in) 효과를 높인다.