ConvLSTM on confederated channels 기반 신용카드 프로모션 선호도 분석 리뷰

고객의 시공간적 신용카드 거래 데이터를 이미지 시퀀스로 변환하고, ConvLSTM 딥러닝 모델을 활용하여 특정 프로모션에 대한 고객의 선호도를 예측하는 새로운 방법론을 제시한다.

논문 요약

  • 논문 제목: ConvLSTM on confederated channels 기반 신용카드 프로모션 선호도 분석
  • 저자: 장경훈
  • 게재 학술지: 성균관대학교 대학원
  • 발행 연도: 2021
  • 핵심 요약: 고객의 시공간적 카드 사용 패턴을 이미지 시퀀스처럼 처리하여, ConvLSTM 모델로 특정 프로모션에 대한 반응 확률을 예측하고 시공간적 맥락의 중요성을 증명했다.

연구 배경

전통적인 고객 관계 관리(CRM)는 고객의 인구통계학적 정보나 과거 구매 이력 같은 정적인 데이터를 기반으로 고객을 분류하고 마케팅 전략을 수립했다. 그러나 이러한 방식은 ‘언제’, ‘어디서’ 소비하는지와 같은 동적인 ‘상황’ 정보를 반영하기 어려웠다. 최근 딥러닝 기술, 특히 시계열 데이터 처리에 강점을 보이는 LSTM(Long Short-Term Memory)과 이미지의 공간적 특징 추출에 뛰어난 CNN(Convolutional Neural Network)이 발전하면서, 이 둘을 결합한 ConvLSTM과 같은 시공간 데이터 분석 모델이 주목받기 시작했다. 이 연구는 이러한 기술적 배경을 바탕으로, 금융 분야의 CRM을 한 단계 발전시켜 ‘지금, 여기’의 고객에게 최적화된 프로모션을 제공할 수 있는 가능성을 탐구하기 위해 수행되었다.


해결하려는 문제

기존의 정적인 고객 분류 방식을 넘어, 시간과 장소에 따라 동적으로 변하는 고객의 프로모션 선호도를 예측하고자 했다.

기존의 마케팅 모델은 고객을 ’20대 여성’ 또는 ‘VIP 고객’과 같이 고정된 그룹으로 분류했다. 하지만 실제 고객의 선호도는 고정되어 있지 않다. 예를 들어, 동일한 고객이라도 평일 점심에는 회사 근처에서 저렴한 한식을 선호하지만, 주말 저녁에는 강남에서 분위기 있는 레스토랑을 찾을 수 있다. 이처럼 시간과 장소라는 ‘맥락(Context)’에 따라 고객의 니즈는 실시간으로 변화한다. 본 연구는 이러한 정적 분석의 한계를 극복하고, 고객의 시공간적 소비 패턴을 분석하여 특정 상황에서 어떤 프로모션에 반응할지를 동적으로 예측하는 것을 핵심 문제로 정의했다.


연구 모형

시공간적 특성을 동시에 학습하기 위해, 고객의 카드 거래 데이터를 공간적 격자(grid)와 시간적 순서(sequence)를 결합한 이미지 시퀀스로 변환 후 ConvLSTM 모델에 적용했다.

이 연구는 고객의 프로모션 선호도 예측 문제를 시공간 시퀀스 예측 문제로 재정의했다. 먼저, 특정 지역을 가로와 세로 격자로 나눈 2D 지도를 생성했다. 그리고 특정 시간 단위(예: 하루) 동안 각 격자 안에서 발생한 고객의 카드 사용 빈도나 금액을 히트맵(Heatmap)처럼 표현하여 한 장의 ‘소비 패턴 이미지’를 만들었다. 이렇게 생성된 일별 소비 패턴 이미지들을 시간 순서대로 나열하면, 이는 마치 동영상과 같은 ‘이미지 시퀀스’가 된다.

이 이미지 시퀀스를 ConvLSTM 모델에 입력으로 사용했다. ConvLSTM 모델은 각 이미지(프레임) 내에서 공간적인 소비 패턴(예: ‘강남역 주변에 소비 집중’)을 CNN 부분으로 포착하고, 시간의 흐름에 따른 이미지들의 변화(예: ‘평일에서 주말로 가면서 소비 지역 이동’)를 LSTM 부분으로 학습한다. 이를 통해 모델은 특정 고객의 다음 시점, 특정 장소에서의 프로모션 반응 여부를 확률적으로 예측하게 된다.


데이터 설명

익명화된 신용카드 거래 데이터를 공간적, 시간적 정보와 결합하여 모델 학습에 사용했다.

  • 출처: 논문에 구체적인 출처는 명시되지 않음. 일반적으로 카드사 내부 거래 데이터를 비식별화하여 활용했을 것으로 추정된다.
  • 온체인 여부: 온체인 데이터가 아닌, 중앙화된 금융 시스템(카드사)의 오프체인(Off-chain) 데이터이다.
  • 수집 방법: 논문에 구체적인 수집 방법은 명시되지 않았으나, 카드사의 결제 승인 시스템 로그에서 특정 기간(예: 수개월) 동안의 고객 거래 데이터를 추출했을 가능성이 높다.
  • 데이터 변수 설명: 논문에서 사용한 변수들은 다음과 같이 구조화하여 볼 수 있다.
    • 사용자 식별 정보
      • 사용자 ID: 개인정보 보호를 위해 비식별화된 고유 식별자.
    • 거래 맥락 정보 (Contextual Variables)
      • 시간적 변수 (Temporal): 거래일시 (년/월/일/시/분) – 고객 소비의 시간적 패턴 분석.
      • 공간적 변수 (Spatial): 거래 위치 (위경도 좌표 또는 행정구역 코드) – 고객 소비의 공간적 분포 분석.
    • 거래 내용 정보 (Transactional Variables)
      • 업종 카테고리: 외식, 쇼핑, 교통, 여가 등 소비가 발생한 가맹점의 업종.
      • 결제 금액: 거래된 금액.
    • 종속 변수 (Target Variable)
      • 프로모션 반응 여부: 분석하고자 하는 특정 프로모션에 고객이 반응(예: 쿠폰 사용)했는지 여부를 나타내는 이진 변수 (1: 반응, 0: 무반응).

데이터 분석

고객의 소비 활동을 특정 지역과 시간대에 대한 2D 히트맵 이미지로 변환하고, 이 이미지들의 시계열 시퀀스를 ConvLSTM 모델의 입력으로 사용하여 프로모션 반응을 예측했다.

데이터 분석은 크게 두 단계로 진행되었다. 첫 번째는 데이터 변환(Data Transformation) 단계이다. 원시(Raw) 거래 기록은 (사용자 ID, 시간, 위치, 금액) 형태의 텍스트 로그 데이터이다. 이를 딥러닝 모델이 학습할 수 있는 형태로 바꾸기 위해, 각 고객의 거래 기록을 시간의 흐름에 따른 일련의 이미지(이미지 시퀀스)로 변환했다. 예를 들어, 서울시를 100×100 격자로 나누고, 1일 단위로 각 고객이 어떤 격자에서 얼마를 소비했는지를 픽셀의 밝기로 표현하는 식이다.

두 번째 단계는 모델 학습 및 평가이다. 변환된 이미지 시퀀스를 ConvLSTM 모델의 입력 데이터로 사용하고, 특정 프로모션에 대한 실제 반응 여부를 정답 레이블로 설정하여 모델을 학습시켰다. 이 과정에서 모델은 특정 시공간 패턴(예: ‘주말 오후, 쇼핑몰 밀집 지역에서의 소비 증가’)이 특정 프로모션에 대한 긍정적 반응과 어떤 연관이 있는지를 학습한다. 모델의 성능은 SVM, MLP와 같은 전통적인 머신러닝 모델과 비교하여 예측 정확도(Accuracy), 정밀도(Precision) 등의 지표를 통해 평가했다.


핵심 결과

ConvLSTM 모델은 시공간적 맥락을 고려하지 않은 다른 비교 모델들(SVM, MLP 등)에 비해 프로모션 선호도 예측에서 더 높은 정확도를 보였다.

연구의 핵심 결과는 시공간적 맥락의 중요성을 실험적으로 증명했다는 점이다. 단순히 고객의 속성이나 전체적인 소비 총액을 기반으로 예측하는 모델보다, ‘언제’, ‘어디서’ 소비하는지의 동적인 패턴을 함께 학습한 ConvLSTM 모델이 프로모션 반응을 훨씬 더 정확하게 예측했다. 이는 고객의 선호도가 고정불변한 것이 아니라, 특정 상황과 밀접하게 연관되어 있음을 의미한다. 즉, 고객의 다음 행동을 예측하기 위해서는 과거 행동의 시공간적 맥락을 파악하는 것이 필수적이라는 결론을 도출했다.


시사점

고객 데이터 분석은 정적인 속성을 넘어, ‘시간’과 ‘공간’이라는 동적인 맥락을 중심으로 이루어져야 초개인화 마케팅의 정확도를 높일 수 있다.

본 연구는 기업의 CRM 전략에 중요한 실무적 시사점을 제공한다. 더 이상 고객을 정적인 페르소나로만 이해해서는 안 되며, 고객의 ‘라이프스타일’과 ‘상황’을 데이터로 포착해야 한다. 예를 들어, 카드사는 이 모델을 활용하여 특정 고객이 특정 장소에 방문했을 때, 그 순간에 가장 소구력 있는 프로모션을 실시간으로 제공하는 ‘하이퍼-타겟팅(Hyper-targeting)’을 구현할 수 있다. 이는 마케팅 비용의 효율성을 극대화하는 동시에, 고객에게는 스팸이 아닌 유용한 정보로 인식되어 고객 만족도를 높이는 효과를 가져올 수 있다. 궁극적으로 데이터 분석의 패러다임을 ‘고객이 누구인가(Who)’에서 ‘고객이 지금 무엇을 하는가(What)’로 전환할 필요가 있음을 보여준다.


인사이트

고객을 따라다니지 말고, 고객의 ‘상황’을 예측하라.

이 연구의 핵심 가치는 AI/빅데이터 마케터에게 ‘상황인지 마케팅’의 구체적인 실행 방법을 제시했다는 점에 있다. 기술적인 분석 결과를 실무에 바로 적용할 수 있는 페르소나와 액션 플랜으로 변환하면 다음과 같다.

  • 고객 페르소나 예시: ‘주말 미식 탐험가’
    • 30대 초반의 직장인 고객으로, 평일에는 주로 회사 근처(예: 구로디지털단지)에서 점심을 해결하지만, 주말에는 SNS에서 유행하는 맛집이나 카페를 찾아 특정 핫플레이스(예: 성수, 연남)를 방문하는 뚜렷한 시공간적 소비 패턴을 보인다. 이 고객은 일반적인 할인 쿠폰에는 반응하지 않지만, ‘주말 성수동 신상 디저트 카페 20% 할인’처럼 자신의 동선과 관심사에 정확히 부합하는 맥락적 프로모션에는 매우 높은 반응률을 보인다.
  • 실질적인 마케팅 액션 아이디어
    1. 실시간 위치 기반 타겟팅 (Geofencing): ‘주말 미식 탐험가’ 페르소나로 분류된 고객이 주말에 성수동 특정 반경 내로 진입하는 것을 감지하면, 제휴된 카페나 레스토랑의 할인 혜택을 앱 푸시 알림으로 즉시 발송한다.
    2. 예측 기반 CRM 캠페인: 과거 주말 방문 데이터를 분석하여 다음 주말에 방문할 확률이 가장 높은 지역을 예측하고, 해당 지역의 맞춤 프로모션을 금요일 오후에 카카오톡 메시지 등으로 미리 제안하여 주말 계획에 영향을 준다.
    3. 콘텐츠 개인화: 고객이 카드사 앱에 접속했을 때, 메인 배너에 ‘이번 주말, 성수동에서 꼭 가봐야 할 맛집 TOP 5’와 같은 맞춤형 콘텐츠를 노출하여 자연스럽게 프로모션으로 연결한다.