K-평균과 DBSCAN을 결합한 개선된 클러스터링 알고리즘을 통해 은행 고객을 정교하게 분류하고, 각 그룹의 특성에 맞는 맞춤형 마케팅 전략을 제시하여 실제 비즈니스 성장을 이끌어낸 통합 사례 분석이다.
논문 요약
- 논문 제목: Bank Customer Segmentation and Marketing Strategies Based on Improved DBSCAN Algorithm
- 저자: Xiaohua Yan, Yufeng Li, Fuquan Nie, Rui Li
- 게재 학술지: MDPI – Applied Sciences
- 발행 연도: 2025
- 핵심 요약: K-평균(K-Means)과 DBSCAN의 장점을 결합한 새로운 KM-DBSCAN 알고리즘을 제안하여 은행 고객 세분화의 정확도를 15% 향상시켰다. 이 분석 결과를 바탕으로 개인화된 마케팅 전략을 수립하고 실행하여, 평균 비즈니스 수익 성장률 16.08%라는 실질적인 성과를 달성했다.
연구 배경
이 연구는 치열한 금융 시장에서 살아남기 위해, 은행이 어떻게 데이터를 활용하여 고객을 더 깊이 이해하고 실질적인 성과를 창출할 수 있는지에 대한 모범 답안을 제시한다.
현대 금융 산업에서 **고객 관계 관리(CRM)**의 중요성은 아무리 강조해도 지나치지 않다. 특히 은행과 같은 금융 기관에게 **고객 세분화(Customer Segmentation)**는 한정된 마케팅 자원을 효율적으로 배분하고 고객 만족도를 극대화하기 위한 필수적인 첫걸음이다. 고객을 비슷한 특성을 가진 그룹으로 묶고, 각 그룹에 맞는 상품과 서비스를 제공하기 위해 **군집분석(Cluster Analysis)**이 널리 사용되어 왔다.
하지만 기존의 군집분석 알고리즘들은 저마다 한계를 가지고 있었다. 가장 널리 쓰이는 **K-평균(K-Means)**은 군집이 원형이어야 한다는 가정 때문에 복잡한 형태의 고객 그룹을 잘 찾아내지 못한다. 반면, 밀도 기반 알고리즘인 DBSCAN은 다양한 형태의 군집을 발견할 수 있지만, 분석가가 사전에 이웃 반경(epsilon)
이나 최소 밀도(min_samples)
와 같은 파라미터를 정확하게 설정해야 하는 어려움이 있었다. 이 연구는 바로 이러한 기술적 한계를 극복하고, 분석 결과를 실제 마케팅 전략과 연결하여 측정 가능한 성과를 내기 위한 목적으로 시작되었다.
해결하려는 문제
기존 군집분석 알고리즘의 기술적 한계를 개선하고, 분석 결과와 실제 마케팅 전략 사이의 간극을 좁혀 실질적인 비즈니스 성과를 창출한다.
데이터 분석 프로젝트가 실패하는 가장 큰 이유 중 하나는, 분석 결과가 실제 비즈니스 문제 해결로 이어지지 못하고 보고서 단계에서 끝나는 것이다. 이 연구는 두 가지 핵심적인 문제를 동시에 해결하고자 한다.
첫째, 기술적 문제다. 어떻게 하면 기존 알고리즘보다 더 정확하고 안정적으로 실제 고객 데이터를 잘 반영하는 군집을 찾아낼 수 있을까? 이를 위해 K-평균과 DBSCAN의 단점을 서로 보완하는 새로운 하이브리드 알고리즘을 제안한다.
둘째, 전략적 문제다. 정교하게 분류된 고객 세그먼트 정보를 어떻게 구체적인 마케팅 액션으로 변환하고, 그 성과를 측정할 수 있을까? 이 연구는 “고가치 고객 그룹에게는 VIP 서비스를 제공한다”와 같은 구체적인 전략을 제시하고, 그 결과로 발생한 ‘수익 성장률’이라는 명확한 지표로 프로젝트의 성공을 증명하고자 한다.
연구 모형
K-평균과 DBSCAN 알고리즘을 결합한 새로운 ‘KM-DBSCAN’ 알고리즘을 제안하고, 이를 통해 도출된 고객 세그먼트를 기반으로 맞춤형 마케팅 전략을 설계한다.
본 연구의 모형은 기술적 혁신과 전략적 적용이라는 두 가지 축으로 구성된다.
- KM-DBSCAN 알고리즘:
- 1단계 (K-평균 활용 파라미터 최적화): 먼저 K-평균 알고리즘을 예비적으로 사용하여 데이터의 전체적인 분포와 밀도를 파악한다. 이 과정에서 얻어진 정보를 바탕으로, DBSCAN 알고리즘의 가장 큰 난제였던
이웃 반경(epsilon)
과최소 밀도(min_samples)
파라미터 값을 데이터에 맞게 자동으로 최적화한다. - 2단계 (DBSCAN 활용 정교한 군집화): 최적화된 파라미터 값을 가진 DBSCAN 알고리즘을 최종적으로 실행하여, 다양한 형태와 밀도를 가진 고객 군집을 정확하게 식별하고 분류한다.
- 1단계 (K-평균 활용 파라미터 최적화): 먼저 K-평균 알고리즘을 예비적으로 사용하여 데이터의 전체적인 분포와 밀도를 파악한다. 이 과정에서 얻어진 정보를 바탕으로, DBSCAN 알고리즘의 가장 큰 난제였던
- 전략 수립 및 실행:
- 분류된 각 고객 군집(예: 고가치 고객, 핵심 고객, 잠재 고객, 저가치 고객)의 인구통계학적, 행동적 특성을 심층 분석한다.
- 분석된 프로필을 기반으로 각 그룹의 니즈에 맞는 차별화된 마케팅 전략을 설계하고 실행한다.
데이터 설명
은행 고객의 인구통계학적 정보, 거래 기록, 자산 규모 등 명시적/암시적 데이터를 종합적으로 활용한다.
- 출처: 논문에 구체적인 출처는 명시되지 않았으나, 연구의 성격상 특정 은행과의 협력을 통해 확보한 익명화된 실제 은행 고객 데이터를 활용했다. 이는 전형적인 Web2 금융 데이터에 해당한다.
- 수집 방법: 은행의 내부 데이터 웨어하우스나 CRM 시스템에 저장된 고객 정보를 추출하여 분석용 데이터셋으로 구성했을 것이다.
- 데이터 변수 설명: 이 연구의 강점 중 하나는 고객을 다각도로 이해하기 위해 명시적 지표와 암시적 지표를 모두 활용한 점이다.
- 명시적 가치 지표 (Explicit Value Indicators): 고객의 재무 상태를 직접적으로 보여주는 변수들이다.
Total Assets
: 고객이 은행에 예치한 총자산.Average Daily Deposits
: 일평균 예금 잔액.Number of Products
: 보유한 금융 상품(예: 예금, 펀드, 대출)의 수.
- 암시적 행동 지표 (Implicit Behavioral Indicators): 고객의 행동 패턴이나 잠재적 가치를 나타내는 계산된 변수들이다.
Transaction Frequency
: 거래 빈도.Recency
: 최근 거래일.Digital Channel Usage
: 인터넷뱅킹, 모바일뱅킹 사용률.Customer Lifetime Value (CLV)
: 고객 생애 가치 (계산된 예측값).
- 명시적 가치 지표 (Explicit Value Indicators): 고객의 재무 상태를 직접적으로 보여주는 변수들이다.
데이터 분석
제안된 KM-DBSCAN 알고리즘을 은행 고객 데이터에 적용하여 고객을 4개의 그룹으로 분류하고, 각 그룹의 프로필과 가치를 분석하여 차별화된 마케팅 방안을 도출한다.
본 연구의 분석 과정은 제안된 KM-DBSCAN 알고리즘을 실제 은행 고객 데이터에 적용하는 것에서 시작된다. 알고리즘은 데이터를 분석하여 고객을 고가치 고객, 핵심 고객, 잠재 고객, 저가치 고객이라는 네 개의 의미 있는 그룹으로 성공적으로 분류했다.
분석의 다음 단계는 각 그룹의 특성을 깊이 파고드는 것이다. 예를 들어, ‘고가치 고객’ 그룹은 총자산과 금융 상품 보유 수가 월등히 높았으며, ‘잠재 고객’ 그룹은 현재 자산 규모는 작지만 거래 빈도나 디지털 채널 사용률이 높아 성장 가능성이 큰 것으로 나타났다.
이렇게 각 그룹의 프로필이 명확해지면, 이를 바탕으로 “고가치 고객에게는 전담 PB 서비스를 제공하고, 잠재 고객에게는 신규 상품 추천 및 수수료 우대 혜택을 제공하자”와 같은 구체적이고 차별화된 마케팅 전략을 수립하는 순서로 분석이 진행되었다.
핵심 결과
제안된 KM-DBSCAN 알고리즘은 기존 기법 대비 군집 정확도를 15% 향상시켰으며, 이를 기반으로 한 마케팅 전략 실행 결과 평균 비즈니스 수익이 16.08% 증가했다.
이 연구의 결과는 두 가지 측면에서 매우 인상적이다.
첫째, 기술적 우수성을 입증했다. 제안된 KM-DBSCAN 알고리즘은 기존의 단일 알고리즘을 사용했을 때보다 군집 분석의 정확도를 약 15% 향상시켰다. 이는 더 정확하게 고객의 본질적인 그룹을 찾아낼 수 있음을 의미한다.
둘째, 그리고 더 중요하게, 실질적인 비즈니스 가치를 증명했다. 이 분석 결과를 바탕으로 수립된 맞춤형 마케팅 전략을 실제 은행 시나리오에 적용한 결과, 평균 비즈니스 수익률이 16.08% 증가하고 고객 참여도가 4.5% 향상되는 놀라운 성과를 거두었다. 이는 데이터 분석이 단순한 리포트를 넘어, 어떻게 실제 돈을 버는 비즈니스 활동으로 이어질 수 있는지를 보여주는 완벽한 사례이다.
시사점
고객 세분화 프로젝트의 성공은 알고리즘의 기술적 우수성뿐만 아니라, 분석 결과를 비즈니스 목표와 연결하여 실제 행동으로 옮기고 그 성과를 측정하는 능력에 달려있다.
이 연구는 데이터 과학 프로젝트를 수행하는 모든 조직에게 중요한 교훈을 준다. 최고의 알고리즘을 개발하는 것만으로는 충분하지 않다. 분석의 최종 목표는 ‘정확한 모델’이 아니라 ‘측정 가능한 비즈니스 임팩트’ 여야 한다.
이를 위해서는 데이터 과학자, 마케터, 현업 담당자가 긴밀하게 협력하여 ‘분석 → 실행 → 측정 → 개선’ 으로 이어지는 선순환 고리를 만들어야 한다. 데이터 분석 팀은 비즈니스 문제를 깊이 이해해야 하고, 마케팅 팀은 데이터 기반의 인사이트를 신뢰하고 과감하게 실행해야 한다. 그리고 그 모든 과정의 성과는 구체적인 핵심 성과 지표(KPI)로 측정되고 다음 전략에 반영되어야 한다. 이 논문은 이러한 이상적인 협업 모델이 어떻게 현실에서 구현될 수 있는지를 명확히 보여준다.
인사이트
데이터 분석의 끝은 리포트가 아니라, 고객의 통장에 찍히는 이자다.
이 논문이 주는 가장 큰 영감은, 데이터 분석의 가치가 보고서의 마지막 페이지가 아니라 고객의 경험과 비즈니스의 성장률 속에서 증명된다는 점이다. AI 빅데이터 마케터의 관점에서 이 철학을 Web3 CRM에 적용하면, 다음과 같은 구체적인 페르소나와 액션 플랜을 도출할 수 있다.
- 고객 페르소나 예시 (Web3 관점): “잠자는 고래 (The Sleeping Whale)”
- 행동 특성: 이 사용자의 지갑에는 100만 달러 이상의 USDC가 예치되어 있지만, 지난 6개월간 거래 활동이 거의 없다. 과거 대형 거래소로부터 한 번의 대규모 입금 기록만 있을 뿐, 이후로는 아무런 활동이 없는 상태다. 전통적인 RFM(Recency, Frequency, Monetary) 분석에서는 낮은 활동성 때문에 저평가될 수 있다.
- 해석: 이 연구에서 제안된 밀도 기반의 정교한 알고리즘을 적용하면, 이들은 단순히 ‘비활성 유저’가 아니라 ‘매우 높은 자산 가치를 지닌, 고밀도의 특별한 군집’으로 식별된다. 즉, 참여는 적지만 자산 가치가 매우 높은, 깨우면 엄청난 잠재력을 발휘할 수 있는 고객 그룹이다.
- 실질적인 마케팅 액션 제안 (Web3 CRM)
- 저위험 고수익 상품 제안: 이들은 자금을 공격적으로 운용하기보다 안정성을 추구할 가능성이 높다. 이들에게는 Aave, Compound와 같은 신뢰도 높은 블루칩 DeFi 프로토콜에 USDC를 예치하여 안정적인 이자 수익을 얻는 방법을 안내하는 개인화된 리포트나 시뮬레이터를 제공한다.
- VIP 컨시어지 서비스: 이들의 지갑 주소를 ‘최상위 관리 대상’으로 지정하고, 전담 매니저가 배정되어 텔레그램, 이메일 등 프라이빗 채널을 통해 직접 소통하며 이들의 니즈를 파악하고 맞춤형 투자 기회나 보안 컨설팅을 제공하는 등 VVIP 서비스를 제공한다.
- 보안 강화 및 신뢰 구축: 이들의 자산이 장기간 움직이지 않고 있다는 점에 착안하여, “고객님의 자산은 안전하게 보호되고 있습니다. 최근 유행하는 피싱 공격에 대비하여 보안 수칙을 다시 한번 확인하세요”와 같은 보안 관련 정보성 메시지를 주기적으로 보내며 신뢰 관계를 쌓는다.