고객의 ‘매우 만족’과 같은 모호한 언어적 표현을 퍼지 논리로 정량화하여 고객을 분류하는 연구로, 숫자로 표현되지 않는 WEB3 사용자의 불분명한 행동 데이터에서 숨겨진 의도를 분석하는 데 중요한 아이디어를 제공한다.
논문 요약
- 논문 제목: Profiling clients in the tourism sector using fuzzy linguistic models based on 2-tuples
- 저자: Itzcóatl Bueno, Ramón A. Carrasco, Carlos Porcel, Enrique Herrera-Viedma
- 게재 학술지: Procedia Computer Science (via ScienceDirect)
- 발행 연도: 2022
- 핵심 요약: ‘매우 좋다’, ‘조금 아쉽다’와 같이 모호한 고객 리뷰의 언어적 표현을 퍼지 논리(Fuzzy Logic)와 2-튜플(2-tuples) 표현법을 이용해 정량화하고, 이를 기반으로 고객을 프로파일링하고 세분화하는 새로운 방법론을 제시한다.
연구 배경
고객 프로파일링은 오랫동안 마케팅의 핵심이었으나, 별점과 같은 정량적 데이터를 넘어 고객의 주관적인 언어 표현을 분석하려는 시도는 기술적 한계에 부딪혀 왔다.
전통적인 고객 관계 관리(CRM)에서 고객 프로파일링은 주로 구매 내역, 인구 통계 정보 등 명확한 수치 데이터를 기반으로 이루어졌다. 하지만 고객의 진짜 만족도나 의견은 “가격은 괜찮았지만 서비스는 실망스러웠다”와 같은 복합적이고 주관적인 언어에 담겨있는 경우가 많다. 이러한 비정형 텍스트 데이터를 분석하는 것은 자연어 처리(NLP)의 오랜 과제였다.
이 연구의 핵심 개념인 **퍼지 언어 모델(Fuzzy Linguistic Models)**은 이러한 문제를 해결하기 위해 등장했다. 퍼지 이론(Fuzzy Theory)은 ‘참(1)’과 ‘거짓(0)’으로만 세상을 나누는 이진 논리와 달리, ‘조금 참’, ‘대체로 참’과 같이 중간 상태를 허용하는 논리 체계이다. 본 연구는 이 퍼지 이론을 고객의 언어 표현 분석에 적용하여, ‘만족’과 ‘불만족’ 사이의 미묘한 감정의 스펙트럼을 수학적으로 다룰 수 있는 방법을 제안한다. 이는 고객의 목소리를 보다 정확하게 이해하고, 이를 바탕으로 정교한 마케팅 전략을 수립하기 위한 새로운 접근법의 필요성에서 출발했다.
해결하려는 문제
‘좋다’, ‘나쁘다’와 같이 주관적이고 모호한 고객의 언어적 피드백을 어떻게 객관적인 데이터로 변환하여 마케팅에 활용할 것인가의 문제를 다룬다.
고객이 남긴 “전반적으로 만족하지만, 청결은 약간 아쉬웠어요”라는 리뷰가 있다고 가정해보자. 이 문장을 단순히 ‘만족’ 또는 ‘불만족’으로 분류하거나, 3점 또는 4점의 별점으로 치환하면 원래 문장이 가진 풍부한 정보가 손실된다. 이 연구가 해결하려는 핵심 문제는 바로 이 정보 손실이다. 연구진은 고객의 모호한 언어 표현(linguistic expressions)을 그 의미의 손상 없이 어떻게 수학적으로 표현하고 계산할 수 있을지에 집중했다. 궁극적으로는 이러한 질적 데이터를 정량화하여, 각 고객이 호텔의 어떤 요소(가격, 서비스, 위치 등)에 대해 어느 정도의 만족도를 느끼는지 다차원적인 프로필을 생성하고, 이를 통해 고객 그룹을 세분화하는 방법론을 구축하고자 했다.
연구 모형
‘2-튜플 퍼지 언어 모델(2-tuple Fuzzy Linguistic Model)’을 사용하여, 언어적 표현을 정보 손실 없이 연속적인 수치 값으로 변환하는 수학적 모델을 제시한다.
이 연구는 전통적인 통계나 머신러닝 모델 대신, 퍼지 논리에 기반한 독자적인 계산 모델을 제안한다. 모델의 핵심은 2-튜플(2-tuple) 표현법이다.
예를 들어, S = {매우 나쁨, 나쁨, 보통, 좋음, 매우 좋음}
이라는 5단계의 언어 집합이 있다고 하자. 어떤 고객의 평가가 ‘좋음’과 ‘매우 좋음’의 중간 어디쯤에 위치한다면, 이 모델은 이를 (좋음, 0.5)
와 같이 표현한다. 여기서 ‘좋음’은 기준이 되는 언어 라벨이고, ‘0.5’는 그 기준에서 ‘매우 좋음’ 쪽으로 얼마나 더 이동했는지를 나타내는 수치적 오프셋(offset)이다.
이러한 2-튜플 표현법을 사용하면, ‘매우 좋음’ (매우 좋음, 0)
이나 ‘조금 좋은’ (좋음, 0.1)
과 같은 모든 언어적 뉘앙스를 연속적인 스케일 상의 한 점으로 정확하게 매핑할 수 있다. 이 연구 모형은 이렇게 변환된 2-튜플 값들을 수학적으로 집계하고 평균을 내는 연산자(Aggregation Operators)를 정의함으로써, 개별 고객의 다면적인 평가를 하나의 종합 프로필로 통합하는 과정을 공식화했다.
데이터 설명
특정 데이터셋을 사용하기보다는, 온라인 관광 리뷰에서 나타나는 일반적인 언어적 표현을 분석 데이터로 가정하고 방법론을 설명한다.
- 출처: 논문에 구체적인 데이터셋 출처는 명시되지 않음. 다만, 연구의 맥락상 TripAdvisor, Booking.com, Yelp 등과 같은 일반적인 온라인 여행 및 서비스 리뷰 플랫폼에서 수집된 고객 리뷰 텍스트를 활용하는 것을 전제로 한다.
- 수집 방법: 논문에서 직접 수집 과정을 다루지는 않지만, 일반적으로 웹 크롤링이나 플랫폼에서 제공하는 API를 통해 텍스트 데이터를 수집하는 방법을 가정할 수 있다.
- 온체인 여부: 해당 없음 (고객의 주관적 평가가 담긴 오프체인 텍스트 데이터이다).
- 데이터 변수 설명: 이 연구의 변수는 전통적인 데이터셋의 ‘컬럼’이 아니라, 언어적 평가를 구조화하는 개념적 요소들이다.
- 평가 측면 (Evaluation Aspects): 고객이 평가하는 대상의 속성.
- 예:
가격(Price)
,서비스(Service)
,위치(Location)
,청결(Cleanliness)
등.
- 예:
- 언어적 용어 집합 (Linguistic Term Set, LTS): 평가에 사용되는 단어의 정해진 집합.
- S={s0,s1,…,sg}
- 예: S={s0:최악,s1:나쁨,s2:보통,s3:좋음,s4:최고}
- 2-튜플 언어 표현 (2-tuple Linguistic Representation): 모델의 핵심 변수로, 모호한 언어를 정량화한 결과물.
- 형태: (si,α)
- si: 언어적 용어 집합 S에 속하는 기준 라벨 (예: ‘좋음’).
- α: 기준 라벨로부터의 편차를 나타내는 실수 값. α∈[−0.5,0.5) (예: 0.2).
('좋음'에 가까운데 '최고' 쪽으로 약간 더 치우친 평가)
→(좋음, 0.2)
와 같이 변환된다.
- 평가 측면 (Evaluation Aspects): 고객이 평가하는 대상의 속성.
데이터 분석
언어적 평가를 2-튜플 모델로 변환한 후, 집계 연산자를 사용하여 개별 고객 또는 고객 그룹의 종합적인 프로필을 생성한다.
본 연구의 데이터 분석은 통계적 회귀나 분류가 아닌, 정의된 수학적 절차에 따라 진행된다.
- 변환 단계: 고객 리뷰 텍스트에서 ‘가격이 매우 합리적이다’와 같은 평가 문장을 추출하고, 이를 미리 정의된 언어적 용어 집합을 기준으로 2-튜플 값, 예를 들어
(합리적, 0.3)
으로 변환한다. - 집계 단계: 한 명의 고객이 ‘가격’, ‘서비스’, ‘위치’ 등 여러 측면에 대해 남긴 여러 개의 2-튜플 평가들을 ‘2-튜플 가중 평균(2-tuple Weighted Average)’과 같은 집계 연산자를 사용하여 하나의 종합 2-튜플 값으로 통합한다. 이 값은 해당 고객의 전반적인 만족도를 나타내는 프로필이 된다.
- 프로파일링 및 세분화 단계: 분석된 모든 고객의 종합 프로필 값을 비교하여 유사한 프로필을 가진 고객들을 그룹으로 묶는다. 예를 들어, ‘가격’에 대한 평가는 높지만 ‘서비스’에 대한 평가는 낮은 고객 그룹을 ‘가성비 중시형 고객’으로 정의할 수 있다.
핵심 결과
퍼지 언어 모델을 통해 모호한 텍스트 리뷰를 정보 손실 없이 정량적 프로필로 전환할 수 있으며, 이를 통해 정밀한 고객 세분화가 가능함을 보여주었다.
이 연구의 가장 중요한 결과는, 이전에는 다루기 어려웠던 주관적이고 질적인 데이터를 객관적이고 계산 가능한 형태로 변환하는 구체적인 방법론을 제시했다는 점이다. 2-튜플 모델은 ‘좋다’와 ‘매우 좋다’ 사이의 미묘한 차이를 버리지 않고 보존함으로써, 기존의 별점 시스템이나 단순 긍/부정 분석보다 훨씬 더 세밀한 고객 분석을 가능하게 했다. 이를 통해 마케터는 “서비스에 ‘약간’ 불만족한 고객 그룹”과 “‘매우’ 불만족한 고객 그룹”을 구분하여 서로 다른 CRM 전략을 적용할 수 있게 되었다. 즉, 이 연구는 모호함(ambiguity)을 분석의 방해 요소가 아닌, 정교한 분석을 위한 중요한 정보 소스로 활용할 수 있음을 증명했다.
시사점
고객의 진짜 목소리는 정량적 지표가 아닌 비정형 텍스트에 있으며, 이를 분석하는 기술이 미래 CRM의 핵심 경쟁력이 될 것이다.
본 연구는 관광 산업에 국한되지 않고, 고객의 피드백이 중요한 모든 비즈니스 영역에 깊은 시사점을 던진다. 제품 리뷰, SNS 댓글, 고객센터 상담 기록 등 기업이 보유한 방대한 양의 비정형 데이터 속에는 숫자로 요약될 수 없는 고객의 진짜 의도와 감정이 숨어있다. 이 논문은 퍼지 논리와 같은 기술을 통해 이러한 ‘회색 지대’의 데이터를 분석하고 가치를 창출할 수 있음을 보여준다. 이는 기업들이 단순히 보이는 숫자(매출, 클릭률 등)에만 매몰될 것이 아니라, 고객의 목소리에 담긴 미묘한 뉘앙스를 이해하려는 노력이 곧 차별화된 경쟁력으로 이어진다는 점을 강조한다.
인사이트
당신의 데이터, 혹시 ‘의미’는 버리고 ‘숫자’만 보고 있지는 않나요?
AI 빅데이터 마케터의 관점에서 이 논문의 핵심 가치는 ‘모호함의 정량화’라는 아이디어에 있다. 이는 WEB3와 같이 사용자의 행동 의도가 명확히 드러나지 않는 영역에서 특히 강력한 무기가 될 수 있다. 온체인 트랜잭션 데이터는 숫자이지만, 그 숫자에 담긴 사용자의 ‘의도’는 모호하기 때문이다.
- 고객 페르소나 예시 (온체인 행동의 모호함 기반):
- ‘신중한 탐험가 (The Cautious Explorer)’: 이들은 새로운 디앱 컨트랙트에 USDC를 전송하지만, 항상 10 USDC 미만의 소액만 보낸다. 단순 트랜잭션 횟수로는 ‘헤비 유저’처럼 보일 수 있지만, 금액을 함께 보면 이들의 행동은 ‘적극적 투자’가 아닌 ‘저위험 탐색’에 가깝다. 이들의 행동은
(탐험, -0.4)
와 같이 ‘탐험’에 가깝지만 ‘신중함’ 쪽으로 치우친 모호한 상태이다. - ‘기회주의적 파머 (The Opportunistic Farmer)’: 이들은 특정 디파이 풀에 높은 APY가 공지되면 대량의 USDC를 예치했다가, APY가 조금이라도 떨어지면 즉시 자금을 회수한다. 이들의 행동은 ‘장기적 기여자’가 아닌 ‘단기적 수익 추구자’에 해당한다. TVL(총 예치 자산) 기여도만 보면 VIP 고객 같지만, 자금 유지 기간을 보면 이탈 가능성이 매우 높은 그룹이다.
- ‘신중한 탐험가 (The Cautious Explorer)’: 이들은 새로운 디앱 컨트랙트에 USDC를 전송하지만, 항상 10 USDC 미만의 소액만 보낸다. 단순 트랜잭션 횟수로는 ‘헤비 유저’처럼 보일 수 있지만, 금액을 함께 보면 이들의 행동은 ‘적극적 투자’가 아닌 ‘저위험 탐색’에 가깝다. 이들의 행동은
- 실질적인 마케팅 액션 제안:
- 맞춤형 온보딩 프로그램: ‘신중한 탐험가’ 페르소나로 분류된 지갑 그룹에게는 리스크가 없는 ‘테스트넷 참여 에어드랍’ 이나 ‘소액 투자자 전용 보험 상품’을 제안하여 이들의 심리적 장벽을 낮춰준다.
- 동적 인센티브 제공: ‘기회주의적 파머’ 페르소나에게는 “지금부터 24시간 동안 자금을 유지하면 추가 보너스 APY 5% 지급!”과 같은 긴급 이벤트를 통해 이들의 단기적 성향을 역이용하여 자금 유지를 유도한다.
- 페르소나 기반 거버넌스 제안: ‘장기적 기여자’ 페르소나에게는 더 많은 투표 가중치를 부여하는 새로운 거버넌스 모델을 제안하여 커뮤니티의 충성도를 높인다.