그래프 데이터의 방향성은 어디에 있나: Edge vs Node vs 정규화
그래프 데이터 분석에서는 “방향성(directed)”이 하나로 고정되어 있지 않다. 방향성은 (1) 엣지(인접)에 있을 수도 있고, (2) 노드(뷰/피처)에 있을 수도 있으며, (3) 전파(정규화) 연산에서 “비대칭 전파”로 나타날 수도 있다. 해당 포스팅에서는 이 세 가지를 분리해 정의하고, 작은 샘플 데이터로 직접 비교한다. …
그래프 데이터 분석에서는 “방향성(directed)”이 하나로 고정되어 있지 않다. 방향성은 (1) 엣지(인접)에 있을 수도 있고, (2) 노드(뷰/피처)에 있을 수도 있으며, (3) 전파(정규화) 연산에서 “비대칭 전파”로 나타날 수도 있다. 해당 포스팅에서는 이 세 가지를 분리해 정의하고, 작은 샘플 데이터로 직접 비교한다. …
블록체인 사용자의 거래 이력을 행동 패턴 ‘시퀀스’로 보고, 새로운 시퀀스 유사도 측정 기반의 군집분석 알고리즘(BPC)을 통해 유사한 행동을 보이는 사용자들을 자동으로 그룹화하는 선구적인 방법론을 제안한다. 논문 요약 연구 배경 블록체인 위의 모든 거래는 투명하게 기록되지만, 그 주체는 익명의 가면 뒤에…
온라인 쇼핑몰 고객을 RFM 기반 군집분석으로 ‘우수고객’, ‘잠재고객’ 등으로 나눈 뒤, 각 그룹별로 연관규칙 분석을 적용하여 그룹 맞춤형 상품 추천 전략을 제시하는 2단계 분석 방법론을 다룬다. 논문 요약 연구 배경 “모든 고객에게 똑같은 상품을 추천하는 것은 더 이상 통하지 않는다.…
2007년 당시, 온라인 서점 고객의 구매 이력과 인구통계 정보를 인공신경망(ANN)에 학습시켜, ‘인문학 애호가’, ‘자녀 교육서 구매자’ 등 숨겨진 고객 유형을 분류하는 선구적인 방법론을 제시한다. 논문 요약 연구 배경 고객의 구매 목록은 그들의 관심사와 정체성을 말해주는 데이터의 보고(寶庫)다. 이 연구는 2000년대…
전통적인 RFM 분석부터 K-평균 군집분석, 서포트 벡터 머신(SVM) 등 다양한 머신러닝 알고리즘을 활용한 고객 세분화 방법론들을 비교하고, 각 기법의 장단점과 활용 가능성을 탐색한다. 논문 요약 연구 배경 모든 고객을 동일하게 대할 수 없다는 것은 마케팅의 오랜 격언이다. 이 연구는 고객을…