그래프 데이터의 방향성은 어디에 있나: Edge vs Node vs 정규화
그래프 데이터 분석에서는 “방향성(directed)”이 하나로 고정되어 있지 않다. 방향성은 (1) 엣지(인접)에 있을 수도 있고, (2) 노드(뷰/피처)에 있을 수도 있으며, (3) 전파(정규화) 연산에서 “비대칭 전파”로 나타날 수도 있다. 해당 포스팅에서는 이 세 가지를 분리해 정의하고, 작은 샘플 데이터로 직접 비교한다. …
그래프 데이터 분석에서는 “방향성(directed)”이 하나로 고정되어 있지 않다. 방향성은 (1) 엣지(인접)에 있을 수도 있고, (2) 노드(뷰/피처)에 있을 수도 있으며, (3) 전파(정규화) 연산에서 “비대칭 전파”로 나타날 수도 있다. 해당 포스팅에서는 이 세 가지를 분리해 정의하고, 작은 샘플 데이터로 직접 비교한다. …
라플라시안이란? “이웃과 얼마나 다르게 튀는지”를 수치화하는 연산자 그래프에서는 시간축처럼 “앞/뒤”가 고정되어 있지 않다. 대신 엣지(연결)가 “누가 이웃인지”를 결정한다. 그래서 GFT는 아래와 같이 정의한다. 이 “부드러움/거침”을 수식으로 잡아주는 게 라플라시안 (L)이다. 시작점: 두 개의 데이터프레임 (1) 노드 신호: signal_df (노드에 붙은…
DFT와 GFT의 수식 디테일보다, “데이터 구조가 다르면 푸리에의 기준(주파수)이 어떻게 바뀌는지“를 비교로 이해한다. 한 줄 요약 + 비교 표 DFT는 시간 순서(고정 격자) 기준의 주파수, GFT는 연결 관계(그래프) 기준의 주파수다. 구분 DFT GFT 대조되는 관점 격자/선형 구조(시간축 고정) 그래프 구조(연결…
마케팅 데이터가 커지면 어느 순간 이런 생각이 든다. “이 알고리즘, **이제는 너무 느린데… 바꿀 수 없을까?” 이번 글은 네트워크 중심성(중요 고객 찾기) 예시를 가지고 아래 3가지 개념을 이해할 수 있도록 정리해 보려고 한다. 1. 문제 상황: 고객 네트워크에서 “핵심 허브”를…
AWS SageMaker Studio의 넉넉한 무료 티어(ml.t3.medium 250시간)를 믿고 ML 실습을 진행하다, 예상치 못했던 소액의 10월 청구서를 받았다. 프리 티어 기능을 확인했을 때 충분히 이해하고 사용했다 판단했으나 내가 놓친 부분들이 있어서 이 부분들에 대해 기록하려 한다. 프리티어 무료 안내 내역 …