AI INSIGHT
실행 불가능한 정확함 vs 실행 가능한 근사: 빅데이터 그래프의 선택
마케팅 데이터가 커지면 어느 순간 이런 생각이 든다. “이 알고리즘, **이제는 너무 느린데… 바꿀 수 없을까?” 이번 글은 네트워크 중심성(중요…
AWS SageMaker 프리티어 과금 분석 (청구서 및 로그 기준 원인 탐색)
AWS SageMaker Studio의 넉넉한 무료 티어(ml.t3.medium 250시간)를 믿고 ML 실습을 진행하다, 예상치 못했던 소액의 10월 청구서를 받았다. 프리 티어 기능을…
Amazon SageMaker studio 초기 세팅하기 (S3, IAM, Studio )
AI와 머신러닝 모델을 개발하고 싶지만, 복잡한 초기 설정 때문에 망설여질 때가 많다. Amazon SageMaker(세이지메이커)는 이러한 모델 개발, 학습, 배포의 전…
GROWTH MARKETING
그래프 데이터의 방향성은 어디에 있나: Edge vs Node vs 정규화
그래프 데이터 분석에서는 “방향성(directed)”이 하나로 고정되어 있지 않다. 방향성은 (1) 엣지(인접)에 있을 수도 있고, (2) 노드(뷰/피처)에 있을 수도 있으며, (3)…
라플라시안으로 정의되는 GFT: 인접행렬 A부터 주파수까지
라플라시안이란? “이웃과 얼마나 다르게 튀는지”를 수치화하는 연산자 그래프에서는 시간축처럼 “앞/뒤”가 고정되어 있지 않다. 대신 엣지(연결)가 “누가 이웃인지”를 결정한다. 그래서 GFT는…
그래프 데이터 구조 이해: 시간축(DFT) vs 관계망(GFT)
DFT와 GFT의 수식 디테일보다, “데이터 구조가 다르면 푸리에의 기준(주파수)이 어떻게 바뀌는지”를 비교로 이해한다. DFT: 값이 놓이는 뼈대가 시간축(고정된 줄) GFT:…
MARTECH REVIEW
TSGN: Transaction Subgraph Networks for Identifying Ethereum Phishing Accounts 논문 리뷰
이더리움 계정의 트랜잭션 서브그래프를 추출하고 그래프 대비 학습 기반의 GNN(Directed-TSGN, Temporal-TSGN)을 활용하여 피싱 계정을 식별하며, 높은 정확도와 시간 효율성을 달성했다.…
BlockGC: A Joint Learning Framework for Account Identity Inference on Blockchain with Graph Contrast 논문 리뷰
온체인 거래 데이터를 기반으로 상호작용 그래프(AIG)를 구성하고, 서브그래프 대비 학습(contrastive learning)과 GNN 분류기를 공동 학습하는 BlockGC 프레임워크를 제안하여 블록체인 계정…
Leveraging Tabular GANs for Malicious Ethereum Address Classification in Ethereum Network 논문 리뷰
Tabular GAN(CTGAN/CTABGAN+)을 활용하여 이더리움 주소 데이터를 증강하고, 이를 통해 피싱 및 Ponzi 등 악성 지갑을 식별하는 분류기의 성능을 개선했다. 논문…
