실행 불가능한 정확함 vs 실행 가능한 근사: 빅데이터 그래프의 선택
마케팅 데이터가 커지면 어느 순간 이런 생각이 든다. “이 알고리즘, **이제는 너무 느린데… 바꿀 수 없을까?” 이번 글은 네트워크 중심성(중요 고객 찾기) 예시를 가지고 아래 3가지 개념을 이해할 수 있도록 정리해 보려고 한다. 1. 문제 상황: 고객 네트워크에서 “핵심 허브”를…
마케팅 데이터가 커지면 어느 순간 이런 생각이 든다. “이 알고리즘, **이제는 너무 느린데… 바꿀 수 없을까?” 이번 글은 네트워크 중심성(중요 고객 찾기) 예시를 가지고 아래 3가지 개념을 이해할 수 있도록 정리해 보려고 한다. 1. 문제 상황: 고객 네트워크에서 “핵심 허브”를…
AWS SageMaker Studio의 넉넉한 무료 티어(ml.t3.medium 250시간)를 믿고 ML 실습을 진행하다, 예상치 못했던 소액의 10월 청구서를 받았다. 프리 티어 기능을 확인했을 때 충분히 이해하고 사용했다 판단했으나 내가 놓친 부분들이 있어서 이 부분들에 대해 기록하려 한다. 프리티어 무료 안내 내역 …
AI와 머신러닝 모델을 개발하고 싶지만, 복잡한 초기 설정 때문에 망설여질 때가 많다. Amazon SageMaker(세이지메이커)는 이러한 모델 개발, 학습, 배포의 전 과정을 쉽게 처리해 주는 강력한 AWS 서비스로 활용할 수 있다. 하지만 SageMaker를 제대로 사용하려면 몇 가지 핵심 구성 요소를 미리…
왜 온체인 데이터 분석에 Snowflake인가? 블록체인 기술의 핵심 가치 중 하나는 데이터의 투명성이다. 모든 거래 내역이 온체인(On-chain)에 기록되지만, 이 데이터를 실제 분석에 활용하는 것은 전혀 다른 차원의 문제로 다가올 수 있다. 로우 데이터(Raw Data) 분석의 한계와 정제된 데이터 플랫폼의 필요성…
데이터는 단순한 숫자와 문자의 나열이 아니다. 데이터는 마치 공간처럼 차원과 구조를 가지며, 이를 어떻게 이해하느냐에 따라 분석 방식과 결과가 달라진다. 데이터가 놓이는 공간을 유클리드 공간으로 볼지, 비유클리드 공간으로 볼지 구분하는 것은 데이터 분석의 출발점이다. 데이터에도 공간이 있다 데이터는 ‘좌표로 표현되는가’,…