분류 전체보기

Side Project

이커머스 데이터 분석) 1. 데이터

최근에 한 이커머스 데이터 분석!!그동안 했던 것들은 못 쓰더라도 (털썩,,,) 앞으로 하는 것들은 써봐야지!! * 데이터는 교육 받으면서 사측에서 제공 받았습니다데이터 불러오기일단, 데이터를 불러오기 전에 기본 라이브러리를 import 해줍시다import pandas as pdimport numpy as npimport seaborn as snsimport matplotlib.pyplot as pltimport matplotlibimport warningswarnings.filterwarnings(action='ignore')# 한글 깨짐 방지plt.rc('font', family='NanumBarunGothic')palette3 = sns.color_palette('mako', 10)!sudo apt..

데이터 분석/분석 방법론

퍼널분석

퍼널분석퍼널분석이란 유저들이 들어온 시점부터 설정한 목표를 달성할 때까지, 단계별 프로세스를 분석하는 방법이다.  퍼널분석은 이것처럼 깔때기 모양으로 시각화를 하는데, 퍼널(=Funnel)이 깔때기를 뜻한다고 한다.깔때기가 위에서 아래로 갈수록 좁아지는 것처럼, 퍼널분석에서도 많은 수의 고객이 유입되었다가 중간 중간 이탈되고, 결국에는 소수만 남는 모양새를 갖는다. 퍼널 분석의 3요소퍼널분석을 하기 위해서는 세가지의 요소가 필요하다.측정하려는 목표 설정목표까지의 단계 설정데이터 트레킹 툴 연동예시를 들면 다음과 같다.회원가입이 최종 목표라면, 각 퍼널은 사이트 방문 → 회원가입 페이지로 이동 → 가입완료 버튼 클릭이 될 수 있다.구매가 최종 목표라면, 각 퍼널은 사이트 방문  → 제품 페이지로 이동 → ..

데이터 분석/분석 방법론

코호트 분석, 리텐션

코호트코호트란 특정 기간 동안 공통된 특성이나 경험을 갖는 사용자 집단을 의미한다.중요한 것은 특정 기간 "+" 공통된 특성/ 경험이라는 것이다. 예를 들자면 아래와 같다.A학교에 입학한 사람 → 오로지 공통된 특성/경험만 존재 → 코호트 아님2024년도에 A학교에 입학한 사람 → 특정한 기간동안 공통된 특성이나 경험을 갖음 → 코호트근데 그냥 생각해봐도 특정한 기간이 없으면 코호트로 뭔 분석을 할 수가 없을 듯 뭐 학교가 한 오만년 역사다 이런거 아니면 1920년도에 입학한 사람이랑 2024년도에 입학한 사람이랑 입학했다는 이유만으로 묶으면..?🙄  코호트는 보통 특정 기간에, 특정 행동을 한 사용자 집단의 행동 변화를 보기 위해 사용하기에 비즈니스에서는 코호트를 아주 다양하게 정의한다.특정 날짜에 ..

데이터 분석/분석 방법론

RFM 분석

RFMRFM에서 R은 최근성(Recency), F는 구매 빈도 (Frequency), M은 구매액(Monetary)를 뜻하고이 세가지 지표(얼마나 최근에, 얼마나 자주, 얼마나 많이 구매)는 고객을 분류하고 고객의 가치를 측정하는데 활용된다.  RFM분석은 여러 산업에서 많이 쓰이지만, 산업에 따라 세가지 지표의 중요 정도는 다르다Recency : 백화점, 대형할인마트 등의 산업에서 중요 (*보험 같은 산업은 반대로 R이 약할수록 좋다)Frequency : 이동통신 등의 산업에서 중요Monetary : 은행, 명품관 등의 산업에서 중요 cf.RFM을 구한다고 해서 꼭 R,F,M을 다 쓰지 않아도 된다.어느 곳에서는 F, M만을 활용해서 고객 등급을 분류한다던가 도메인에 맞게끔 RFM을 유연하게 사용하면 ..

수학/선형대수학

Essence of Linear Algebra) 7. 역행렬, 열공간, 랭크, 영공간

연립선형방정식의 기하적 해석지수가 붙거나, 변수끼리 곱해져 있지 않고 단지 스케일되어 있는 각 변수가 더해져 있기만 한 연립선형방정식은 행렬-벡터의 곱셈의 형태와 유사하다 해당 표기법으로 기하적 해석에 접근해볼 수 있다행렬은 어떤 선형변환에 대응되기 때문에 방정식 Ax = v를 푸는 것은 변환 후 v가 되는 벡터 x를 구하는 것이다 방정식의 해를 생각하는 방법은, 변환으로 인해 공간 전체가 선이나 점 같은 하위차원으로 찌그러지는지 혹은, 여전히 2차원 전체를 생성하는지 여부에 좌우되는데,이는 행렬식이 0인지, 0이 아닌지 여부에 좌우된다는 것과 같다 (6강 참고) 역행렬; 0이 아닌 행렬식 (det(A) != 0)해당 경우, v에 도달하는 단 하나의 벡터가 존재하며 그 벡터는 변환을 거꾸로 돌리면 찾을 ..

수학/선형대수학

Essence of Algebra) 6. 행렬식

2x2 행렬의 행렬식$ \begin{bmatrix} 3 & 0 \\ 0 & 2 \\ \end{bmatrix}$ 행렬을, (1,0) 인 i 햇과 (0,1) 인 j햇을 선형변환한 것이라 생각하면 이 넒이 1*1의 정사각형은 변환 후 2*3인 직사각형이 된다.영역의 넓이가 원래 1에서 6이 되었으므로, 선형변환은 어떤 넓이를 6배 스케일 했다고 말할 수 있다. 선형변환으로 인해 어떤 스케일 인자만큼 넓이에 변화가 있을 때, 이 인자를 그 변환의 행렬식이라고 한다. 행렬식이 0인 경우는 상당히 중요한데, 행렬의 행렬식이 0인지 확인하면  해당 행렬에 해당하는 변환이, 차원 자체를 낮추는지 여부를 계산할 수 있기 때문이다 음수 행렬식이전까지의 설명은 양수일 때만 들어맞고, 음수일 때는 또 다른 경우가 생기는데 넓..

Tableau

막대차트 만들기

막대 차트는 가장 기본적인 데이터 시각화의 결과이고, 여러 범주의 데이터를 비교하기 위해서 사용한다측정값을 행 선반에, 차원을 열 선반에 배치하거나 반대로 배치하면 생성된다. 막대 차트 만들기1차 기준, 측정값 더블클릭2차 기준, 차원 더블클릭인사이트를 한눈에 얻기 위한 2차 작업 시행 (차트 정렬, 색상 추가, 레이블 추가 등) 1. 1차 기준인 매출을 더블 클릭해준다한 개의 막대 그래프가 생성됨 2. 2차 기준인 고객 세크먼트를 더블 클릭해준다매출이 고객 세그먼트 기준으로 나눠짐 3-1. 행과열 바꾸기를 눌러서 열과 행의 위치를 변경해준다 (+ 전체보기)3-2. 매출의 합계 기준으로 내림차순 해준다3-3. 마크의 레이블을 매출로 지정해준다3-4. 마크의 색상을 고객 세그먼트 or 매출로 지정해준다  ..

Tableau

측정값 vs 차원 / 불연속형 vs 연속형

측정값 vs 차원측정값과 차원은 임의로 변경해줄 수 있다 측정값일반적으로 숫자 형식 (= 연속형)액션 (drag-drop 또는 double-clik) 하면 집계를 통해 차트를 만든다 차원측정값으로 만들어진 차트를 어떻게 나눠서 볼 것인지를 결정한다 (=범주형)  측정값만 올린 것은 한개의 막대 그래프로 표현되지만, 차원을 올린 순간 분류가 생기는 것을 볼 수 있음  불연속형 vs 연속형 불연속형유한한 값 머리글을 표시한다파란색 알약으로 표현됨 연속형무한한 값 → 데이터가 쌓이면 쌓일 수록 계속 이어짐축을 표시한다초록색 알약으로 표현됨 * 막대 그래프의 경우불연속형 (고객 세그먼트) 로 색상을 지정한 경우는 유한한 값이기 때문에 분절된 값으로 색상이 지정됨을 볼 수 있고,연속형 (매출) 로 색상을 지정한 ..

- MJ -
'분류 전체보기' 카테고리의 글 목록 (5 Page)