데이터 분석

데이터 분석/데이터 분석을 해보자

이커머스 데이터) 3. 판매 데이터(EDA)

* 데이터는 교육 받으면서 사측에서 제공 받았습니다.  판매 데이터는 EDA 위주로 봐보았다판매 데이터에 해당하는 컬럼은 다음과 같다대분류명, 중분류명, 소분류명, 상품명주문 년도, 주문 월, 주문 시각, 주문 요일배송 기간해당 컬럼들을 EDA하여 인사이트를 도출해보고자 한다 판매 데이터 분석 (EDA)매출 추이먼저 매출 추이를 봐야할 거 같아, 월별 매출 그래프를 그려봤다.해당 그래프를 보니, 2021년 기점으로 매출이 한번 크게 튀는 것이 확인된다. 그 다음으로는 2022년 1월에 큰 매출 상승이 확인된다.  관련해서 그래프를 그려보니, 2021년에 가공식품군이 추가되었으며, 2022년에는 가공식품군의 비율이 더 커졌음을 알 수 있었다. 이를 보았을 떄, 고객이 선호하는 상품군을 추가하는 것이 매출에..

데이터 분석/데이터 분석을 해보자

이커머스 데이터) 2. 데이터 전처리

* 데이터는 교육 받으면서 사측에서 제공 받았습니다 데이터 전처리는 고민을,, 많이 해야하는 부분🧐  파생변수 생성1. 구매 개수 변수 생성df['개수'] = .transform('size')df.groupby(['고객ID', '주문/판매 ID', '주문일자', '상품코드', '배송일자', '가격'])['고객ID']고객이 같은 상품을 한번에 여러개 구매 하진 않았을까 해서 구매 개수 변수를 생성해보았지만, 모두 다 개수가 1개였다.2. 매출 변수 생성df['매출'] = df['개수'] * df['가격']개수가 다 1개임을 알아버려서 의미가 없긴 했지만..! 상품의 가격과 매출을 엄연히 다른 정보니까, 가격*개수 값이 가격과 같아도 매출이라도 따로 명명해줬다  주문일자에 대한 정보는 년-월-시각 다 따로..

데이터 분석/데이터 분석을 해보자

이커머스 데이터) 1. 데이터 파악

최근에 한 이커머스 데이터 분석!!그동안 했던 것들은 못 쓰더라도 (털썩,,,) 앞으로 하는 것들은 써봐야지!! * 데이터는 교육 받으면서 사측에서 제공 받았습니다데이터 불러오기일단, 데이터를 불러오기 전에 기본 라이브러리를 import 해줍시다import pandas as pdimport numpy as npimport seaborn as snsimport matplotlib.pyplot as pltimport matplotlibimport warningswarnings.filterwarnings(action='ignore')# 한글 깨짐 방지plt.rc('font', family='NanumBarunGothic')palette3 = sns.color_palette('mako', 10)!sudo apt..

데이터 분석/분석 방법론

퍼널분석

퍼널분석퍼널분석이란 유저들이 들어온 시점부터 설정한 목표를 달성할 때까지, 단계별 프로세스를 분석하는 방법이다.  퍼널분석은 이것처럼 깔때기 모양으로 시각화를 하는데, 퍼널(=Funnel)이 깔때기를 뜻한다고 한다.깔때기가 위에서 아래로 갈수록 좁아지는 것처럼, 퍼널분석에서도 많은 수의 고객이 유입되었다가 중간 중간 이탈되고, 결국에는 소수만 남는 모양새를 갖는다. 퍼널 분석의 3요소퍼널분석을 하기 위해서는 세가지의 요소가 필요하다.측정하려는 목표 설정목표까지의 단계 설정데이터 트레킹 툴 연동예시를 들면 다음과 같다.회원가입이 최종 목표라면, 각 퍼널은 사이트 방문 → 회원가입 페이지로 이동 → 가입완료 버튼 클릭이 될 수 있다.구매가 최종 목표라면, 각 퍼널은 사이트 방문  → 제품 페이지로 이동 → ..

데이터 분석/분석 방법론

코호트 분석, 리텐션

코호트코호트란 특정 기간 동안 공통된 특성이나 경험을 갖는 사용자 집단을 의미한다.중요한 것은 특정 기간 "+" 공통된 특성/ 경험이라는 것이다. 예를 들자면 아래와 같다.A학교에 입학한 사람 → 오로지 공통된 특성/경험만 존재 → 코호트 아님2024년도에 A학교에 입학한 사람 → 특정한 기간동안 공통된 특성이나 경험을 갖음 → 코호트근데 그냥 생각해봐도 특정한 기간이 없으면 코호트로 뭔 분석을 할 수가 없을 듯 뭐 학교가 한 오만년 역사다 이런거 아니면 1920년도에 입학한 사람이랑 2024년도에 입학한 사람이랑 입학했다는 이유만으로 묶으면..?🙄  코호트는 보통 특정 기간에, 특정 행동을 한 사용자 집단의 행동 변화를 보기 위해 사용하기에 비즈니스에서는 코호트를 아주 다양하게 정의한다.특정 날짜에 ..

데이터 분석/분석 방법론

RFM 분석

RFMRFM에서 R은 최근성(Recency), F는 구매 빈도 (Frequency), M은 구매액(Monetary)를 뜻하고이 세가지 지표(얼마나 최근에, 얼마나 자주, 얼마나 많이 구매)는 고객을 분류하고 고객의 가치를 측정하는데 활용된다.  RFM분석은 여러 산업에서 많이 쓰이지만, 산업에 따라 세가지 지표의 중요 정도는 다르다Recency : 백화점, 대형할인마트 등의 산업에서 중요 (*보험 같은 산업은 반대로 R이 약할수록 좋다)Frequency : 이동통신 등의 산업에서 중요Monetary : 은행, 명품관 등의 산업에서 중요 cf.RFM을 구한다고 해서 꼭 R,F,M을 다 쓰지 않아도 된다.어느 곳에서는 F, M만을 활용해서 고객 등급을 분류한다던가 도메인에 맞게끔 RFM을 유연하게 사용하면 ..

- MJ -
'데이터 분석' 카테고리의 글 목록 (2 Page)