분류 전체보기

SQL/공부

9. Window Function

Window Functionwindow function은 전체 테이블이 아닌 분석하고 싶은 작은 테이블을 연산의 대상으로 삼는다 (어느 특정 컬럼 안에서 특정를 연산)* 전체 테이블에서도 사용 가능하지만, 보통의 경우 전체 테이블을 사용하고 싶으면 집계 함수를 바로 쓰는게 일반적윈도우 함수 지정 범위에게 윈도우 함수를 적용하겠다SELECT  WINDOW함수 (컬럼)  OVER  ( )                   윈도우 함수            ~에게                윈도우 함수 지정 범위* 부분은 생략 가능* OVER : 적용 대상을 정해줌행을 분할 : PARTITION BY            (Group By와 같은 역할)행을 정렬 : ORDER BY                 ..

데이터 분석/데이터 분석을 해보자

이커머스 데이터) 6. 연관분석 (장바구니 분석)

* 데이터는 교육 받으면서 사측에서 제공 받았습니다. 이커머스 데이터 분석의 마지막인 연관분석고객 정보를 확인하였을 때, 성별, 나이대가 구분되었고, 이를 연관분석에 활용하면 좋을 거 같다는 생각이 들었다.먼저, 같은 종류의 상품에 더해 같이 구매된 상품이 함께 노출되는게 좋을 거 같다 생각해 연관분석을 생각해봤다그릭요거트를 산다하면 그릭데이 그릭요거트! 이렇게 구매를 하지 그릭데이 그릭요거트 + 바이오 그릭요거트 + 상하목장 요거트 이런식으로 구매하는 사람은 없지 않을까 싶었다.따라서, 같은 종류의 상품을 추천하는 것은 사용자 편의성 면에서는 좋지만, 상품 추가 구매를 유도하는 건 어려울 거 같았고 연관분석의 필요성을 느낌그릭요거트 > 블루베리, 그래놀라 등으로 연관된 상품이 추천되면 상품 추가 구매 ..

데이터 분석/데이터 분석을 해보자

이커머스 데이터) 5. RFM 고객 세분화 분석

* 데이터는 교육 받으면서 사측에서 제공 받았습니다. RFM 고객 세분화 분석을 해봤다!분석 프로젝트를 하면서 느끼는건 개발이 코드와 싸움이라면 분석은 이렇게 기준을 잡아도 될까? 이게 적합한 비율일까? 등의 무한 고민어려웝🫠 이론 RFM 분석RFMRFM에서 R은 최근성(Recency), F는 구매 빈도 (Frequency), M은 구매액(Monetary)를 뜻하고이 세가지 지표(얼마나 최근에, 얼마나 자주, 얼마나 많이 구매)는 고객을 분류하고 고객의 가치를 측정하는데beigepepxi.tistory.com나의 블로그 재소환 그럼 분석으로 넘어가보겠습니다. RFM Recency현재로 부터 구매일자가 얼마나 지났나? 를 파악하기 위해, 고객별로 가장 최근 주문일자를 구해줬다.* 여기서 구한 최근 주문 ..

데이터 분석/데이터 분석을 해보자

이커머스 데이터) 4. 리텐션 측정 by 코호트 분석

* 데이터는 교육 받으면서 사측에서 제공 받았습니다. 고객 데이터 분석 시작이번에 고객 데이터 분석하면서 다양한 데이터 분석 방법론을 적용해볼 수 있어서 좋았다. 이론 코호트 분석, 리텐션코호트코호트란 특정 기간 동안 공통된 특성이나 경험을 갖는 사용자 집단을 의미한다.중요한 것은 특정 기간 "+" 공통된 특성/ 경험이라는 것이다. 예를 들자면 아래와 같다.A학교에 입학한 사beigepepxi.tistory.com나의 블로그 *^^* 공부 열심히 했어여 그럼 분석으로 넘어가보겠다 코호트 분석, 리텐션 측정고객별로 가장 처음 주문한 날짜를 추출첫 주문 날짜와 주문 월을 그룹화해서, 해당 그룹에 해당되는 고객 수 구함reset_index를 통해 인덱스를 열로 다시 받아오고, 컬럼명을 재지정 해줌해당 코드를 ..

데이터 분석/데이터 분석을 해보자

이커머스 데이터) 3. 판매 데이터(EDA)

* 데이터는 교육 받으면서 사측에서 제공 받았습니다.  판매 데이터는 EDA 위주로 봐보았다판매 데이터에 해당하는 컬럼은 다음과 같다대분류명, 중분류명, 소분류명, 상품명주문 년도, 주문 월, 주문 시각, 주문 요일배송 기간해당 컬럼들을 EDA하여 인사이트를 도출해보고자 한다 판매 데이터 분석 (EDA)매출 추이먼저 매출 추이를 봐야할 거 같아, 월별 매출 그래프를 그려봤다.해당 그래프를 보니, 2021년 기점으로 매출이 한번 크게 튀는 것이 확인된다. 그 다음으로는 2022년 1월에 큰 매출 상승이 확인된다.  관련해서 그래프를 그려보니, 2021년에 가공식품군이 추가되었으며, 2022년에는 가공식품군의 비율이 더 커졌음을 알 수 있었다. 이를 보았을 떄, 고객이 선호하는 상품군을 추가하는 것이 매출에..

데이터 분석/데이터 분석을 해보자

이커머스 데이터) 2. 데이터 전처리

* 데이터는 교육 받으면서 사측에서 제공 받았습니다 데이터 전처리는 고민을,, 많이 해야하는 부분🧐  파생변수 생성1. 구매 개수 변수 생성df['개수'] = .transform('size')df.groupby(['고객ID', '주문/판매 ID', '주문일자', '상품코드', '배송일자', '가격'])['고객ID']고객이 같은 상품을 한번에 여러개 구매 하진 않았을까 해서 구매 개수 변수를 생성해보았지만, 모두 다 개수가 1개였다.2. 매출 변수 생성df['매출'] = df['개수'] * df['가격']개수가 다 1개임을 알아버려서 의미가 없긴 했지만..! 상품의 가격과 매출을 엄연히 다른 정보니까, 가격*개수 값이 가격과 같아도 매출이라도 따로 명명해줬다  주문일자에 대한 정보는 년-월-시각 다 따로..

데이터 분석/데이터 분석을 해보자

이커머스 데이터) 1. 데이터 파악

최근에 한 이커머스 데이터 분석!!그동안 했던 것들은 못 쓰더라도 (털썩,,,) 앞으로 하는 것들은 써봐야지!! * 데이터는 교육 받으면서 사측에서 제공 받았습니다데이터 불러오기일단, 데이터를 불러오기 전에 기본 라이브러리를 import 해줍시다import pandas as pdimport numpy as npimport seaborn as snsimport matplotlib.pyplot as pltimport matplotlibimport warningswarnings.filterwarnings(action='ignore')# 한글 깨짐 방지plt.rc('font', family='NanumBarunGothic')palette3 = sns.color_palette('mako', 10)!sudo apt..

데이터 분석/분석 방법론

퍼널분석

퍼널분석퍼널분석이란 유저들이 들어온 시점부터 설정한 목표를 달성할 때까지, 단계별 프로세스를 분석하는 방법이다.  퍼널분석은 이것처럼 깔때기 모양으로 시각화를 하는데, 퍼널(=Funnel)이 깔때기를 뜻한다고 한다.깔때기가 위에서 아래로 갈수록 좁아지는 것처럼, 퍼널분석에서도 많은 수의 고객이 유입되었다가 중간 중간 이탈되고, 결국에는 소수만 남는 모양새를 갖는다. 퍼널 분석의 3요소퍼널분석을 하기 위해서는 세가지의 요소가 필요하다.측정하려는 목표 설정목표까지의 단계 설정데이터 트레킹 툴 연동예시를 들면 다음과 같다.회원가입이 최종 목표라면, 각 퍼널은 사이트 방문 → 회원가입 페이지로 이동 → 가입완료 버튼 클릭이 될 수 있다.구매가 최종 목표라면, 각 퍼널은 사이트 방문  → 제품 페이지로 이동 → ..

- MJ -
'분류 전체보기' 카테고리의 글 목록 (6 Page)