데이터 분석/데이터 분석을 해보자

소소하게 해보는 데이터 분석
데이터 분석/데이터 분석을 해보자

eCommerce Events History) 4. 시각화

eCommerce Events HistoryeCommerce Events Historypublic.tableau.com 그나저나 태블로 평가판 만료되어서 처음 퍼블릭으로 만들어봤는데 우왓 대따 느리다! 시간이 2배로 걸려~

데이터 분석/데이터 분석을 해보자

eCommerce Events History) 3. Funnel 분석

데이터 eCommerce Events History in Cosmetics ShopThis dataset contains 20M users' events from eCommerce websitewww.kaggle.com 캐글에 2019년 11월 ~ 2020년 2월까지의 데이터가 올라와 있는데 데이터 양이 너무 많아서 2020년 2월 데이터만 사용했다.Funnel 분석데이터를 보면 user_session과 event_type, event_time이 존재하기에 Funnel 분석을 해보려고 함! 개념 참고 퍼널분석퍼널분석퍼널분석이란 유저들이 들어온 시점부터 설정한 목표를 달성할 때까지, 단계별 프로세스를 분석하는 방법이다.  퍼널분석은 이것처럼 깔때기 모양으로 시각화를 하는데, 퍼널(=Funnel)beigep..

데이터 분석/데이터 분석을 해보자

eCommerce Events History) 2. Active User

데이터 eCommerce Events History in Cosmetics ShopThis dataset contains 20M users' events from eCommerce websitewww.kaggle.com 캐글에 2019년 11월 ~ 2020년 2월까지의 데이터가 올라와 있는데 데이터 양이 너무 많아서 2020년 2월 데이터만 사용했다.Active User데이터를 보면 event_time과 user_id가 존재하기에 활성 고객 수를 구해봐야겠다고 생각했다. 1. 2020년 2월 데이터만 사용했기 때문에 Daily Active User, 즉 DAU를 구해 2월의 일간 활성 사용자 수를 구해보고자 했다.2. (분석에 사용하진 않았지만) 캐글에 2019 11월 ~ 2020년 2월까지 데이터가 존..

데이터 분석/데이터 분석을 해보자

eCommerce Events History) 1. 데이터 전처리

데이터 eCommerce Events History in Cosmetics ShopThis dataset contains 20M users' events from eCommerce websitewww.kaggle.com캐글에 2019년 11월 ~ 2020년 2월까지의 데이터가 올라와 있는데 데이터 양이 너무 많아서 2020년 2월 데이터만 사용했다.데이터 확인user_id와 user_session이 있다. user_session은 해당 사이트에 접속하면 생기는 것이고, user_id는 사용자 고윳값이다.      (만약 심심해서 어떤 사이트에 접속했다 나갔다를 반복한다면 user_session은 접속할 때마다 생성되는 것임)     따라서, user_id가 하나여도 user_session은 여러개가 존재..

데이터 분석/데이터 분석을 해보자

이커머스 데이터) 7.시각화

새벽배송새벽배송public.tableau.com 분석 내용을 기반으로 태블로로 시각화를 해보았다. (새벽배송은 구냥 제가 한번 이름 붙여봤습니다 하하 )  * 태블로에서 확장 프로그램으로 Sunburst 차트 넣어줬는데 아쉽게 퍼블릭에서는 지원을 안해준다..

데이터 분석/데이터 분석을 해보자

이커머스 데이터) 6. 연관분석 (장바구니 분석)

* 데이터는 교육 받으면서 사측에서 제공 받았습니다. 이커머스 데이터 분석의 마지막인 연관분석고객 정보를 확인하였을 때, 성별, 나이대가 구분되었고, 이를 연관분석에 활용하면 좋을 거 같다는 생각이 들었다.먼저, 같은 종류의 상품에 더해 같이 구매된 상품이 함께 노출되는게 좋을 거 같다 생각해 연관분석을 생각해봤다그릭요거트를 산다하면 그릭데이 그릭요거트! 이렇게 구매를 하지 그릭데이 그릭요거트 + 바이오 그릭요거트 + 상하목장 요거트 이런식으로 구매하는 사람은 없지 않을까 싶었다.따라서, 같은 종류의 상품을 추천하는 것은 사용자 편의성 면에서는 좋지만, 상품 추가 구매를 유도하는 건 어려울 거 같았고 연관분석의 필요성을 느낌그릭요거트 > 블루베리, 그래놀라 등으로 연관된 상품이 추천되면 상품 추가 구매 ..

데이터 분석/데이터 분석을 해보자

이커머스 데이터) 5. RFM 고객 세분화 분석

* 데이터는 교육 받으면서 사측에서 제공 받았습니다. RFM 고객 세분화 분석을 해봤다!분석 프로젝트를 하면서 느끼는건 개발이 코드와 싸움이라면 분석은 이렇게 기준을 잡아도 될까? 이게 적합한 비율일까? 등의 무한 고민어려웝🫠 이론 RFM 분석RFMRFM에서 R은 최근성(Recency), F는 구매 빈도 (Frequency), M은 구매액(Monetary)를 뜻하고이 세가지 지표(얼마나 최근에, 얼마나 자주, 얼마나 많이 구매)는 고객을 분류하고 고객의 가치를 측정하는데beigepepxi.tistory.com나의 블로그 재소환 그럼 분석으로 넘어가보겠습니다. RFM Recency현재로 부터 구매일자가 얼마나 지났나? 를 파악하기 위해, 고객별로 가장 최근 주문일자를 구해줬다.* 여기서 구한 최근 주문 ..

데이터 분석/데이터 분석을 해보자

이커머스 데이터) 4. 리텐션 측정 by 코호트 분석

* 데이터는 교육 받으면서 사측에서 제공 받았습니다. 고객 데이터 분석 시작이번에 고객 데이터 분석하면서 다양한 데이터 분석 방법론을 적용해볼 수 있어서 좋았다. 이론 코호트 분석, 리텐션코호트코호트란 특정 기간 동안 공통된 특성이나 경험을 갖는 사용자 집단을 의미한다.중요한 것은 특정 기간 "+" 공통된 특성/ 경험이라는 것이다. 예를 들자면 아래와 같다.A학교에 입학한 사beigepepxi.tistory.com나의 블로그 *^^* 공부 열심히 했어여 그럼 분석으로 넘어가보겠다 코호트 분석, 리텐션 측정고객별로 가장 처음 주문한 날짜를 추출첫 주문 날짜와 주문 월을 그룹화해서, 해당 그룹에 해당되는 고객 수 구함reset_index를 통해 인덱스를 열로 다시 받아오고, 컬럼명을 재지정 해줌해당 코드를 ..

- MJ -
'데이터 분석/데이터 분석을 해보자' 카테고리의 글 목록