* 데이터는 교육 받으면서 사측에서 제공 받았습니다.
이커머스 데이터 분석의 마지막인 연관분석
고객 정보를 확인하였을 때, 성별, 나이대가 구분되었고, 이를 연관분석에 활용하면 좋을 거 같다는 생각이 들었다.
- 먼저, 같은 종류의 상품에 더해 같이 구매된 상품이 함께 노출되는게 좋을 거 같다 생각해 연관분석을 생각해봤다
- 그릭요거트를 산다하면 그릭데이 그릭요거트! 이렇게 구매를 하지
그릭데이 그릭요거트 + 바이오 그릭요거트 + 상하목장 요거트 이런식으로 구매하는 사람은 없지 않을까 싶었다. - 따라서, 같은 종류의 상품을 추천하는 것은 사용자 편의성 면에서는 좋지만, 상품 추가 구매를 유도하는 건 어려울 거 같았고 연관분석의 필요성을 느낌
- 그릭요거트 > 블루베리, 그래놀라 등으로 연관된 상품이 추천되면 상품 추가 구매 효과가 나타날 것으로 기대
- 그릭요거트를 산다하면 그릭데이 그릭요거트! 이렇게 구매를 하지
- 이에 더해 연관분석을 진행할 시, 60대 남성 고객과 20대 여성 고객이 관심을 가지고 같이 구매하는 상품에 차이가 존재할 것이라 생각했다.
따라서, 해당 고객과 성별과 나이가 같은 고객군이 같이 구매하는 상품을 추천하는 것으로 연관분석을 진행해 보았다.
그럼 연관분석 시작!!
이론
연관분석
- 20대 여성, 30대 여성, 40대 여성, 50대 이상 여성
- 20대 남성, 30대 남성, 40대 남성, 50대 이상 남성
이렇게 나눠서 연관분석을 모두 진행해보았고, 대표적으로 30대 여성에 대한 연관 분석 결과만 써보고자 한다.
apriori 함수를 사용했고, lift가 1.1 이상이어야지 양의 상관성이 있다는 뜻이기에 그렇게 조건값을 설정했다.
하지만, 화면을 생각해봤을 때, 냉동만두에 관련해서 연관성이 높은 상품부터 쫙 떠야 용이할 것이라 생각해 데이터 프레임을 재조정함!
이런식으로 데이터에 있는 모든 상품에 대해, 함께 구매되는 상품을 출력했다.
이런 결과를 통해 아래와 같이 다양한 타 상품군을 추가로 추천할 수 있을 것이라 생각한다.
인사이트 정리
- 연관분석을 통해 다른 상품에 대한 추가 구매를 유도할 수 있음
- 성별, 연령대를 묶음으로서 추천의 연관을 더 높일 수 있을 것으로 생각