Data analysis 3

[crm/데이터분석] 파이썬으로 구매연관성 분석하기

이번 글에서는 파이썬으로 직접 구매연관성 분석을 해보겠습니다. 구매연관성 분석이 뭔지, 마케팅에서 어떻게 활용되는 지에 대한 이야기는 별도 글로 작성해두었습니다. ▼ ▼ [crm/마케팅분석] 구매연관성 분석 어떻게 활용할까? https://ironyoo.tistory.com/10 *분석언어: 파이썬 *알고리즘: fpgrowth *데이터: (kaggle제공) transaction data 링크 Transaction Data Costumer segmentation www.kaggle.com 우선 필요한 라이브러리를 호출하고, 데이터 정제 작업을 해보겠습니다. #필요한 라이브러리 호출 import pandas as pd import numpy as np import datetime as dt #데이터 불러오기..

[crm/데이터분석] 파이썬으로 고객 클러스터링 분석하기

이번 글에서는 패션 플랫폼 구매데이터로 고객 클러스터링 분석을 진행해보겠습니다. 우선 간단히 고객 클러스터링 분석에 대해 설명하자면 "고객이 남긴 데이터(행동 or 구매)를 토대로 통계적 방식으로 유사성을 찾아내어 군집화한 것"이라 할 수 있습니다. 클러스터링 분석을 이야기할 때 군집화(clustering)와 세분화(segmentation) 차이에 대한 이야기가 꼭 나오는데요. 제가 세분화와 군집화를 구분하는 방식은 마케터가 수동적으로 기준을 구분할 수 있냐 없냐입니다. *세분화(segmentation): RFM 분석과 같이 마케터가 원하는 기준에 따라 수동으로 고객을 그룹화하는 것 *군집화(clustering): 통계적 방식으로 유사성을 파악하여 알고리즘에 의해 자동으로 고객이 그룹화되는 것 클러스터링..

[파이썬/오류] ValueError: time data "13-04-2018" doesn't match format "%m-%d-%Y"

[오류 메세지] ValueError: time data "13-04-2018" doesn't match format "%m-%d-%Y", at position 8. You might want to try: - passing `format` if your strings have a consistent format; - passing `format='ISO8601'` if your strings are all ISO8601 but not necessarily in exactly the same format; - passing `format='mixed'`, and the format will be inferred for each element individually. You might want to use ..