project-white

数据建模方法

根据探索性数据分析的结果,需建立如下模型:

  1. RFM模型(客户分析中的客户价值分析) RFM模型将每个客户按照R(客户最近一次购买日期与当前日期差值),F(总的购买次数),M(购买的总金额)三个维度分类以识别高价值客户,然后将R值、F值和M值的高低进行分段,并赋予分值,最后将RFM三个分数相加,得到每个客户的RFM总分。针对已有数据集,由于其中包含退货订单,因而我们将数据集分为正常交易和退货交易。正常交易按照前述维度将客户分类后赋分,识别不同类型客户;退货交易则按照高频退货,大额退货和近期退货的维度进行分类后赋分,识别不同类型客户。
  2. Cohort模型(客户分析中的客户流失预测) Cohort模型将拥有类似特征的客户识别为一个群体,观察其随时间的变动情况。本次分析中,我们将每月新增客户识别为一个群体,然后按月度时间单位分析新增客户的后续购买情况,以在时间推移下了解客户的留存度,进而预测客户的流失。
  3. SARIMAX模型(商品分析中的销售趋势预测) SARIMAX 模型的作用为根据数据的过去值“解释”给定的具有季节性和外生变量的时间序列。在本次分析中,我们通过模型拟合商品销售的时间序列。由于探索性数据分析阶段已表明商品销售可能存在季节性,并且商品销售可能和节假日相关,因而我们向模型添加季节性周期长度,选择节假日作为外生变量,选择最佳参数以拟合历史销售量,进而预测数据集结束后12个月内的销售量。