销售情况分析主要是为了理解公司的销售组合,了解公司商品覆盖和价格优势的程度。
销售额数据特征:
count 4917.00
mean 3945.32
std 10659.12
min -126.00
25% 233.67
50% 1027.14
75% 3361.25
max 327813.65
Name: invoiceamount, dtype: float64
销售量数据特征:
count 4917.00
mean 2221.07
std 5581.90
min -27.00
25% 97.00
50% 565.00
75% 2033.00
max 108434.00
Name: quantity, dtype: float64
高收入商品销售额变动趋势:
热销商品销售量变动趋势:
分品种高收入商品销售额和热销商品销售量:
对销售情况的分析发现:
上述分析说明公司商品覆盖程度较高,价格优势强;但也表明公司发展受限于所处行业,商品开发尚有较大空间。公司可以通过开发高价值商品,淘汰低利润商品和调整定价策略提高收入及利润。鉴于商品销售存在明显的季节性,公司可以针对性调整库存管理和营销策略。例如在年末销售高峰期前通过销售预测调整库存,并在销售较慢的时期推出促销活动以提高库存周转。
并且我们注意到,高收入商品之间销售额差异明显,因而为这些产品量身定制的营销策略可能会提高它们的销售,公司可以在营销活动中强调这些产品的独特价值和优势。而热销商品之间销售量差异不显著,表明这些商品属于基础款,客户对它们有相似的兴趣水平,可以通过关联推荐让客户关注到这些商品,进一步提高销量。
销售趋势预测使用已有销售数据通过模型预测未来销售数据,提高供应稳定性。考虑到前述对销售数据的分析表明销售趋势存在明显的季节性,并且公司销售商品为礼品及礼品类商品,销售趋势的变动可能和节假日存在关系,因而我们采用能够包含上述因素的SARIMAX模型进行分析和预测。为增强分析针对性,销售趋势预测选取了在英国本土销售量最大的商品,预测其在数据集结束后未来1年内在英国本土的销售量。
我们首先确定模型的使用前提已经满足,然后将销售量最大商品的销售数据进行可视化,发现于每年年末销售量均出现明显峰值,且每年销售变动趋势总体类似,因而表明基础数据存在季节性周期,并将其长度确认为52周(1年)。构建模型过程中,我们首先将公共假期信息提前3周聚合至基础数据中,提前3周的原因为客户主要为需要较长周期备货的批发商,我们通过对比销售高峰和节假日的方式确定销售高峰通常在节假日前3周左右来临;我们将已有数据分为训练数据和测试数据,使用训练数据拟合最终使用的模型,并让模型对测试数据进行验证, 模型捕捉到销售高峰的到来,效果良好;我们使用模型进行未来销售情况预测,模型预测的销售量变动趋势符合预期。
最热销商品在英国销售量变动趋势:
确认最热销商品在英国销售量变动满足模型使用前提条件:
Results of Dickey-Fuller Test:
Test Statistic -3.513757
p-value 0.007641
#Lags Used 3.000000
Number of Observations Used 102.000000
Critical Value (1%) -3.496149
Critical Value (5%) -2.890321
Critical Value (10%) -2.582122
dtype: float64
调整后的节假日高峰与销售高峰吻合:
使用训练数据确定的模型参数:
best_pdq, best_seasonal_pdq
((0, 0, 0), (0, 1, 1, 52))
rmse
2910.5554852386963
使用模型对测试数据进行验证:
使用模型对未来期间销售量进行预测:
预测全过程展示:
预测结果表明,模型成功根据可获取信息捕捉到销售情况的变化趋势及整体体现的季节性。通过对未来销售量的预测,公司可以在预测的高峰期增加备货,提前准备物流资源,以提高供应稳定性。