(客户管理)谁是最好的客户
谁是最好的客户?
使用SPSS从营销数据库中获得更多信息
备注:这是壹篇思路非常清晰的市场挖掘方面的文章,主要侧重于从统计的角度来见待数据挖掘,而不是侧重于从机器学习的角度。非常适合具有统计背景的人员迅速切入数据挖掘领域。美中不足的是没有给出具体的数据这样我们不能按图索骥地将文章中介绍的方法操作壹遍。网上也流传壹篇由SPSS北京办事处翻译的pdf版,但我觉得仍是原来的英文版讲得详细点。欢迎前来交流营销和数据挖掘MSN:mktexchage@hotmail.com。
摘要
本文使用SPSS的频数分析、描述性分析、缺失值分析、方差分析、卡方检验、交叉表、 均值比较、关联分析、线性回归、决策树等统计方法及饼状图、条形图、箱图、散点图、 树形图等图表对壹个客户数据案例进行分析,以发现不同客户群体的特征,为市场推广活 动提供依据。
关键词
市场,细分,客户,统计,分析,比较
谁是最好的客户?任何行业专业人士——市场人员,销售经理,产品开发者和服务专家——均乐意回答这个问题。
于当今激烈的市场中,开发,吸引和保留客户越来越困难同时也越来越昂贵。由于这些压力,更多的组织使用营销数据库最大化他们现有的客户价值。转换客户数据为知识和信息的行为是壹个有力的手段和企业生存的壹项必需的技能。
理解客户的固有特征能够给你有价值的发现。了解最有价值或至少有利润的客户,他们的购买方式,购买行为和人口统计特征是制订营销计划的关键。较好地理解客户是什么能够帮助你开发忠诚的,有持续回报的客户,制订提升销售和交叉销售及营销定位计划。集思广益的决策也是
广告,促销,直接邮寄活动和其他营销成功的基础。
有许多方式能够确定最佳客户的特征,也有许多方法可用来度量这些特征。本文说明使用SPSS实现客户分析的壹种方法。 案例营销数据库中包含2000个客户和下列数据:
首次成为公司客户的日期 购买历史
不同促销方案的响应率 家庭收入 地区
性别和其它人口统计数据
本文中我们从数据库中析取可控信息,使用各种数据分析技术,从初级的到高级的,目标是依据过去的销售额用人口统计数据来识别不同的细分客户群。
即使最普通的过程产生的结果对怎样理解客户也能够产生深刻的含意。不要低估这些方法。用灵活和有力的分析工具结合你的业务背景是从数据中获得有价值信息的最好方法。 首先探索:典型客户是什么样的?
我们通过从数据库中探索不同的变量来回答这样的问题:
客户住于哪里?于三个销售区域中客户的分布如何? 客户的平均收入是多少? 成为公司客户的时间有多长?
对不同的促销方案,客户平均响应是多少?有多少人响应第壹促销方案?
客户花费是多少?
SPSS提供了能够迅速回答之上问题的几种分析方法,频数和描述性分析过程能够提供对客户数据的初步印象。
从图1饼状图中能够见出,东部地区所占比例最大(34%,西部地区最小
(19%,而有16.9%的数据未列出所属地区。
图1和表1。SPSS自动形成的图表显示最多的客户(34%)生活于东部地区。
频数和描述过程非常适合对数据进行原始整理,可能于分析中许多想法均要用这种方法实现。
分析客户住居于哪里帮助我们确定销售版图。频数过程提供分类变量计数和百分比表,同时可用条图,直方图和饼图表示数据。SPSS自动地呈现这些表和图的结果。
从分析中我们能够认识到什么证明是重要的。饼图和表1显示最大的客户群(34%)生活于东部地区,最小的客户群(19%)生活于西部地区。且且有16.9%的客户于数据库中没有列出居住区域。
SPSS用特殊的处理表示缺失数据。知道何时为什么信息缺失很有必要。例如,你可能想区别是因为它们没有涉及而缺失仍是因为它们难以获得而缺失。表1中,“百分数”包括缺失数据,“有效百分数”从计算中排出了缺失数据,能够从表上迅速且行比较缺失数据怎样影响结果的。 要得到家庭收入的信息,我们需要几个基本的统计量作为最初描述统计量。如平均值,最小和最大值,或连续变量,如以美元为单位的收入和以年数为单位的年龄。描述过程为我们提供了壹系列汇总统计量。从表2能够见到于2000个客户中家庭收入的平均值大约是$61,000,大部分收入范围于$50,000和$72,000之间。
表2.描述过程显示平均家庭收入大约是$61,000. 要回答“成为公司客户的时间有多长?”的问题,我们必须处理壹个字段然后计算每个时间周期的客户数。因为数据库包含第壹次成为公司客户的日期,首先计算壹个新变量:作为客户的时长。使用SPSS中提供的众多的时间函数,能够轻而易举地用年数转换成日期计算客户的时长。计算这个新变量后,用时长的频数表来表示客户存于时间。 表3.频数表显示51%的客户存于超过7年。
从表3见出大约有29%的客户存于10年之上,差不多有过半数的客户于7年之上。接下来,我们要问“谁消费最多?”,最好的客户理所当然是最有利润的客户,或为组织花费最多的客户。
为了得到准确的客户生命周期价值,结合前期购买和客户行为建立预测模型预测未来购买。
本例中,我们开始用总订单金额代替每个客户。首先,建立壹个新变量,对数据库中每个订单金额(订单1的金额,订单2的金额等等)求和。因为总订单金额是连续变量,直方图是显示结果的最有效的方法。 图2.从直方图能够见出大部分客户消费低于$500,少数几个客户消费量比较大。
直方图的直条代表壹个数据范围。于图2中大部分客户消费低于$500,少数几个客户消费量比较大。每个客户平均消费量是$1,360,很少有客户消费量超过$7,000。
当目前为止,我们知道典型的客户是:
生活于东部
家庭平均收入为$61,000 有七年购物历史
于公司产品和服务上消费$1,360 客户对不同的促销有怎样的响应?
进行促销分析是理解客户的另壹个重要步骤。评估营销计划和促销帮助分辨能够做什么能够不做什么。它准确地告诉我们何时及为什么某个计划成功,所以你能够拷贝你的成功经验和学习失败的经验。
要回答“每种促销有多少人响应?”和“不同的促销平均响应是多少?”的问题,能够对每种促销响应运行频数分析过程和对四种促销的订单运行描述分析过程。
表4.大约有45%,或890人对第壹促销方案有响应。
于表4中,有890人,或大约45%的客户响应第壹促销方案。对其它促销
进行类似的分析,第二促销方案的响应率是39%,第三促销方案的响应率是37.4%,第四促销方案的响应率是17.4%。
这里出现壹个新问题:于第四促销方案中唯壹的特征是它较成功的获得客户响应的原因吗?换句话说,这种结果有意义吗?购买历史(表5)信息显示第三促销方案的平均值是$294,低于其它促销方案。这种差别是否有统计意义仍需进壹步分析来确定。
表5.购买历史分析显示第三促销方案的平均值是$294,低于其它促销方案。
进壹步分析:我们的客户怎样不同?怎样相似?
既然对客户和各种促销的成功有壹个基本的理解,通过观察俩个或多个变量立刻支持这种有力的分析。SPSS帮助发现用别的方式难于发现的潜于关系。例如,已经知道客户于各区域分布和有多少客户响应第壹促销方案。接下来要观察各区域响应第壹促销方案的客户有多少。通过研究回答这些问题:
每个地区客户生命周期平均是多少? 各区域人们怎样响应第壹促销方案?
SPSS