R结合分析初学者指南

conjoint

 

http://www.analyticsvidhya.com/blog/2015/12/beginner-tutorial-conjoint-analysis/


 

概述

品牌已经变得智能化。他们现在可以清楚地意识到客户喜好。数据真了不起!它几乎揭示了客户过往做过的一切。但是,实现这些里程碑并不是数据本身,还需要数据科学家的专门知识和理解。

分析在市场研究领域的使用尤其突出。让我们举一个例子来理解市场分析。

一家电信公司有不同产品客户的用户信息和交易数据。为设计一个新产品的广告预算是有限的。在这样的条件下,基于历史消费找到感兴趣的客户群对公司来说变得越来越重要。

有一种方法不仅预算友好,还能弄清新设计产品的价值。该方法不做他想,正是结合分析。什么是结合分析?

结合分析是一种广泛使用的市场研究思想,用于预测不同产品特性下的客户行为。它用于研究类似价格、颜色、易用性、功能等属性之间的权衡(tradeoff),识别重要的产品特性。

著名的蓝海战略描述了如何通过添加关键属性和提升客户购买周期构建产品。无论是带来iPod,iPhone的苹果,还是重新定义看电视方式的三星,每个品牌都在某个时间点使用它。

结合分析可以用于任何产品,包括电视、智能手机、汽车、耐用消费品以及更多。

让我们用笔记本电脑做一个例子。笔记本电脑可以是不同水平的内存大小(2G,4G或8G)、硬盘容量(500G、1T、2T或4T)、屏幕(全高清屏幕、触摸屏或普通屏幕)、外接设备(有DVD光驱或无DVD光驱)、HDMI端口数量(2个、3个或4个)、电池时长(10小时、15小时或20小时)、重量(1公斤或1.5公斤)和价格(50000印度卢比、70000印度卢比或120000印度卢比)。在这里,我们可以使用结合分析找出刺激用户购买行为的最佳特征集合。

结合分析的实施过程

这个过程既简单又复杂。

在找到可能特征列表(例如笔记本电脑)后,根据调查所需的分析类型生成轮廓。

全轮廓要求被访者根据他们的选择和效用对每个属性打分(或排序)。另外,被访者可以通过选择两个特征之一给出逐对评分,这就是所谓的自适应结合分析(ACA)。

一旦评分过程完成,每个水平作为自变量,评分/排序作为因变量执行结合分析(线性回归的一个变种)。回归系数作为成分效用值计算。

算出选择每种产品的被访者之后,就可以估计潜在市场份额。这也被称作偏好份额。它不包含分销或促销影响的方面。该输出可进一步用于计算市场份额和设计营销活动。此外,也可以用于细分分析(聚类和紧接着的判别分析),感知图和使用决策树或随机森林的目标市场定位。

使用R的案例

Kirin在决定新啤酒轮廓时遇到多种挑战。

一系列问卷调查被实施,其中包括结合分析数据收集任务,后续还用电话收集了被访者对不同进口新啤酒组合的偏好。为此,研究者决定使用结合分析。

除了对客户偏好过程的假设,结合数据产生比传统属性评分更真实的客户偏好解释。在此过程中,结合分析假定两点:

1.客户可以用一个属性的水平补偿另一个属性的水平。例如:啤酒的产地可以用味道补偿。

2.另一个假设是:产品的总效用由一组属性确定,表示为数据中每个属性效用值(或者说成分效用)的总和。

为了验证,在客户中进行了一次电话调查,被访者被要求对列在卡片上的进口啤酒按喜好排序。下面是Kirin使用的结合分析模型。

该结合分析基于进口啤酒的7个不同属性,每个属性有三个水平。

结合分析结果用于模拟客户偏好,为销量预测模型估计市场份额。由于结合数据在个体层面收集,可以用各种模型预测客户喜欢的品牌。

下面是构建结合分析模型的步骤:

步骤1:仔细考虑设计产品轮廓。因为我们只需要21个参数,我们使用21张卡片的部分析因法。

1

步骤2:载入包含水平的文件(或者设计一个水平名称构成的矩阵)。载入来自调查的偏好文件。

水平文件包含在步骤1中设计的属性的所有水平。

2
在第二个文件中,我们有317个被访者的偏好,遍及步骤1中定义的21个属性,每名被访者对每个属性/轮廓均进行评分。

3

步骤3:执行结合分析,使用:

Conjoint(偏好矩阵, 设计矩阵, 水平名称矩阵)

输出的第一部分会给出一个详细的模型,包含每个水平的回归系数。要得到产品属性每个水平的详细成分效用,我们需要查看下面输出的第一部分。由于每个属性都有一个水平被视为哑变量,在回归模型的输出中只能看到两个水平。然而,在成分效用中我们可以看到每个水平的效用值。

属性的所有水平效用和将会是0,而平均重要性的和是100。

4
5

26

25

29

30

步骤4:为得到7个属性中每一个的重要性,可以使用:

*caImportance(偏好矩阵,设计矩阵)

6

步骤5:这里我们将得到317名被访者每人的成分效用,以及最前面的截距。

7


步骤6:也可以用K-Means中聚类图的plotcluster()函数绘制被访者的聚类图。

8
35
现在试试找出一个新产品的总效用:

9
总效用 + 截距 = -1.73 + 7.0956 = 5.36

结束语

希望你能得到对结合分析应用更深入的了解。几乎每一家公司都利用这种技术在有限预算下完成更多。毕竟它是产品设计中广泛使用的最有效方法。

在本篇文章中,我们讨论了结合分析。它可能对初学者来说有一点难于理解。因此,我加入了一些例子和案例用于解释R中的这一技术。

微信公共号