电子商务统计意义导论

条形图:统计显著性

你正在考虑改变你的电子商务定价策略,基于一种预感,如果你对每件产品收取更低的费用,你的销量将上升到足以提高你的收入。但你需要一些数据来支持这种预感。所以你决定调查你的一些顾客,许多人说他们会以更低的价格买更多的东西。

现在,您遇到了以下问题:您的客户样本中的这些回答适用于所有客户的可能性有多大?这种可能性被称为统计显著性,这种信息可以帮助企业做出明智的决策。

什么是统计显著性?

统计显著性是指数据集中一个明显的模式不太可能是随机发生的,或者是偶然发生的。例如,如果您正在分析销售数据的趋势,并且您注意到您的产品在特定人群中非常受欢迎,那么您可能会继续证明您的发现具有统计意义,以确保它不是抽样错误的结果。

如果你有所有的数据,就不需要统计显著性了,而这几乎是不可能收集到的。例如,询问1.7亿美国注册选民在总统选举中打算如何投票,成本太高,耗时也太长。然而,1000名选民的随机抽样应该能让我们对其余人口实际将如何投票有一个有意义的了解。

电子商务的统计意义

电子商务公司在权衡诸如引入新产品或服务、营销策略或操作流程变更等决策时,可以使用显著性检验。ob欧宝娱乐app下载地址

例如,统计显著性检验可以帮助在线公司确定某些员工的弹性工作时间是否比固定工作周更能提高生产率。

为了验证这个想法,该公司决定随机挑选100名销售人员,让他们实行弹性工作时间(自变量),并告诉他们可以选择最适合自己的天数和时间来工作。与此同时,另外100名随机选择的员工,被称为对照组,按照固定的周一至周五的时间表工作。

一个月后,公司分析这100名弹性工作制销售人员的产出,看看完成的销售额是否有任何变化。如果该组的人均销售额(因变量)超过了对照组的产量,公司可以使用统计显著性检验来确定弹性工作制是销售额增长背后的可能性。

什么是假设检验?

假设检验是关于确定两个变量之间是否存在关系,称为因变量和自变量。它从一个假设开始,即因变量受自变量影响的理论。例如,一家运动服装在线销售商的研究人员假设,社交媒体广告(自变量)的增加将通过点击这些广告(因变量)产生更多的即时购买。

目标是找出一个被提议的解释是否可以接受,以及有多大的信心可以接受它。95%的置信水平通常被用作建立统计显著性的阈值。科学样本测试可能会设定更严格的置信水平,比如99%,而在商业和经济等其他领域的研究可能会接受更低的置信水平。

如果检验不能产生统计显著性水平,就意味着研究人员必须接受相反的假设,即零假设,或者说是因变量表现背后的巧合或偶然。

7步检验建立统计显著性

  1. 确定要测试的内容
  2. 陈述你的假设
  3. 确定显著性水平或p值
  4. 选择样品的类型和尺寸
  5. 收集数据
  6. 计算结果
  7. 意义强吗?

建立统计显著性需要以下七个步骤。

1.确定要测试的内容

例如,你的在线运动服装零售业务想要在Facebook和Instagram等社交媒体上尝试一种新的广告活动,看看与目前使用的广告相比,它是否能产生更多的产品销售。你计划运行新的和当前的广告,然后跟踪购物者的在线行为。

2.陈述你的假设

这是你对将要发生的事情的有根据的猜测。例如,假设可能是新广告会影响更多的人在观看后进行购买。

3.确定显著性水平或p值

这个误差概率称为p值。如果你将p值设置为0.05或5%,这就意味着零假设(即点击新广告与增加或减少产品购买之间没有关系)的概率不应超过5%。换句话说,你想要95%的置信度相信这两个变量有统计上显著的关系。

例如,一个不那么严格的测试可能会设置p值为0.1或10%,相应的置信度为90%。

4.选择样品的类型和尺寸

这家在线运动服装零售商对现有的在线广告和新广告进行了为期三天的测试,随机跟踪了500名在线购物者。

5.收集数据

在本例中,您的运动服装零售业务将跟踪每个广告的浏览量,这些广告转化为在线产品购买。

6.计算结果

然后,分析转向各种统计方程,如标准误差和标准偏差,这是测量或估计样本数据从平均值或中位数变化的方法。各种在线计算器可以处理这些数字(人工计算既费时又复杂)。

7.意义强吗?

判断显著性水平是否足以支持决策。在上面的例子中,如果结果显示新广告有95%的可能性导致顾客购买,那么零售商应该采用新的社交媒体广告活动。

统计显著性检验的局限性

统计显著性测试并不精确,需要注意两点。

首先,样本总体应反映总体情况,随机选取;否则,这就是研究人员所说的有偏样本。例如,在纽约或加州对1,000名可能的选民进行的关于总统选举的调查可能存在偏见,因为在这些州,民主党选民的数量远远超过共和党选民,而且调查结果无法准确地推断到美国其他地区。

其次,统计检验决定了变量之间关系的概率,而不是确定性。95%的置信水平意味着仍有5%的概率结果是错误的。研究人员可能会错误地发现没有统计显著性;这样的结果被称为假阳性。或者,如果研究人员发现没有显著的关系,那么这是一个假阴性。

统计意义

统计显著性和实际显著性的区别是什么?

统计显著性表示变量之间关系的概率,而不是关系的大小。实际意义是关于自变量对因变量的影响是否足够大,在现实世界的意义上,促使变化,如开展新的在线广告活动或实施新的溢价定价策略。

什么是统计显著性检验中的I型(假阳性)和II型(假阴性)错误?

研究人员应该意识到,统计显著性测试有出错的风险。可能出现两种类型的基本错误之一。类型1的错误被称为假阳性结果——测试发现了统计上的显著性,而实际上没有任何显著性。在这种情况下,研究者应该接受零假设。类型2错误是假阴性——测试发现变量之间没有统计上显著的关系,而实际上有一个。

统计显著性是否适用于所有类型的数据?

几乎所有类型的数据都可以分析统计意义,无论是政治、科学、医学、经济还是金融。在显著性检验中分析的最常见的数据形式是二元数据,例如对民意测验的简单的是-否回答,以及离散或计数数据,例如在线广告的点击次数。第三种形式,称为连续数据,是关于一个范围的值,而不是特定的二进制或计数值。例如,一项关于消费者在超市消费的研究可能会根据购物者在商店停留的时间长短进行跟踪。ob欧宝娱乐app下载地址

样本量如何影响统计显著性?

样本大小是显著性检验获得可靠结果的关键因素。一般来说,较大的样本可以提高确定统计显著结果的几率。样本越小,产生假阳性或假阴性结果的风险越高。然而,样本可能太大了。追踪更大的样本需要更多的时间和金钱,而且可靠性可能不会提高。

主题: