使用假设检验时,我们使用四个主要步骤:
A / B测试最重要的部分是有很强的假设。 因此,在这里,我已经讨论了如何制定强有力的seo假设。
1.形成假设
帮助提出假设的三种机制
现在我们需要记住,使用SEO,我们试图影响三件事以增加自然流量。
您也可能会同时影响所有这三个方面。 但是,您只想确保其中之一明确成为目标,否则就不是真正的SEO测试。
2.收集数据
接下来,我们收集数据。使用ODN平台,我们进行了A / B测试,并将页面分为统计上相似的存储桶。
使用控件和变体进行A / B测试
因此,一旦执行了此操作,我们将使用变量组,然后使用数学分析来确定如果不进行更改,我们认为变量组会做什么。
所以在这里,我们有黑线,那就是这样做的地方。 它可以预测如果我们不做任何更改,模型会认为变体小组会做什么。 这条虚线是测试开始的时间。 这样您可以在测试后看到分离。 蓝线实际上就是发生的情况。
现在,由于这两行之间存在差异,因此我们可以看到一个变化。 如果我们移到这里,我们就绘制了这两条线之间的差。
由于蓝线高于黑线,因此我们将其称为正面测试。 现在,这里的绿色部分是我们的置信区间,作为标准,这部分是95%的置信区间。 现在我们使用它,因为我们使用统计测试。 因此,当绿线全部位于零线上方,或者所有绿线都位于零线以下(用于阴性测试)时,我们可以将其称为统计显着性测试。
对于这个,我们最好的估计是,这将使会议增加12%,大约每月大约有7,000次自然会议。 现在,在这里的任何一侧,您都可以看到我写了2.5%。 那就是使所有这些加起来等于100,其原因是您永远不会获得100%的自信结果。 总是有机会,有随机的机会,而您有错误的否定或肯定的判断。 这就是为什么我们然后说我们有97.5%的信心这是积极的。 那是因为我们有95加2.5。
没有统计意义的测试
现在,我们发现在很多情况下我们进行的测试在统计上并不重要,但是有很强的证据表明它们有所提高。 如果我们移到这里,我有一个例子。 因此,这是一个没有统计学意义的示例,但我们看到了强劲的增长。
现在您可以看到我们的绿线中仍然有一个负值区域,也就是说,在95%的置信区间内,这仍然是一个负测试。 现在,如果我们再次在下面放下,我又做了粉红色。 因此,我们双方都有5%的权益,我们可以在这里说我们有95%的信心取得了积极的结果。 这是因为该5%始终也高于该值。
3.分析数据以检验假设
现在,我们这样做的原因是尝试并能够实施我们有很强假设的变更,并且能够从中获得胜利,而不仅仅是完全拒绝。 现在造成这种情况的部分原因还在于我们说我们在做生意而不是科学。
在这里,我创建了一个图表,该图表说明了何时可以部署统计意义上不重要的测试,这是基于假设的强弱程度以及更改的便宜程度或昂贵程度。
强有力的假设/廉价的改变
现在在这里,在您的右上角,当我们有很强的假设和廉价的更改时,我们可能会部署它。 例如,我们最近与Distilled的一位客户进行了这样的测试,他们将主关键字添加到H1中。
最终结果看起来像此图。 这是一个强有力的假设。 实施起来并不是一项昂贵的更改,我们决定部署该测试,因为我们非常有信心那将仍然是积极的。
虚假假设/廉价变动
现在,从另一方面来说,如果您的假设很弱,但价格仍然便宜,那么也许有证据表明仍是采用该假设的理由。 您必须与客户沟通。
强有力的假设/昂贵的改变
在具有强大假设点的昂贵变更中,如果您根据要达到的百分比变化来计算预期收入,则必须权衡从投资回报中获得的收益。
虚假假设/廉价变动
如果假设不充分且变化巨大,那么我们仅在统计意义重大的情况下才需要部署它。
4.得出结论
现在我们需要记住,当我们进行假设检验时,我们所做的只是尝试检验原假设。 这并不意味着无效结果意味着根本没有效果。 这意味着我们不能接受或拒绝该假设。 我们说的是,这太随机了,以至于我们不能说这是真的。
现在,95%的置信区间能够接受或拒绝该假设,我们说的是数据不是噪音。 当它的置信度小于95%时,就像我们在这里所说的那样,我们不能说我们通过科学测试就能学到一些东西,但是我们仍然可以说,我们有很充分的证据表明这将产生积极的影响。在这些页面上的效果。
测试的优点
现在,当我们与客户讨论此问题时,这是因为我们真正的目标是在这里提供与其他行业内其他人的竞争优势。 现在,测试的主要优势是避免那些负面变化。
我们只想确保所做的更改不会使流量真正下降,而且我们看到了很多。 我们称之为躲闪的子弹。
现在,这是我希望您能从事的工作,并能够与您的客户或您自己的网站一起使用。 希望您可以开始提出假设,即使您无法部署ODN之类的东西,如果您所做的更改正在帮助或损害流量,您仍然可以使用GA数据来尝试并获得更好的主意。
(文 Emily.Potter)