数据素质的问题,并在网页分析的准确性是值得大多数网络分析师别无选择,只能learn和内部十分迅速,特别当人们开始问why号码不符。然而,我们往往容易忘记,我们的客户,商业用户和营销队伍不是生活和呼吸,因为我们做这个数据。因此,这个职位是一个必要的(提醒并非最终)有关数据的网络分析为什么不能作为事实采取一定的事实。
为什么不同的数字?
大多数人第一次认识到一个网站分析数据的问题,因为他们试图调和不同systems之间2绝对数字,例如在谷歌时,比较分析与点击访问由Atlas(或其他广告tracking tool报道)。以下是主要理由:这些数字不匹配:
该术语通常用来计算指标略有不同。例如,独特的访问者必须始终是唯一的访客在[在一定时间内]。不同的厂商可能使用不同的时间框架。无论是对还是错,他们只是不同。同样的原则也适用于其他指标多,有时一个更为微妙的层面。
虽然正在取得不断的进步,有currentlyno商定的标准,这些定义。分析供应商的名称经常尝试拖放ABCe标准(至少在英国),但这些一般被认为是过时的和被访问,从对横幅广告和搜索派生报告创建,不为网络分析。这里是一个标准的现况良好的概要。
跟踪方法,如饼干,包嗅探器和IP地址都以不同的方式收集数据和所有有利弊,以他们的方式做到这一点。进一步资料请参阅下面就这一个例子。
互联网是由一系列不同的技术,都是不断发展和变化巨大的数组。发挥这些技术在数据采集的准确性一个重要组成部分。
新版本的浏览器功能的技术,总是让日益精明的网络用户隐藏自己的网上行为,甚至阻止这种默认行为的新类型。
机器人和蜘蛛抓取互联网网页,以如指数是什么在他们的搜索引擎。数据网质量分析的一站比赛,以配合这些动物了!
Cookies和独特的访客 – 为例
Cookie的问题一般是面积最大的混乱。我的一个客户最近比较谷歌分析他们的现任供应商,Sophus3。他们注意到独特的访客很大差异,并希望了解原因。虽然这个问题在某些方面提出的所有上述各点,主要的原因是产品种类的曲奇使用:
随着谷歌分析,追踪访客使用第一方Cookie。估计数字显示,约有1%的用户阻止这些饼干和1块4%进一步的JavaScript。因此,GA是无法跟踪这些用户,因此可根据实际旅客,约5%计算。
Sophus3,另一方面,使用第三方Cookie。许多浏览器默认情况下阻止这些,所以估计表明,约65%的流量是由于失去了这个和JavaScript阻塞的组合。
Sophus3然后使用IP地址来跟踪谁已经封锁Cookie的访客。然而,大多数的宽带供应商使用动态IP地址,从而改变周期性。在某些情况下,IP地址可能改变的人,每次在他们的计算机开关。因此,Sophus3将注册为多个访问者个人的人,总人数将因此被夸大。
下面的图表说明了这种更直观的方式(数字只是粗略的估计,说明一点问题,并不意味着是准确的):
虽然第一方Cookie是在业界普遍认为是最佳做法,实际上也不是完美的。欲了解更多信息,这里是如何影响Web饼干分析数据更详细的概述。
克服它!
数据的准确度问题,导致公司陷入瘫痪浪费大量时间。事实上,没有解决方案,它是好得多:
认识的局限性在尽可能多的细节,并确保网络的报告和分析所有收件人所熟悉的数字做什么,不要告诉他们。
集中趋势和细分市场,而不是绝对数字。这是很容易做时,重点是分析,而不是纯粹的报告;洞察力从未从纯粹的数字来。
凡游客如独特决策所需要的数字,有信心水平,应该被用来制造这些数字对合理的判断。
如果我们设置在最准确的一个一致的基础,对数据线that我们可以得到它,那么我们可以使用此数据make准确trend假设和draw结论about时间序列分析。




