为什么大数据并非总是您最佳的解决方案

29.09.2015  18:38
 今天,我们已经听到过太多关于企业技术领域所被鼓吹的各种所谓建议了,导致某些人可能会认为“大数据”已然变成是能够解决现代企业所有问题的一幅灵丹妙药。但糟糕的是,其事实上往往并不能达到其所做的相关承诺——至少,无法以传统的形式。
  事实证明,那些通常被称为大数据的——均是通过企业资源规划(ERP)、消费者关系管理(CRM)和其他业务系统所捕获、测量的巨大的数据“”,其中的一部分数据被借助当今的分析工具进行了挖掘和开采。而实际上根据IDC的调研数据显示,对于绝大多数一般性的企业,其所充分挖掘和分析的数据量只有10%。
  其余的则是“非结构化”或“定性”的数据,这些数据可以是杂乱的。包括来自各种类型的客户调查、应对方式、网络论坛、社交媒体、文档、视频、新闻报道、电话呼叫中心以及销售团队所收集的传闻证据等等。这些数据信息通常往往都是文本,而非数字化的,不容易被“量化”,或者变成数值。
  而这其中就存在一个问题。鉴于大多数的分析工具是被设置为处理可量化信息的——即处理数字。换句话说,通常情况下,能够提供相关背景信息、或者对于企业有价值的信息却往往都是那些非结构化的数据。
  “由数据所引发的问题往往比其所能够提供的解决方案更多,而且,在定量数据的趋势背后,人们总是怀着‘为什么’的问题?”Forrester Research的分析师Anjali Lai表示说。“数据分析是在风险真空中讲述一个不完整的故事,而定性的数据则可以提供这个故事的上下文背景。
  想象一下,您所在的企业正试图理解和分析为什么网上销售业界并不如您所预期的那样。您可以在市场营销分析工具方面进行大量投资,以便能够为您提供大量活跃的数据,如用户在某个网页的平均停留时间;或用户购物车的放弃购买率等等。但是,这样的数据太过庞大,也未必能够解答您的“为什么?”的问题。
  “您可能能够掌握到您的网站有1万个独立访客——但这是定量数据。”YouEye公司首席产品官科林·塞巴斯蒂安表示说。YouEye公司是一家通过定性数据提供专门的软件和服务设计的供应商。“而定性数据则能够告诉您,在这1万个独立访客中,有4000人是专门奔着您网站的某个特定主题来的,这就是他们希望学习的东西,是真正让他们感兴趣的东西。
  定性数据可以超越数据点之间的相关性进行进一步深入的分析,其可能会告诉您诸如:那些访客在您的网站上花了较长时间的访客,与往往也会有实质的购买行为的访客之间的相关性。也即,定性数据可以开始确定因果关系,或者说,能够解答难以捉摸的“为什么?”的问题。例如,进行了实质的采购的访客是源于他们在网站上所花时间的较长;或者是他们在网站上花了较长时间,只是因为您网站的购买过程很麻烦?
  “今天,每位CMO平均管理着多达14款仪表盘。”塞巴斯蒂安说。“这是一个分析陷于僵局的案例:我以17种不同的方式在1000万个数据点观察我的问题,但我并没有对于其相应问题所处大环境的充分了解。
  从历史上看,对于定性数据的分析往往是非常手动的和人力密集型的工作。“您不能只是提交对文档数据库的查询,然后寄期望于获得一些数据就可以进入一个可视化的视图。”博思艾伦咨询公司(Booz Allen Hamilton)首席数据科学家Kirk Borne解释说。
  其结果是,这使得定性数据分析通常被限制在了一定的范围内。但这种情况已经开始在改变。不仅有更多的工具和专为定性数据设计的工具包,同时,现在也有了“越来越聪明的方法,能够将定性数据转化为定量数据,从而释放出定量分析定性数据的全部功效。”Borne说。
  YouEye公司实施了一项在线研究:通过使用视频和音频以记录企业用户与其客户在网站、广告或其他形式的互动。通常情况下,介于50和300家企业用户被选择参与该在线调研项目。视频被转录,并结合使用了人工编码,自然语言处理和机器学习的组合编码方式。在该项目结束时,客户端获得了一份调研结果说明集锦。
  例如,针对一家咖啡供应商,“我们通过与该咖啡供应商的客户进行产品互动,每次当他们提到一家竞争对手时,就明确标注原因,并最终形成了一份调研结果说明集锦。”塞巴斯蒂安说。然后,该咖啡供应商马上就能够执行一个因果分析,其为什么会有客户流失——而这些原因是定量的数据所无法告诉您的。”
  QSR International是另一家通过软件实施了专门的定性数据量身打造的公司,其NVivo产品被Gallup公司用于民意调查。虽然Gallup公司以其全国范围的民意调查闻名,但该公司也将咨询相关的机构,以帮助他们了解他们与他们客户关系的情感方面,而其中就涉及大量的定性数据。
  “其中有一些关键的研究问题将通过定量的方法充分独捕捉,包括为什么客户对某供应商主动疏离或感情冷漠;他们体验的客户服务的动机和思想过程等。” Gallup公司的研究员和战略顾问Ilana Ron-Levey说。 “当我们与一家企业达成合作伙伴关系时,定量数据使我们能够广泛评估特殊意见,但定性数据则有助于我们了解相关数据含义背后,数据特定频率和分布,这是至关重要的。”她说。
  Gallup公司采用了多种技术来评估客户的看法。例如,在最近的一个B2B的商业项目中,他们面对面的采访了100多名高级客户,围绕着客户参与相关主题收集定性和定量数据,Ron-Levey说。团队归纳分析定性数据,并使用NVivo以及在微软Excel中手工编码的方法。
  Gallup公司使用定量反应的统计学解释顾客参与互动的驱动因素。利用定性数据来描述驱动客户参与互动的因素和感觉。由此,我们收集到了提高更多不同类型客户互动参与度的策略。”她说。
  在软件中使用定性数据通常是以数字形式,例如通过为特定的定性反应或评论分配一个数值等级或分数。例如,在情绪分析中,研究人员通常会在定性数据分别用一个正值和负值表示情绪,然后又用一个数值表示感情的强度。Borne说。
  文本分析涉及以定量的方式总结文本信息的内容,比如通过主题模型和热图,而自然语言和语义处理技术从语言中提取语意,无论是书面的还是口头的。
  将定性数据转化为定量的形式涉及一些主观的决策。“这是一个挑战,但也是一个巨大的机会。”Borne指出。“在语言上,我们可以使用提取更深的理解和更更加微妙和复杂的意义。
  在QSR 的NVivo产品中采用了各种算法,例如采用常用的词或句子进行数据分析。许多可视化工具都使解释变得更容易,同时,包括字云和树图。
  “这给了您一个强大的可视化的观点和对根本原因的了解。”该公司的首席执行官约翰·欧文说。
  定性数据收集往往是费时的,需要研究者掌握高度的技巧,并与受访者建立和谐的关系,以减轻受访者的偏见,Gallup的Ron-Levey指出。
  “一个最被低估且最为经常被忽视的技能是:定性研究者需要有一种感同身受的同理心。”Forrester的Lai表示。“今天,定性研究人员经常仅仅依靠数据本身,而没有对数据所形成的数字化编码所蕴含的潜台词或上下文形成批判性思维。
  处理的数据和验证研究模型也更为复杂。例如,一组正常化的定量数据采用零到一的比例可能是足够的,但这其中还需要掌握定性数据处理的技巧,Borne指出。
  他解释说:“当有许多不同的意义,或嵌入定性数据的程度不一时,标准的统计检验所进行的A假设vs. B假设的测试是行不通的。
  在分析方面,尝试推广的调查结果可能会超出了样本的研究是很有诱惑力的,Ron-Levey警告说。但是,定性数据是非常值得的努力。
  “在大数据时代,人类会持续不断的探索数字背后所蕴含的秘密。” Ron-Levey说。“理解客户的情感,动机和观念往往能够带来创新和新的战略,更能吸引顾客。
  Forrester的Lai说,“关于定性和定量分析可以说是对客户分析和认识的‘阴阳两面’,因为双方都要围绕消费者的行为来讲述一个完整的故事。” 来源:机房360