挖掘数据金矿 在探索中前行

27.07.2015  20:12
 掘金大数据

随着移动互联网的深入渗透以及5G宽带技术的迅速提升,更多的传感器、智能设备接入到互联网,世界正从IT时代进入到DT时代,大数据已成为国家、企业的重要战略资源。目前全球每天有220万TB的新数据产生,人类过去两年所创造的数据量已占人类数据总量的90%。据弗吉尼亚州Falls Church的预测,到2020年,世界上每年产生的数据信息将是现在的4300倍,达到35ZB。这也使IBM全球副总裁兼大中华区软件集团总经理胡世忠直言:“数据构成了智慧地球的三大元素:物联化(instrumented)、互联化(interconnected)和智能化(intelligent),而这三大元素又改变了数据来源、传送方式和利用方式,带来了’大数据’这场信息社会的变革。
  大数据更将成为企业赖以生存的生命线,这要求对数据的探索、挖掘不断深入,包括——产品主数据、销售等交易数据;客户、伙伴、供应商等价值链生态圈数据。根据美国管理协会(American Management Association, AMA)的研究显示,已有58%的公司领导者表示分析能力对其组织非常重要,82%的公司领导者认为分析能力将在未来5年内变得更为重要。仅有不到1%的公司领导者认为分析能力在未来五年内对其业务并不重要,这一切都表明,到2020年,分析能力将成为这个商业社会不可或缺的要素。
  百万难求淘金人
  “虽然大数据应用的趋势已势不可挡,但仅金融领域来看我仍然觉得雷声大雨点小,有客观原因也有主观原因。”广发银行信用卡中心首席风险官王玉海对当前市面上炒得如火如荼的各种大数据应用保持着冷静的思考。
  王玉海表示,“首先是金融企业的文化没有改变。用产业兴衰的所谓的基因论来衡量,当上一波的产业浪潮获胜者巩固后,不断巩固原有的企业文化、思维模式、运营架构,但这些基因并不能代表他会在下一波产业浪潮中获胜,所以很多银行安于现有组织架构和组织流程,对新生的、创新的事物有天然的排斥,所即便大家认为金融业是大数据最好的应用领域,但现实是金融业里小数据还没用好,如何用好大数据?
  
  “其次是成本和管理因素,不管从人、硬件还是数据结构、数据源,我们还是传统的模式。但大数据环境下是基于生命周期的数据管理方式,处理碎片式、非结构性的数据。但现实的传统管理方式并不能适应。对于影像、图片、音频的管理大家觉得这很美好,但一旦接触就发现这个很棘手——非结构的数据用传统方法管理?更实际的问题是:软件、硬件的IT基础设施都没有成熟,成本更高。传统银行每个部门都有硬性的成本控制。在没有确定的回报下,银行不敢冒险投入很多财力、人力来开发,这是管理和成本的制约。
  “最后是技术和人才的挑战。我们传统的数据库都是事物型而不是分析型的数据库,我们习惯于从原数据抓过来,从文本文件变成一个数据仓库,但大数据下的分析挖掘是另一回事,它要把分析和仓库分割开来,由于技术原因和传统的管理架构,造成审批要经过数天、数周,我们不能在数据库里面实时进行创造性的分析。解决这个问题的办法则需要更强的技术能力这包括:需要更大的储存和更强计算能力,也就是我们说的云计算结合Hadoop这种储存能力。更重要的是熟练的分析型人才,他不仅精通计算机、数学的理论知识,还要对传统的金融和未来发展更具前瞻性、更有洞察力,同时又有能力作为数据搭建者和分析员,具有这样能力的人才市面上非常稀缺,我们即便开出一、两百万的年薪也一才难求。
  决战大数据
  面对种种不利于大数据新技术成长的土壤,王玉海也不得不承认大数据技术确实能发挥传统技术以意想不到的效果:“在纯信用模型上大数据应用成效是显而易见的。以广发银行为例,我们所有的抵押贷款或者有保障金的借贷关系的坏账率远远高于无抵押的,为什么?首先归功于我们模型的质量,第二就是在模型评分前提下,我是基于无抵押的话我的警觉性或者风险管控意识更强。
  SAS公司执行副总裁兼首席营销官Jim Davis向企业网记者介绍:“各国政府开始使用分析工具、软件开发数据资源。政府希望从一个公民的角度更好的理解公民真正需求,通过追踪各种重要的信息和数据解决问题,包括经济、医疗健康以及其他生活各个方面。比如说在菲律宾之前出现了超强台风海燕,在自然灾害中就使用相关技术解决整个救灾力量和资源分配问题,以及最先救助那些最需要的人。
  正如亚信数据战略发展部总经理张勇所言:“越来越多的企业已经意识到数据是新资产,并开始部署数据收集、加工、管理、分析工具,利用数据分析结果,为企业业务创新提供支撑,并推动企业管理变革、流程再造。这一阶段我们称之为‘大数据1.0’。而2.0时代是部分部署了大数据的企业发现只有自己的数据还不够,还需要外部数据来丰富已有数据的维度,提高数据分析的精准度。这一阶段开始出现数据的聚合,但绝大多数企业的数据“只进不出”,整个行业的数据源有限,不同企业间的数据也因缺少规范而很难流通、交互。3.0阶段则会出现大数据平台,每个企业同时是数据的使用者、提供者。数据的流通、交易不再存在障碍,大数据生态系统也会逐渐成型。而目前,我们处于大数据产业正1.0与2.0之间。”
  这引得国际大厂纷纷布局大数据。2009年7月EMC斥资24亿美元数据复制解决方案提供商 Data Domain,2010年又收购数据库软件供应商Greenplum;2009年IBM花12亿美元收购数据分析和统计软件提供商SPSS;甲骨文(Oracle )2008年就花33亿美元收购商业智能解决方案提供商海波龙(Hyperion);惠普(HP)2011年花费 100 亿美元收购英国软件公司Autonomy;微软也不甘落后,2008年收购了收购数据仓库产品厂商DATAllegro,即便R语言受到众多统计学家及大数据爱好者的追捧,然而2015年微软与Revolution Analytics达成收购协议,收购之后Revolution Analytics表示将持续支持R语言的开源项目并提供给客户订阅式的技术支持服务。但不难看出,大数据已成为商业软、硬件企业和创业公司决战未来的重要战场。
  在大数据及商业智能领域不得不提的是老牌软件厂商SAS。对如此剧变的大数据业态,SAS公司总裁Jim Goodnight先生接受D1net记者专访时表示:“SAS未来的目标是成为Hadoop架构上首选的分析产品供应商。”对于部署了大数据架构的企业,SAS将大量且复杂的精密运算应用到Hadoop集群,基于普通的商用硬件,存储和处理大数据。SAS支持Hadoop完成整个分析生命周期,包括数据访问和管理到探索、建模和部署,帮助企业在更短的时间内获取更多洞察。SAS独特的内存处理技术让分析尽可能地去靠近数据,避免数据移动造成的时间浪费。
  
  “SAS通过SAS/ACCESS? Interface to Hadoop、SAS? In-Memory Statistics for Hadoop、SAS可视化分析(SAS? Visual Analytics)以及SAS高性能分析(SAS? High-Performance Analytics)等一系列基于Hadoop的解决方案及产品将分析的力量与Hadoop相结合,释放大数据真正的价值。
  “在全球,SAS与Hadoop生态系统中知名公司Cloudera和Hortonworks紧密合作。在中国,SAS与华为结为联盟合作伙伴,二者合作开发企业级大数据分析平台FusionInsight。该平台包括海量数据引擎FusionInsight HD和实时数据处理引擎FusionInsight Stream两个核心组件,能够对高达百万维度的数据进行全量建模,进行实时分析和挖掘。
  亮剑数据大时代
  在群雄并起的数据大时代,建立良好的生态圈才是企业基业长青的可靠壁垒。在有R、Spark 、Tableau这样的后起之秀追赶下,SAS去年扩大了自身战略合作联盟,与艾睿电子(Arrow Electronics)签署了全球经销商合约。通过艾睿电子遍布北美、欧洲、中东和非洲的授权经销商网络,SAS将向世界各地的更多客户提供产品和解决方案。2014年,艾睿电子帮助SAS聘用和培训了80家经销商。
  最近SAS宣布成立首个重要OEM联盟,与东芝全球商业解决方案(Toshiba Global Commerce Solutions)携手,向零售商提供分析技术。这个联盟将零售推广和忠诚度管理系统与商业分析相整合,帮助零售商应对消费者不断变化的购物行为习惯。这是SAS拓展OEM关系网络道路上重要的里程碑。
  在中国,SAS公司宣布与华为结为联盟合作伙伴,旨在发挥各自强项,共同打造针对不同行业的大数据解决方案。FusionInsight分析平台是SAS与华为合作的第一张答卷,在企业的精准营销、实时决策、客户维系、数据开放等各种应用场景提供全面的技术保障。迄今为止,FusionInsight已在全球拓展了100多个大数据项目,有40多个项目已经在交付,其中10多个已经在商用。目前的主要应用领域为电信、金融、科研、公安和政府,客户包括中国工商银行、中国建设银行、招商银行、平安银行、上海移动,上海联通等。SAS与华为的共识合作,则是SAS本地市场实践的重要里程碑。
  因此SAS中国区业务在2014财年取得了优异的成绩,整体营收增长近18%,实现了连续四年年复合增长率32%的快速增长。SAS与银行、保险、电信、制造、政府等多个行业的合作更为深入。SAS看到云、Hadoop、移动互联等多股力量正在推动大数据行业的发展。通过加大研发和创新力度,推出了能与这些新趋势紧密结合的分析产品。SAS中国的发展重点集中在一、金融服务业,重点在银行和保险公司;二、制造业;三、政府;四、电信市场这四大领域。
  在银行业 ,四大银行都均是SAS的用户,占有了极高的市场份额。在城商行、农商行也有几百家规模,被视为SAS新的蓝海。保险行业 早就走到全面的自由化市场,市场竞争压力非常大。保险公司在市场营销方面的投入非常大,对于怎样用新的渠道,能够更实时,个性化地推动一些产品和服务,其实做了很多的投入。保险行业在对云计算、大数据、移动互联方面的需求很强烈。虽然电信行业拥有良好的数据质量和IT基础设施,但竞争激烈需要更为精细化的管理。今年SAS将把新的可视化分析解决方案提供给电信企业。除了总部外将推到各个省市,通过SAS的直销团队去服务,加大与各地集成商合作力度。在制造业 ,SAS尤其在汽车制造业积累了很多成功的应用案例,从基本生产制造、质量管理一直到销售预测、库存优化,很多很高端的分析应用其实在上海通用已经实现了。汽车行业的竞争将越来越激烈,限购之后怎样开拓新市场,怎样更有效地进行经营管理,SAS在汽车行业会持续地投入。在高科技制造业,SAS有很多高科技制造业的工厂或者代工合作伙伴都在中国。过去几年大家大量做传统的产能扩充或者建基本的应用系统,包括ERP或者供应链的管理,接下来会开始更高级的数据应用。因为基础的信息平台的基础打好了,接下来会有很好的增长机会。在政府机构 应用方面。SAS在反欺诈反洗钱领域的分析基础,有优秀产品。各个监管机构,包括税务、公安、海关,都要侦查出一些团伙,通过SAS的社交媒体分析软件,就可以有效地防止犯罪和国家收入流失。在这个领域SAS与集成商、合作伙伴的合作会更多。
  相信,随着以阿里巴巴为代表的互联网金融对中国银行业的继续渗透,银行业将面临更多来自大数据的挑战,银行业要么拥抱大数据要么被大数据所边缘化。 来源: