大数据分析是实现智能化的利器

作者:王莉华 文章来源:SAS中国首席咨询顾问 发布时间:2015-03-05
分享到
大数据的兴起促进了开源Hadoop技术的繁荣,而我们也看到了分析软件基于Hadoop框架下的前景,成本更为低廉,部署更为简单,能够存储文本等非结构化数据,可满足企业所需.

大数据的兴起促进了开源Hadoop技术的繁荣,而我们也看到了分析软件基于Hadoop框架下的前景,成本更为低廉、部署更为简单、能够存储文本等非结构化数据,可满足企业所需。而基于Hadoop框架下的高性能、并行计算也必将成为软件未来发展方向之一。市场研究机构IDC预测,到2016年,Hadoop将实现8.128亿美元的销售额——复合年增长率达到60.2%。

SAS期望客户能够借助Hadoop继续将大数据转化为卓越洞察。从这几年接触的用户看,客户期望在技术上具备更强的易用性和可操作性,更短的学习周期以及更丰富的高级分析能力,如预测、数据挖掘、场景分析,包括对非结构化和半结构化数据的分析需求也已经非常迫切了。同时,随着数据量和用户数量的不断膨胀,用户对性能的要求也越来越高,软件需要在这些方面不断提升才能满足用户的需求;而在信息共享与传递方面,越来越多的用户开始喜欢使用移动设备进行报表访问和信息查看;一些企业也对云服务、软件即服务(SaaS)等模式也提出了要求。

SAS现在的核心软件SAS可视化分析(SAS Visual Analytics)就是定位于在大数据时代下的可视化分析产品。其主要特点如下:

●可视化能力:SAS可视化分析通过友好的交互性、丰富的图表展现、简单易用的操作满足用户对数据可视化的需求。易于使用的交互式Web界面,用户就可以自行灵活地探索数据,创建报表和分享信息。用户将能够查看更多选择,做出更精确的决定,比以前更快地取得成功。

●统计分析和数据挖掘能力:SAS可视化分析提供专业的统计分析功能和数据挖掘算法,满足不同层次客户对数据分析和展现要求;并且所有操作都是可视化、交互式的方式下进行,让用户不需要通过专业的培训,也能快速对数据进行专业的分析,获取新的洞察。

●移动展现:随着移动设备的普及,移动化办公的需求也越来越迫切。用户希望随时随地获取企业关键数据,以满足最快、最高效的决策。SAS可视化分析可以随时把分析结果通过移动设备展现和发布出来,让用户以最快的方式获取数据,辅助企业决策。

●扩展性和性能:SAS可视化分析基于符合未来大数据发展方向的架构平台搭建,采用基于通用硬件的基础结构,具有高度的可扩展性,支持不断增长的访问更多数据的需求。它采取了自下而上的设计,支持与Hadoop的整合,以便支持数据库的优化和扩展能力。

基于Hadoop平台之上,SAS可视化分析搭建了符合Hadoop平台架构的内存分析引擎——SAS LASR Server,为SAS可视化分析解决方案提供了基础,具有改变游戏规则的能力,大大加速了分析计算处理。由于具有内存分析能力,SAS可视化分析提供了极快的大规模数据处理能力,打破了以往的思维模式。而且,它是为Hadoop整合而特别定制的,让企业可以最大限度地利用大数据存储系统和并行处理环境。

从技术角度讲,这款软件最突出的特点包括:

●大数据环境下的高性能:SAS可视化分析的核心组件是SAS LASR分析服务器,它使用基于内存的分析引擎,为SAS可视化分析提供了极快的大规模数据分析与挖掘能力,打破了以往大数据环境下I/O通道的性能瓶颈,让企业可以最大限度地利用大数据。SAS LASR分析服务器还支持分布式架构,可部署在多台服务器集群,并以Hadoop(嵌入Hadoop分布式文件系统)作为本地存储,并能够充分利用集群的多个节点进行并行处理。

●可视化数据探索:SAS可视化分析可以有力地帮助所有类型的用户进行自助分析与数据探索,采用可视化的交互方式探索数据,获得洞察并发现模式和趋势,以便展开进一步的分析。这种基于Web的交互式探索分析应用,可以帮助用户——包括那些缺乏专业分析能力的用户,拓展他们使用分析技术的能力,获得更为精确的业务洞察。非技术型用户将会发现,通过从侧工具栏或动态过滤分组数据项中进行选择,可以轻松地创建和修改查询。并且,聪明的分析用户能够从海量的数据中,更快地看出趋势,更容易地发现数据的意义。

●易用的自助式分析:借助采用内存计算技术的SAS LASR分析服务器,可轻易征服和分析大型数据源。SAS可视化分析针对具有不同技术水平的人员定制了不同的特性,让尽可能多的各种类型用户有能力自己探索数据,而无需学习新的技术或是严重依赖IT部门的支持。探索和定位超多变量之间的相关性,也变得非常容易。用户可以自己动手建立层次结构,而无需不断地麻烦IT人员的帮助;可以轻易地在层次中进行上下钻取,并在任意水平进行切片和切块,可以真正帮助到分析人员,以更快的速度探索更多的数据,并且可以让非技术型用户免受复杂数据结构问题的困扰。

●全新的报表开发与分发模式:SAS可视化分析为不同技术水平的用户提供了不同的报表开发功能。专业小组或者业务用户可以在IT部门确定的范围内开发报表。丰富的展现布局,让报表开发变得更加快捷。通过一套完备的图形化数据展现选项,用户能够在报表中创建并轻松引用图表和图形;轻松地设计和创建业务图表,应用公司设计规范,然后将结果发布到Web查看器或iPad上。

与业内同类产品相比,具有以下独特优势:

●大数据分析的性能:在某通信企业的测试中40亿条单表数据进行汇总分析报表展现,通过传统报表工具需要约4min的时间,而采用SAS可视化分析创建同样的报表则只需要40s,快了6倍。

●统计分析与预测分析能力:SAS可视化分析提供经典统计、数据挖掘、时序预测以及场景分析能力,不仅通过可视化的方式协助分析人员探索数据,还能通过这些高级分析方法协助业务人员更加深入地了解业务之间的内在联系,预测业务的发展趋势,将基于各种业务场景的预测进行比对,无需编程、无需高级建模人员的辅助,完全可以自行完成各种高级预测分析,快速提升业务决策的准确性和及时性。

●可扩展性:SAS可视化分析可以按照企业的需要和规模来不断扩展,通过提供基于通用的硬件基础架构,具有高度的可扩展性,支持不断增长的访问及更多数据的需求。采取了自下而上的设计,支持与Hadoop的整合,以便支持数据库的优化和扩展能力。

●给业务用户提供了新的方式来访问所需信息,解脱了IT人员的负担:将IT人员从业务部门无穷无尽的要求中解脱出来。业务用户们会要求访问不同的数据源、不同的数据视图、即席的报表以及一次性的信息要求等。SAS可视化分析能够让IT人员轻松地为多个用户载入并准备好数据。一旦数据载入并准备好,业务用户就可以自行灵活地探索数据,创建报表和分享信息。

以一个具体案例来进行说明:某移动公司的自助分析平台项目。客户的业务部门每天都有大量的查询分析需求,而业务部门人员并没有专业的IT背景知识,所以他们获取数据的方式只能每天通过邮件发给IT技术支持人员,由IT人员把需求理解并通过编程方式去后台进行数据查询,最后将分析结果发回给业务人员。而用户的数据量非常庞大,往往用户的分析需求光在后台运行就需要好几个小时。所以造成用户从提出分析需求到获得分析结果,有时甚至需要好几天时间。这种方式是非常耗时耗力,大大降低了工作效率,有时甚至因为没有及时返回分析结果耽误了对公司的决策。

而客户通过选择SAS可视化分析产品,让业务部门再也不用IT人员的帮忙就可以自由自助进行分析,丰富多样的分析手段满足不同层次业务人员分析的需求。并且对业务人员的分析响应速度非常快,满足业务人员实时决策的需求。把业务人员生成分析报告的时间从几天缩短到几分钟,大大节省了业务人员的时间,同时也节省了IT人员的时间,节省公司整体人力物力的投入,提高了公司的整体工作效率。

随着电信行业的发展,大数据势必会是每个电信业客户所要遇到的问题,而对数据分析是体现大数据背后价值的最有力“武器”。如何更好利用好这把“武器”,不再只是IT人员需要考虑的事情,更需要有更多业务人员一起参与进来,在业务背景的指导下,才能更好的挖掘数据价值。而这样要求软件在功能上不仅要满足用户的专业性要求,提供丰富的分析手段,并且在软件设计上也要满足用户的易用性和客户化需求,更贴切于客户的设计,才能赢得客户。

而从软件后台架构上,也要考虑基于大数据的分析需要。使用最快捷的手段达到最高效的访问速度,并且随着企业数据量日益增长,也要有一个扩展性极强的架构满足企业未来发展的需要。

随着智能化、物联网技术的深入发展,如何能达到智能,如何能够从海量的物联网数据中获得有价值的数据,并作出能帮助企业决策的分析和判断,这才是企业想要的“智慧”。从SAS的角度看,帮助企业实现大数据分析是现在更为企业所需的点睛之笔。SAS将持续提供与最新的数据源、操作系统以及对业界开放标准的支持,以满足各种业务与IT环境下对客户的广泛支持。

收藏
赞一下
0