分享

选择那么多,数据分析软件怎么选?4大要点评测9款常用软件!

 径硕科技 2020-09-08

市面上的数据分析软件非常多,但这并不意味着它们都适合你的企业。在本文中,我们将从对可拓展性和高性能的支持、团队合作功能、供应商规模和产品整合、购买及维护预算4大要点出发,评测以下市场上常用9大数据分析软件:Alteryx Inc.,IBM, KNIME AG,Microsoft,Oracle,RapidMiner Inc.,SAP,SAS Institute Inc.和Teradata Corp。希望今天的分享,能帮您的企业挑选到最适合的数据分析软件。


要点一:对可拓展性和高性能的支持

企业的数据量和分析需要驱动了对可拓展性能的需求。数据量小的小企业可能可以忍受那些不能随着可获得资源来拓展性能的产品,比如低端工具的入门级版本,包括RapidMiner、KNIME,、Microsoft R Open和Alteryx Designer,它们可以在PC端运行而且不需要额外的服务器组件。

规模大点的企业更有可能有一个更大体量的数据进行分析,以及更广泛的用户群体。这带来了两个额外的要求——高性能和方便合作。产品对高性能架构的适应性体现饿了可拓展性,大部分产品可以适应Hadoop的并行处理或采用其他来达到更高速计算的方式。

评测中的所有产品都有对Hadoop的支持,包括IBM SPSS Modeler和SPSS Statistics;RapidMiner的商业组件Radoop连接了Hadoop中存储的数据到Studio前端和Server分析引擎;Oracle的Big Data Discovery和ORAAH工具;KNIME的Big Data Extensions和Cluster Execution加载项。

IBM SPSS现在也提供对一些多线程分析算法的增强支持来提高速度性能。Teradata Aster Analytics通过它的Massively Parallel Processing架构解决了高性能需求。SAP BusinessObjects Predictive Analytics的SAP Expert Analytics版本可以执行内存数据挖掘来高效处理大体量数据分析。Microsoft R Server利用它的ScaleR模块——支持并行化的完整大数据分析算法库。使用SAS Enterprise Miner执行的打分算法可以在Hadoop环境中部署和执行。

另外,与Apache Spark的整合越来越被重视。SPSS、KNIME、Oracle、RapidMiner和SAP都能接入Apache Spark库来支持在数据体量大爆炸的情况下所需的分析应用。这让成熟的应用能够获得高性能集群平台的优势来跨集群分配工作流。


要点二:团队合作功能

如上所述,企业的规模越大就越有可能需要在不同小组和分析师中分享分析、模型和应用。那些有很多分散在各部门的分析师的企业会想要找到更多方式来分享模型并合作解读结果。

IBM的SPSS Modeler Gold版本提供了合作功能,RapidMiner的Server产品提供了对分享和合作的支持。Alteryx Analytics Gallery提供了与企业成员在云端分享复杂分析应用的机制。KNIME提供了商业拓展来支持团队合作以及运营合作如执行远程计划、生成报告、共享数据空间和工作流库。SAS Enterprise Miner的客户服务器架构使得企业用户和数据分析师通过分享模型和其他工作产品来共同工作。

Alteryx、KNIME和Teradata Aster增加了帮助管理分析工作流的功能。同时,一些供应商开始尝试让他们的工具能与其他人的进行整合,从而来互相填补一些功能上的空白。例如Teradata Aster现在有个能与KNIME整合的拓展应用,来让用户能使用KNIME工作流编辑器并包含Aster Analytics功能在这些工作流中。


要点三:供应商规模和产品整合

我们还可以以供应商规模进行比较。称之为巨型供应商的企业的数据分析工具只是大型工具库中的一个产品。

大型供应商提供的数据分析工具是一个更大的工具生态系统中的一部分。一般来说,巨型供应商的产品至少是有一定整合度且是可以一起使用的。除此之外,有些人由于稳定性和一致的客户服务而选择规模大的供应商。从另一方面来说,你可能只能通过购买一个更大的软件来获得这些数据分析工具。

小规模供应商如KNIME、Alteryx和RapidMiner通常通过授权和支持一小部分的数据分析产品来盈利。你可能会能与他们产品管理和创新团队密切联系,从而能够影响产品规划或提高功能性。

小规模供应商可能对包含在服务合同中的价格和功能更加灵活。不过必须要认识到与小供应商合作会有稳定性、资源支持资源、被收购方面的风险,影响客户关系。

大规模供应商明显对与其他系统整合的用户需求反应迅速,尽管通常专注于各自的产品库中的产品。比如,SAP Predictive Analytics优化了与SAP HANA和BusinessObjects Cloud的整合。SAS Enterprise Miner增加了节点以在开放SAS、云端就绪和内存Viya环境中执行代码。Microsoft提供SQL Server R Services,这个R程序能

与SQL Server并列运行并能使用户整合Microsoft R Server数据到SQL Server以及Microsoft其他的商业洞察工具。


要点4:购买及维护预算

几乎所有的供应商都提供产品的不同版本,采购成本和运营成本各不相同。IBM、Oracle、RapidMiner、Teradata和Microsoft提供不同版本的产品,费用与功能、性能和限制(被分析的数据量或能被使用的进程节点)相关 。

KNIME和RapidMiner提供免费和开源的产品版本,在支持服务或是在支持企业级应用的版本上收费。KNIME、RapidMiner和Alteryx相比较而言对数量少的用户收费更低。而SAS或SAP必须通过联系他们来询问价格选项。


结语

数据分析软件的选择非常多,希望通过本篇文章,你了解到了数据分析软件能为企业带来的优势以及如何区分所列的这些工具。记得挑选数据分析软件的时候,一定要参考以上4大要点哦!

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多