SAP Data Hub是一种数据共享,数据流和业务流程解决方案,可帮助公司加速和扩展其现代多样化数据环境中的数据流。 SAP Data Hub提供对各种数据系统和资产的可见性;允许轻松快速地创建功能强大的跨组织数据流水线;并通过每个步骤的“下推”分布式处理方法,优化数据管道执行速度。 SAP Data Hub满足企业的治理和安全需求,确保采取适当的策略措施,以满足合规和公司要求。 1 概览 当需要了解一个产品的时候,首先最应该看的就是它的营销介绍,因为这里最核心、最直观、最易于理解。 接着就是SAP Data Hub的架构组成,在这里你能看出它能干什么,想干什么,以及集成关系。 然后产品的发展路线图也非常重要,了解当前阶段以及产品的预期发展方向,对于自己是否选择这个产品,或者是否需要了解这个产品非常有必要。 总而言之, SAP Data Hub是一个数据目录,其中包括流程(管道和工作流)建模,执行和报表,并增加了自助数据准备。 它利用SAP VORA进行大数据访问,并通过敏捷数据准备,利用智能数据集成,来实现ETL功能,以及保障和提升数据质量。 2 有比以往更多的数据和更多的存储和使用方法。虽然这些数据具有商业机会,但企业数据格局,正变得越来越复杂,组织越来越难以理解他们拥有的数据,而是在需要使用它的所有不同系统中工作,并应用端到端治理,以捕获最大价值。 关键痛点:
SAP Data Hub与其他产品有何不同? SAP Data Hub为数据管理提供了一种更简单,更具可扩展性的方法。 借助企业跨越式数据集成,处理和治理,SAP数据中心可在现代企业中,提供对复杂数据网络的可视性和访问。通过提供广泛、详细且易于理解的整个数据环境视图,从Hadoop和Amazon S3到SAP HANA和ERP,SAP数据中心可帮助组织深入了解数据源,使用,互连,质量和影响。这使企业能够从数据中看到新的机会,解决新出现的数据问题,并确保数据流向需要的地方。 SAP Data Hub通过在单一可视化设计,可轻松快速地创建功能强大的数据管道,从而加速和扩展您的数据项目 在单一环境中,数据管理员可以轻松快速地创建功能强大的数据管道,以便从整个组织的各种来源访问,协调,转换,处理和移动信息。例如,管道创建者可以轻松激活强大的库,以进行计算或机器学习;快速连接各种类型的数据,例如社交媒体,客户和产品信息;并利用现有的处理投资,例如SAP HANA,Apache Hadoop,SAP Vora或Apache Spark中的功能。可以轻松复制,修改和重新使用管道模型,以加速管道部署并利用最佳实践。 SAP Data Hub通过创新的“下推”处理加速业务成果,为更灵活,更全面的数据驱动应用程序提供支持。 SAP Data Hub不仅可以加速跨越不同数据源的数据管道的创建和管理,还可以通过将计算任务,分发到数据所在的本机环境来快速执行管道活动。这种联合的“下推式”分布式处理可确保管道的活动尽快完成,从而为业务有效的支撑。这种数据处理方法允许客户利用云计算,可能降低数据流水线和数据管理的总体成本。 其他解决方案通常要求您集中数据。一些公司提供数据流和业务流程解决方案,但仅针对其解决方案中保存的数据。他们希望您将所有数据移动到一个位置以创建和执行高级数据管道。 SAP数据中心的目标客群是谁?
什么时候可用? 截至2017年9月1日,SAP数据中心已经普遍可用。 数据是否存储在SAP Data Hub中? 不可以。SAP数据中心不提供数据存储。它是一个在现有数据存储之间编排和管理数据的平台,但它本身不是数据仓库、数据集或Data Lake。 SAP Data Hub是另一个ETL或Streaming工具吗? SAP数据中心超越了传统的批量ETL或实时流。它使这些功能现代化,并专注于在分布式环境(例如Hadoop集群或公共云存储)中运行的新技术的集成。主要范例是将逻辑放在数据所在的位置,并利用集群计算能力。因此,它拥有卓越的处理和集成能力。 SAP Data Hub与SAP Vora之间的关系是什么? SAP Vora功能包含在SAP Data Hub中,但SAP Data Hub和SAP Vora旨在根据客户的特定需求处理不同的用例。 SAP Data Hub简化了复杂数据流程的编排,同时提供跨现代和多样化环境的治理,包括大数据存储,企业数据存储,企业应用程序和云解决方案。 SAP Vora是一款企业级,易于使用的内存分布式计算引擎,可帮助组织发现大数据的可操作见解,通常存储在Hadoop和NoSQL解决方案中。它适用于数据科学家,也可作为Hadoop多层数据战略的一部分。 与SAP数据服务,SAP HANA智能数据集成(SDI)和SAP HANA智能数据质量(SDQ)的关系是什么? SAP Data Hub将利用客户现有的SAP HANA中运行的SAP HANA SDI/SDQ流程图,以及利用在现有Data Services作业服务器上运行的SAP Data Services作业。它不会取代现有的用例。 SAP数据中心被设计为协调,监控和建模集成流程的中心位置,其中SAP数据服务作业,SAP HANA SDI和SDQ任务以及大数据流可以汇集在一起 。这些SAP EIM产品将继续与SAP Data Hub分开开发和提供。 与SAP Agile Data Preparation(ADP)有什么关系? SAP Data Hub具有一些内置的分析功能,但可以使用SAP ADP作为补充。 自助数据准备工具。对于此用例,SAP ADP为业务用户提供了支持。 搜索和访问其数据源的功能,可视化操作数据以使其为报告做好准备并发布。它将与SAP数据中心密切合作,将此自助服务引入大数据场景。在以后的版本中,SAP ADP将利用SAP Data Hub的元数据存储库。 SAP Analytics的关系是什么? SAP Data Hub通过优化数据管道的速度和安全性来帮助提高分析价值,使组织能够在当下采取正确的信息。SAP是市场上唯一可以提供跨数据,分析和业务应用程序的端到端软件组合的供应商。SAP Analytics Cloud,一种基于云的解决方案,适用于所有分析(基于SAP Cloud Platform构建);将利用SAP Data Hub强大的数据编排功能,允许组织通过控制,管理和优化其数据环境来增强功能强大的分析用例。 SAP Leonardo的这部分怎么样? SAP Leonardo是一个数字创新系统,使客户能够快速创新,然后迅速扩展创新,为数字世界重新定义业务。SAP的大数据解决方案,SAP数据中心,SAP Vora和SAP云平台大数据服务与Leonardo产品相关,因为它们是扩展和创新的关键。因此,它们在Leonardo大数据包中提供。 SAP Data Hub促进了Leonardo的核心功能,因为: 1. 它最大限度地降低了风险和中断。它适用于您现有的数据环境,不需要您集中数据。 2. 它可以最大限度地利用您现有的技术投资,并使您能够充分利用它们,它可以处理它所放置的数据,并利用最接近数据的处理能力,从而尽可能快地完成数据传输。 3. 它允许您快速扩展创新,因为它使数据流水线功能可供组织内更广泛的用户使用,并且它允许您轻松地在现有基础上进行构建。 4. 它允许您对未来开放。由于其开放式架构,您不仅可以利用当今的大部分数据,无论是在云端,内部部署,SAP解决方案还是非SAP解决方案中,您还可以快速轻松地采用新的改进,例如在机器中学习和下一个数据分析或处理创新。 3 功能概要 跨Data Lakes(基于Hadoop),对象存储(Amazon S3),云/本地数据库和数据仓库的数据管道。从一开始,该解决方案就可以跨越数据领域,利用“下推式”分布式数据处理来:
跨系统边界协调复杂流程和工作流程
Data Lakes的数据提取和处理,支持非结构化和结构化数据/文件或流
控制,管理,操作和生产复杂的数据环境
元数据生命周期与谱系和影响分析
数据发现可直观地了解Data Lake数据中的值
4 特色解析 Hub中的数据 Hub in Hub是一种基于现代HANA的最先进的(提取,转换和加载,又称ETL)数据仓库方法。为此,它似乎利用Landscape Transformation工具进行数据访问以及ETL功能和数据质量的数据服务,而HANA似乎提供了存储和转换功能。 敏捷数据准备 敏捷数据准备是面向最终用户的自助服务解决方案。它似乎主要利用HANA规则框架,智能数据集成和智能数据质量的现有功能。 示例:https://blogs./2017/02/03/sap-agile-data-preparation-tutorial/ 智能数据集成和智能数据质量 智能数据集成和智能数据质量是HANA重新实现数据服务的开始。如果它们的特性和功能足够,它们的效果会很好。 数据服务 Data Services是一种传统的ETL工具,存在于两个版本中,即内部部署数据服务和用于数据服务的SAP云平台集成。 LANDSCAPE TRANSFORMATION(LT) LANDSCAPE TRANSFORMATION是一套技术支持以下领域的商业交易的工具和技术程序:
高级数据迁移 高级数据迁移是一种面向流程的数据迁移工具,尤其是在SAP S/4HANA领域。其目的是让数据所有者参与迁移过程,为他们提供面向业务的迁移过程见解以及提高数据质量的工具。 信息管家 信息Steward是一种用于监控,分析和改进数据完整性的被动数据治理工具。 |
|
来自: 昵称16619343 > 《科学技术》