大数据常见术语解释(2)
胡经国
24、仪表板Dashboard)
仪表板是指使用算法分析数据,并且将结果用图表方式显示于仪表板上
25、数据聚合工具DataAggregationTools)
数据聚合工具是指将分散于众多数据源的数据转化成一个全新数据源的过程
26、数据分析师DataAnalyst)
数据分析师是指从事数据分析、建模、清理、处理的专业人员
27、数据库Database)
数据库是指一个以某种特定的技术来存储数据集合的仓库
28、数据库即服务Database-as-a-Service)
数据库即服务是指部署在云端的即用即付数据库服务,例如亚马逊云服务AWS,AmazonWebServices,直译:亚马逊网络服务
29、数据库管理系统DatabaseManagementSystem)
数据库管理系统(DBMS)是指收集、存储数据,并提供数据访问的数据库系统
30、数据中心DataCentre)
通常,数据中心是指全球协作的特定设备网络,用来在internet网络基础设施上传递、加速、展示、计算、存储数据信息。计算机系统和其它与之配套的设备(例如数据中心通信和存储系统),而且还包含冗余的数据通信连接、环境控制设备、监控设备以及各种安全装置”。
31、数据清洗DataCleansing)
数据清洗是指对数据进行重新审查和校验的过程,目的在于删除重复信息、纠正存在的错误,并且提供数据一致性
32、数据管理员DataCustodian)
数据管理员是指负责维护数据存储所需技术环境的专业技术人员
33、数据道德准则DataEthicalGuidelines)
数据道德准则有助于组织机构使其数据透明化,保证数据的简洁、安全及隐私
34、数据订阅DataFeed)
数据订阅是指一种数据流,例如Twitter订阅和RSS
35、数据集市DataMarketplace)
数据集市是指进行数据集买卖的在线交易场所
36、数据挖掘DataMining)
数据挖掘是指从数据集当中发掘特定模式或信息的过程
37、数据建模DataModelling)
数据建模是指使用数据建模技术来分析数据对象,以此洞悉数据的内在涵义
38、数据集DataSet)
数据集是指大量数据的集合
39、数据虚拟化DataVirtualization)
数据虚拟化是指数据整合的过程,以此获得更多的数据信息这个过程通常会引入其他技术,例如数据库、应用程序、文件系统、网页技术、大数据技术等等
40、去身份识别De-identification)
去身份识别又称为匿名化nonymization),是指确保个人身份不会通过数据被识别
41、判别分析DiscriminantAnalysis)
判别分析是指将数据分类按不同的分类方式,可将数据分配到不同的群组、类别或者目录。它是一种统计分析法,可以对数据中某些群组或集群的已知信息进行分析,并从中获取分类规则。
42、分布式文件系统DistributedFileSystem)
分布式文件系统是指提供简化的、高可用的方式来存储、分析、处理数据的系统
43、文件存贮数据库DocumentStoreDatabases)
文件存贮数据库又称为文档数据库ocumentOrientedDatabase),是指为了存储、管理和恢复文档数据而专门设计的数据库这类文档数据又称为半结构化数据
44、探索性分析ExploratoryAnalysis)
探索性分析是指在没有标准的流程或方法的情况下从数据中发掘的模式,是一种发掘数据和数据集主要特性的方法
45、E字节EB,ExaBytes
1E字节EB)等于1024PBetaBytes),约等于100万GB。如今全球每天所制造的新信息量大约为1EB
46、提取转换加载ETL,Extract,TransformandLoad
提取转换加载是指一种用于数据库或者数据仓库的处理过程,即从各种不同的数据源提取E)数据,并且转换T)成能满足业务需要的数据,最后将其加载L)到数据库中
47、故障切换Failover)
故障切换是指当系统中某个服务器发生故障时,能自动地将运行任务切换到另一个可用服务器或节点上
48、容错设计Fault-TolerantDesign)
容错设计是指一个支持容错设计的系统,应该能够做到当某一部分出现故障也能继续运行。
2016年6月5日编写于重庆
2019年9月21日修改于重庆
2022年5月1日修改于重庆
2
|
|