使用 Apache Spark 的 Lambda 架构

俊在晴空 2016-11-15

展开全文

现在是2016年了!

商业现实已经改变，所以做出长远的决定变得更有价值。除此以外，技术本身也在演化进步。Kafka, Storm, Trident, Samza, Spark, Flink, Parquet, Avro, Cloud providers等时髦的技术被工程师们和在商业上广泛使用.

因此，现代基于Hadoop的 M/R通道 (以及Kafka，现代的二进制形式如Avro和数据仓库等。在本例中Amazon Redshift用作ad-hoc查询) 可能看起来像这样:

以上M/R通道看起来很不错，但是它仍然是传统上具有许多缺点的批处理。由于在新数据不断进入系统时，批处理过程通常需要花费很多时间来完成，它们主要是提供给终端用户的乏味的数据罢了。

本站是提供个人知识管理的网络存储空间，所有内容均由用户发布，不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息，谨防诈骗。如发现有害或侵权内容，请点击一键举报。

转藏分享

QQ空间 QQ好友新浪微博微信

献花（0） +1

来自：俊在晴空 > 《大数据》

举报/认领

0条评论

请遵守用户评论公约

类似文章 更多

俊在晴空

关注对话

喜欢该文的人也喜欢更多

热门阅读换一换