一图解说Hadoop的发展历程

关平藏书 2017-06-07

展开全文

一图解说Hadoop的发展历程
▲

　　1. 这一切是如何开始的—Web上庞大的数据!

　　2. 使用Nutch抓取Web数据

　　3. 要保存Web上庞大的数据——HDFS应运而生

　　4. 如何使用这些庞大的数据?

　　5. 采用Java或任何的流/管道语言构建MapReduce框架用于编码并进行分析

　　6. 如何获取Web日志，点击流，Apache日志，服务器日志等非结构化数据——fuse,webdav, chukwa, flume, Scribe

　　7. Hiho和sqoop将数据加载到HDFS中，关系型数据库也能够加入到Hadoop队伍中

　　8. MapReduce编程需要的高级接口——Pig, Hive, Jaql

　　9. 具有先进的UI报表功能的BI工具- Intellicus

　　10. Map-Reduce处理过程使用的工作流工具及高级语言

　　11. 监控、管理hadoop，运行jobs/hive，查看HDFS的高级视图—Hue, karmasphere, eclipse plugin, cacti, ganglia

　　12. 支持框架—Avro (进行序列化), Zookeeper (用于协同)

　　13. 更多高级接口——Mahout, Elastic map Reduce

　　14. 同样可以进行OLTP——Hbase　　

本站是提供个人知识管理的网络存储空间，所有内容均由用户发布，不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息，谨防诈骗。如发现有害或侵权内容，请点击一键举报。

转藏分享

QQ空间 QQ好友新浪微博微信

献花（0） +1

来自：关平藏书 > 《Hadoop家族》

举报/认领

0条评论

请遵守用户评论公约

类似文章 更多

关平藏书

关注对话

喜欢该文的人也喜欢更多

热门阅读换一换