共 3 篇文章 |
|
而这45万台Server,则建立于下面的key infrastructure: 1.GFS(Google File System): GFS是适用于大规模分布式数据处理应用的分布式文件系统,是Google一切的基础,它基于普通的硬件设备,实现了容错的设计与极高的性能。4 hour: int= hourof(log.time)5 emit submits[hour] <-1;首先它的变量定义类似Pascal (i:int=0; 即定... 阅335 转10 评1 公众公开 08-04-03 11:34 |
Hadoop 是Google MapReduce的一个Java实现。MapReduce是一种简化的分布式编程模式,让程序自动分布到一个由普通机器组成的超大集群上并发执行。就如同java程序员可以不考虑内存泄露一样, MapReduce的run-time系统会解决输入数据的分布细节,跨越机器集群的程序执行调度,处理机器的失效,并且管理机器之间的通讯请求。这样的模式允许程序员可... 阅606 转13 评0 公众公开 08-03-11 11:41 |