分享

大数据迎来开源时代 开源热点盘点

 一瓢若水 2012-04-06

大数据迎来开源时代 开源热点盘点

  • 出处:天极网云计算频道 日期:2012-03-31
  •  


     伴随着交易型IT到交互型IT的过渡,过去几年中企业数据呈现爆炸性增长。社交媒体的兴起、智能终端的广泛使用等导致各种海量数据的快速产生,同时为我们开启了大数据时代。随着大数据时代的到来,我们也迎来了开源时代,为什么这么说呢?

      谈及大数据,也不得不提云计算,在大数据+云计算时代里,开源变成了香饽饽,因为用户想要的是更多的自由,于是乎厂商就开始在自己的产品上贴上开放的标签,开始谈开源的好处,因为它曾承诺能够降低成本同时获得企业级的IT自由度。所以我们看到了Hadoop人气居高不下,这就是自由的号召力。

      但是在开源风行的这几年,又有几家开源企业真的做的不错呢?小编就带大家盘点一下最近的开源热点吧!

      Hadoop

    Hadoop

      Hadoop 无疑使目前最热的开源技术,因为它曾承诺能够降低成本同时获得企业级的IT自由度。最终,只有几个新兴企业投资(MySQL, JBoss),但是对于大部分的企业而言,真正的价值来自IT供应商和内部的IT组织,利用开源为他们的软件项目提供原材料。开源越来越不关于销售,而是代码,这也正是设计它的目的所在。

      Hadoop 是最受欢迎的在 Internet 上对搜索关键字进行内容分类的工具,但它也可以解决许多要求极大伸缩性的问题。例如,如果您要 grep 一个 10TB 的巨型文件,会出现什么情况?在传统的系统上,这将需要很长的时间。但是 Hadoop 在设计时就考虑到这些问题,采用并行执行机制,因此能大大提高效率。

      Hadoop如此受欢迎是由原因的,它带来了诸多优点。Hadoop 是一个能够对大量数据进行分布式处理的软件框架,而且Hadoop 是以一种可靠、高效、可伸缩的方式进行处理的。可靠性体现在它是假设计算元素和存储会失败,因此它维护多个工作数据副本,确保能够针对失败的节点重新分布处理。高效性则体现在它以并行的方式工作,通过并行处理加快处理速度。Hadoop 还是可伸缩的,能够处理 PB 级数据。此外,Hadoop 依赖于社区服务器,因此它的成本比较低,任何人都可以使用。

      OpenStack

    OpenStack

      OpenStack是一个美国国家航空航天局和Rackspace合作研发的云端运算?软件,以Apache许可证授权,并且是一个自由软件和开放源代码项目。

      自从2010年推出以来,OpenStack迅速赢得了惠普、英特尔和戴尔等云计算领域的IT公司的支持。OpenStack的贡献者喜欢把自己的工作称作增长速度最快的开源软件项目,参加者包括144家公司和2100多人。戴尔推出一个名为戴尔OpenStack云解决方案的软件包,把OpenStack与戴尔自己的服务器和软件结合在了一起。惠普也推出一个采用这个技术的测试版的公共云服务。

      管理的托管提供商Rackspace的首席技术官约翰·安格斯(John Engates)说,为了帮助更广泛地应用,OpenStack正在配置许多新的功能,使这个软件更适合企业应用。一个名为“Keystone”的项目允许机构把OpenStack与自己的身份管理系统结合起来,或者与基于微软主动目录或者其它LDAP(轻型目录访问协议)的身份管理系统结合起来。此外,开发人员也正在为这个软件开发一个前端门户。Rackspace还将把这个项目剥离为一个完全独立的实体,希望它成为更多的云提供商的一个诱人的选择。

      安格斯称,2011年将是这个产品打基础的一年。但是,我认为,2012年我们将真正开始利用这个基础在许多私有云和公共云中使用。

      Apache

    Apache

      Apache是世界使用排名第一的Web服务器软件。它可以运行在几乎所有广泛使用的计算机平台上。

      Apache的诞生极富有戏剧性。当NCSAWWW服务器项目停顿后,那些使用NCSA WWW服务器的人们开始交换他们用于该服务器的补丁程序,他们也很快认识到成立管理这些补丁程序的论坛是必要的。就这样,诞生了Apache Group,后来这个团体在NCSA的基础上创建了Apache。

      原本它只用于小型或试验Internet网络,后来逐步扩充到各种Unix系统中,尤其对Linux的支持相当完美。Apache有多种产品,可以支持SSL技术,支持多个虚拟主机。Apache是以进程为基础的结构,进程要比线程消耗更多的系统开支,不太适合于多处理器环境,因此,在一个Apache Web站点扩容时,通常是增加服务器或扩充群集节点而不是增加处理器。到目前为止Apache仍然是世界上用的最多的Web服务器,市场占有率达60%左右。世界上很多著名的网站如Amazon、Yahoo!、W3 Consortium、Financial Times等都是Apache的产物,它的成功之处主要在于它的源代码开放、有一支开放的开发队伍、支持跨平台的应用(可以运行在几乎所有的Unix、Windows、Linux系统平台上)以及它的可移植性等方面。

      MySQL

    MySQL

      MySQL是一个小型关系型数据库管理系统,开发者为瑞典MySQL AB公司。在2008年被Sun公司收购,2009年,SUN又被Oracle收购。

      MySQL是一种关联数据库管理系统,关联数据库将数据保存在不同的表中,而不是将所有数据放在一个大仓库内。这样就增加了速度并提高了灵活性。MySQL的SQL“结构化查询语言”。SQL是用于访问数据库的最常用标准化语言。MySQL软件采用了GPL(GNU通用公共许可证)。由于其体积小、速度快、总体拥有成本低,尤其是开放源码这一特点,许多中小型网站为了降低网站总体拥有成本而选择了MySQL作为网站数据库。

      与其他的大型数据库例如Oracle、DB2、SQL Server等相比,MySQL自有它的不足之处,如规模小、功能有限(MySQL Cluster的功能和效率都相对比较差)等,但是这丝毫也没有减少它受欢迎的程度。对于一般的个人使用者和中小型企业来说,MySQL提供的功能已经绰绰有余,而且由于MySQL是开放源码软件,因此可以大大降低总体拥有成本。

      目前Internet上流行的网站构架方式是LAMP(Linux+Apache+MySQL+PHP/Perl/Python)和LNMP(Linux+Nginx+MySQL+php/perl/Python),即使用Linux作为操作系统,Apache和Nginx作为Web服务器,MySQL作为数据库,PHP/Perl/Python作为服务器端脚本解释器。由于这四个软件都是免费或开放源码软件(FLOSS),因此使用这种方式不用花一分钱(除开人工成本)就可以建立起一个稳定、免费的网站系统。

      Asterisk

    Asterisk

      Asterisk是一个开放源代码的软件VoIP PBX系统,它是一个运行在Linux环境下的纯软件实施方案。Asterisk是一种功能非常齐全的应用程序,提供了许多电信功能,能够把你的x86机 器变成你自己的交换机,还能够当作一台企业级的商用交换机。Asterisk让人激动的事情是它在小企业预算可承受的范围内提供了商业交换机的功能和可伸 缩性。你可以使用一台老式的奔腾3计算机,让你的机构看起来就同世界上的大企业一样。

      事实上,Asterisk开源项目经过十多年的发展,已经不再单独局限于IP-PBX的应用。实际上,按照,Digium在其asterisk论坛上给出的说法,Asterisk软件已经是一个平台,不仅可以用于IP-PBX的开发,也可以用于中继网关(TG),模拟电话适配器(ATA - Analog Telephone Adapter),甚至 IP Phone 产品的开发。 同时,Asterisk开源项目已经逐步发展称为一个 “统一通信” (UC)的解决方案。

      Asterisk开源项目应用的另一个变化是在嵌入式领域的发展。虽然最初Asterisk是基于X86主机加PCI扩展板卡运行的。但目前,一些基于MIPS或ARM的CPU也已经都可以运行Asterisk。其中比较著名的有OpenWRT,在OpenWRT的最新版本中已经包含了对Asterisk 1.6/1.8 版本的支持,简单的编译后既可在MIPS或ARM的硬件平台上运行(参考Asterisk On MIPS论坛)。

    (责任编辑:陈曲)

      本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
      转藏 分享 献花(0

      0条评论

      发表

      请遵守用户 评论公约

      类似文章 更多