分享

典型案例:Oracle数据库中超700TB的LOB存储

 数据和云 2020-07-01

Oracle是否适合存储大量的非结构化数据?典型的成功案例是怎样的?

前一段就有朋友向我咨询这样的问题,就 Oracle存储大对象(LOB)的能力、性能和成功案例,我咨询了 Oracle ,提供了一个成功案例在此分享给大家。

英国桑格研究院(Wellcome Trust Sanger Institute)是世界上最重要的生物技术研发中心之一,同时也是将基因研究转化为商业用途的重要基地,目前人类基因研究项目正在该研究院进行。

桑格研究院使用 Oracle 数据库 LOB 形式存储生物基因信息,最新数据是存储容量超过了 700 TB。MPSA是桑格研究院其中的一个系统,数据库使用的是Oracle 11g,采用的SecureFiles存储方式,以下是几年前的公开数据说明,当时的数据容量是 512TB,每周增长4~5TB。


桑格研究院的数据库系统系统架构,采用的是Oracle标准的体系,RAC集群,ASM存储,生产中心是2套4节点的RAC集群,灾备中心是一套4节点RAC集群。


灾备和读写分离架构通过DataGuard实现,参考下图的体系,本地站点和灾备站点各部署了一套物理备库,目前的一个核心项目是:癌症基因组计划。


SecureFiles 是 Oracle Database 11g 的一个新特性,旨在为文件或非结构化数据提供与文件系统媲美的高性能,同时保留 Oracle 数据库 的优势。

可以说SecureFiles 集外部文件与数据库 LOB 方法的优点于一身,可以存储非结构化数据,允许加密、压缩、重复消除等。

下图是Oracle官方文档上给出的性能对比数据:


而且,在12c版本中,SecureFiles的压缩等功能获得大幅度的增强,大对象的存储,去重、压缩将更加节省用户的存储资源。


最后一点是科普,关于 Sanger ,值得我们所有人尊敬的科学家,我摘录了大段来自维基百科的文字,不节略。

弗雷德里克·桑格

弗雷德里克·桑格(Frederick Sanger,1918年8月13日-2013年11月19日,是一位英国生物化学家,曾经在1958年及1980年两度获得诺贝尔化学奖,是第四位两度获得诺贝尔奖,以及唯一获得两次化学奖的人。


早年

桑格于1918年8月13日出生于英国格洛斯特郡,父亲是一位医生。从布莱恩斯滕高中(Bryanston School)毕业后,桑格进入了剑桥大学圣约翰学院,并于1939年完成自然科学文学士学位。他原本打算研究医学,但后来转而对生物化学感兴趣,而剑桥在当时也正好有许多早期的生物化学先驱。桑格在1943年获得哲学博士学位。他在1940年时与玛格丽特·琼·豪(Margaret Joan Howe)结婚,他们育有两个儿子和一个女儿。

蛋白质与DNA序列研究

桑格在1955年将胰岛素的胺基酸序列完整地定序出来,同时证明蛋白质具有明确构造。他利用自己新发现的桑格试剂,也就是2,4-二硝基氟苯(2,4-dinitrofluorobenzene)将胰岛素降解成小片段,并与专门水解蛋白质的胰蛋白酶混合在一起。再将一部分混合物的样本置放于滤纸的一面,并利用一种色层分析方法来做进一步的实验,首先他将一种溶剂从单一方向通过滤纸,同时又让电流以相反向通过。

由于不同的蛋白质片段有不同的溶解度与电荷,因此在电泳后,这些片段最后会各自停留在不同的位置,产生特定的图案。桑格将此图案称为「指纹」;不同的蛋白质拥有不同的图案,成为可供辨识且可重现的特征。之后桑格又将小片段从新组合成胺基酸长链,进而推导出完整的胰岛素结构。因此得出结论,认为胰岛素具有特定的胺基酸序列。这项研究使他单独获得了1958年的诺贝尔化学奖。

1975年时,桑格发展出一种称为链终止法(chain termination method)的技术来测定DNA序列,这种方法也称做「双去氧终止法」(Dideoxy termination method)或是「桑格法」。两年之后,他利用此技术成功定序出Φ-X174噬菌体(Phage Φ-X174)的基因组序列。这也是首次完整的基因组定序工作。他所发明的技术比起当时其他方法使用了较不具毒性的材料。主要是先进行PCR,利用DNA引子和DNA聚合酶使DNA链得以展开复制,再利用双去氧核苷酸(dideoxynucleotides)来终止DNA链的合成。实验会使不同序列的DNA带有不同长度,使其得以经由电泳来做分析。

这项研究后来成为人类基因组计画等研究得以展开的关键之一,并使桑格于1980年再度获得诺贝尔化学奖,与桑格合作研究的沃特·吉尔伯特,以及另一团队的保罗·伯格(Paul Berg)也一同获奖。第二座诺贝尔奖使他成为继玛莉·居礼、莱纳斯·鲍林,以及约翰·巴丁之后的第四位两度获奖者。到了1979年,桑格又与吉尔伯特和伯格一同获得哥伦比亚大学的路易莎·格罗斯·霍维茨奖(Louisa Gross Horwitz Prize)。

近年影响

桑格于1982年退休,英国的维康信托基金会(Wellcome Trust)和医学研究理事会(Medical Research Council),于1993年成立了桑格中心(Sanger Centre),这座研究机构现在称为桑格研究院(Sanger Institute),地点位于英国剑桥,是世界上进行基因组研究的主要机构之一。 2007年,维康信托提供英国生物化学学会(British Biochemical Society)一项补助,使其为桑格从1989年以后的实验研究纪录进行建档及保存。

根据英国医学研究理事会2013年11月20日证实的消息,桑格于19日在剑桥一家医院熟睡中去世。

其他名誉及头衔

1954年成为皇家学会会员(FRS)。

1963年获得英帝国司令勋章(CBE)。

1981年获得名誉勋位(CH)。

1986年获得功绩勋章(OM)。

如何加入"云和恩墨大讲堂"微信群

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多