分享

混沌生物学 生物分子网络 计算生物学 (读书笔记三)

 二月石桥 2015-04-16
《混沌生物学》
我们常常将一些相互联系(或相互作用)的客体组成的集合称为一个系统。这些客体,既可以是自然界中的一些物质,如气体、液体、固体、化合物、生物的各部分或整体,也可以是国家、组织、群体和经济结构或抽象事物。
系统的长期行为对初始条件的敏感依赖性是混沌运动的本质特征。如前所述,这也就是人们当今常说的所谓“蝴蝶效应”。
我们中国人常说“差之毫厘谬以千里”和“千里之堤毁于蚁穴”,讲的也是这个道理。

我们还是来看看被誉为混沌之父的洛伦茨1961年冬天一个具有历史意义的计算机实验吧。洛伦茨当时用的是一台Royal McBee LGP-30型真空管计算机,其速度大约每秒作一次的迭代。那个时代的计算机,用现代的眼光来看,自然是简陋而笨重的。在他计算机的存储器中,每个数保持6位10进制,如0.506127。输出时为了节约空间,只打印3位:0.506。洛伦茨输入的是这些较短的经过四舍五入的数字,他假定这1/1000的误差不会有什么影响。这是合理的假定。如果气象卫星能以1/1000的精确度测定洋面的温度,操作人员就会认为运气不错了。洛伦茨把天气简化为一组决定性方程,用计算机进行数值求解,给出一个特定的起点,天气每一次都应当准确地按同一种方式发展。给出一个稍有不同的起点,天气的发展也应稍有不同。比如说,小小的数值不过相当于一阵小风,自然会自行消失或互相抵消,而不致改变任何重要的大范围的天气特点。然而,在洛伦茨的这一特定的方程组中,小误差却引起了灾难性的后果。为了更仔细地观察几乎相同的天气模拟是怎样分道扬镳的,他把一条输出曲线摹绘到透明纸上,然后再覆盖到另一条曲线上,看看它们是怎样彼此分开的。他发现天气变化同上一次的模式迅速偏离,不到几个“月”时间,所有相似之处都已消失无遗,其原因就在于蝴蝶效应,或者说对初始条件的敏感依赖性。

对一个实际系统,由于无法避免的内部涨落和外部环境的噪声的影响,初始状态的微小差异总是无法避免的,从而混沌对初始状态这种敏感依赖性必然导致运动的不确定性。

“说起运动的不确定性,我想起了布朗运动,对这种现象的解释是由爱因斯坦提出的,主要是分子对颗粒物的碰撞的随机性和不平衡性引起的。”

通俗地讲,把长度和面积一般化的概念,我们称其为测度。从集合论的角度看,维数是测度的函数。测度是对几何形体的测量,是对某一集合的实数对应。既然是测量,自然可以有不同的方法,而不同的方法便产生了不同的测度观。传统的测度观,称为勒贝格测度,它是以笛卡尔坐标系中各个坐标的笛卡尔集合为覆盖单元,将几何对象覆盖后取下确界而得。所得到的维数就是传统的整数维数。它是建立在欧几里德几何基础上,称其为欧几里德维数,也就是我们前面所说的经验维数。另一种测度,称为豪斯多夫测度。它是将一抽象集合作为覆盖单元,而这集合的直径d次方和取下确界便是所测几何客体的测度。这里d就是几何客体的维数。显然d不必一定是整数,而是一个实数。对于规整几何客体来说,它等于欧几里德维数。对于非规整的几何客体,比如前面所说的皮雅诺曲线这样的分形图形和我们讨论的混沌吸引子,其维数可以是分数,也就是分维。

几种典型的分维结构
康托尔集合(又叫康托尔尘埃),维数d=ln2/ln3=0.63093
科克雪花曲线,d=ln4/ln3=1.26186
谢尔平斯基垫片,d=ln3/ln2=1.58496
谢尔平斯基地毯,d=ln8/ln3=1.89279
谢尔平斯基海绵,d=ln20/ln3=2.72683
皮雅诺曲线,d=ln16/ln4=2
这个皮雅诺曲线很像DNA或蛋白质序列的分段,折叠形式,由一维变成二维。

激光诱导DNA分子混沌态的唯象模型
DNA分子系统是在外界强迫力——激光诱导作用下进入混沌状态,干扰遗传信息,影响DNA分子构象,从而导致遗传变异。激光频率有一个较宽的频率范围能使DNA分子系统进入混沌状态,即激光在一个较宽的频率范围都有可能使DNA发生变异。若DNA系统未受激光作用时,系统为孤子运动。

感觉DNA在外界强迫力下,某些区域发生分叉或混沌现象,所以DNA上才要有一些内含子或重复序列,调控序列,以此对抗复制误差,转录或翻译错误吧。意思是DNA上不可避免的隔一段会发生不可预见的错误,所以内含子就在这些区域,以后会被剪切掉,不至于影响最后产生的功能性蛋白质。

《生物分子网络的构建与分析》
生物系统作为典型的复杂系统可以通过复杂网络建模研究。从生物分子的角度来看,目前常常提到的生物分子网络有基因调控网络、蛋白质作用网络以及代谢网络。随着科学的进步,把microRNA的作用也常常考虑到生物分子网络中去。近年来,科学家对许多生物分子网络进行了实证研究,根据研究结果总结出多种生物分子网络存在如下一些普遍性质。

1.生物分子网络具有稀疏性
如果网络大小为N,那么它的边的数目为O(N),而不是O(N平方)。生物分子网络的稀疏性质的实质是生物在长期进化过程中达到某种优化的表现结果。

2.生物分子网络具有无标度(scale-free)性质
这些网络的度的分布都服从幂律分布。
无标度网络的显著特点是,多数节点有少量连接,而少数节点拥有大量连接。这种特性表明,在生物分子网络所拥有的动态过程中,有少数节点所代表的生物分子起到了关键作用。例如,在对真核细胞和细菌的研究中发现,细胞的新陈代谢有着无标度的拓扑特性;在代谢反应中,多数的代谢酶解物仅参与了1或2个反应,而少数几个酶解物则参与了众多反应,发挥着代谢中枢的作用。

3.生物分子网络具有超小世界性
小世界网络是指有短的平均路径长度和较大的平均聚类系数的网络。现实生活中的网络普遍具有小世界特性。万维网,社会关系网和神经网络也是具有小世界性的网络。许多生物分子网络,也具备了小世界特性,而且平均路径长度比一般小世界网络的平均路径还要短。因此,有的学者还提出这是一种超小世界。
对于生物分子网络而言,超小世界效应最先是在细胞内新陈代谢的研究中发现的。代谢网络中,平均通过3或4个反应的路径就能够连接多数成对的代谢物,而短的路径长度表明,对代谢物浓度的局域扰动能够迅速地遍及整个网络。由此可见,具有超小世界效应的网络更便于生物信息在网络的节点之间得到迅速传播。

4.生物分子网络具有层次结构
5.生物分子网络具有度的负关联性
6.生物分子网络具有一定的鲁棒性和适应性

根据生物分子网络的以上实证特性,我们能否给出一个数学模型构建方法来比较好地模拟生物分子实际网络,是从理论上开展对生物系统研究关键性的一步。在实际研究中,我们通常称这个建模过程为生物分子网络构建的过程。

构建转录调控网络的常用数据
1.微阵列基因芯片数据
2.ChIP-on-Chip技术和转录因子数据
ChIP-on-Chip(染色质免疫共沉淀)结合了染色质免疫和基因芯片技术,能识别细胞中DNA与蛋白质之间的相互作用。另外,该技术能识别基因组范围内的DNA结合蛋白质的绑定位点。对于转录因子来说,这些绑定位点是转录因子的结合部位。
3.miRNA及其调控关系数据

常用生物网络分析和可视化软件
1.CentiScaPe
2.SNOW
3.VisANT
4.ChiBE
5.Cytoscape
6.Pajek
7.FANMOD
8.POINeT
9.Osprey
10.BioLayout Express3D

《计算分子生物学》分为以下几个版块
1.基因搜寻
2.限制酶切作图
3.图谱装配Assembly
4.测序
5.DNA阵列,包括杂交测序,DNA探针
6.序列比较,BLAST
7.多重联配,Alignment
8.发现DNA中的信号
9.基因预测
10.基因组重排
11.计算蛋白质组学,比如肽测序,肽鉴定

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多