15分子钟(足够细化到无穷小量的分子层次,可以模仿微积分来进行运算):一个特定的大分子在所有的演化谱系中具有恒定的演化速率。分子演化单位meu,每年每个位点以10^-9演化。当然,我们同时需要注意到,在具体的序列种特定部位的演化速度也是不同的,是具有一定分布的(重要性有一点的分布,而变化的速度也有一定的分布,如非保守的不重要的演化速度快,保守的重要的演化速度慢(并非不可变,只是风险更大,因此发生概率低)),即有的快有的慢,但根据连续的假设和中值定理,一定存在一个数值(速度=每个位点的平均替代数)可以描述整体。不同物种中相同分子的演化速率可以不同,这个可以通过一定的实验设计来证明如修复的速度,生命周期的变化,代谢速率等等有一定相关性而且可以量化的指标。
16具体的模型的构建,不同的碱基之间的变换可以以一定的参数来表示(现实碱基的替代是复杂的,序列作为结果是如同马尔科夫矩阵的特征值,但其具体的变化过程不清楚),而这些参数其实就代表一定的生物机制。agct之间的转换的参数可以以马尔科夫矩阵来表示,最后达成的均衡就是比较稳定的常数,如核苷酸位点平均碱基替换数。jc模型(不区分嘌呤嘧啶之间的转换)—k2模型(嘌呤嘧啶之间的转换都有一定参数)。然后是核苷酸的组合,密码子是次级结构,我们需要考虑密码子之间的简并性,有的密码子可以替代其碱基而不改变编码的氨基酸。
17中性演化理论:在中性选择下,同义替代位点ks和非同义替代位点ka(改变编码的氨基酸)上发生的替代的概率相同(具体情况可能有一点波动),ka/ks的大小就决定氨基酸改变的频率,从而导致形成一定的选择:ka/k;1,造成氨基酸改变的替代少,为负选择;ka/k;1,造成氨基酸改变的替代多,为正选择(氨基酸变化的固定,即延续);
18基因组测序的数据,在不同尺度的序列进行比对,这无疑是需要极大的计算资源的,如具有的组装序列的算法也是需要考虑的。基因组层次的大数据研究就是微积分的思路,底层的无穷小量的叠加能够逼近高维的结构(牛顿-莱布尼茨公式,微积分基本定理)。我们以有限的基因(人类三万多基因)来形成复杂的生物体,就是依赖于这些基因的组合形成的高维结构,包括可变剪切等等的机制使得机体能够表达出无穷无尽的可能性,对应于各种生物学的机制。
19snp(单核苷酸多态性),indel(插入/缺失,动态规划进行序列匹配的策略),单倍型,重复。这些策略就是生物体为适应复杂功能衍生出复杂机制。这些组合其实就是一种杂交(基因重复如多倍体,基因重排等等),即线性组合。
20在比对关键的序列即基因后,发现其他的序列之间的可能关系即非编码区。这必然的趋势,比较生物不存在junk。其是基因之外的调控机制(高保守性)。
21以分子层次来理解疾病,最明显的是各种基因结构的缺陷带来的功能变异,最终导致机体层次的不协调(不动点);然后是功能层次的缺陷,即各种基因蛋白的组合形成的机制的缺陷如特定信号通路的表达上下调。其应该形成一定的稳定系统。
22物种的形成是一种稳态,是多层次竞争博弈暂时达成的均衡,是分子层次的变异,遗传漂变,自然选择,适应这个循环过程形成的结果。这是一种人为界定的概念,是抽象层次对这个复杂过程的整体把握,是对具有相似特征的生物的一个抽象理解。物种的形成是隔离导致的。如同河流的分支,物种不断分化。这个树状图的不同分子的演化的速度不同。而且这些分支之间其实也存在一定的竞争博弈,如同波函数的坍缩/光的干涉,最后的物种是幸存的路径。因此也有灭绝的可能,物种形成和灭绝本来就是一对双生子(递归的结构),灭绝可以视为一种修剪(参考二叉树算法),使得形成的物种是有竞争力的(局部最优解)。
23间断平衡学说(在渐进论的进一步发展):物种进化是长期的稳定状态和短暂的剧烈变化交替的结果;有限基因的变异就可以产生足够大的变化,这些基因的寻找就是一种最优路径的求解(不动点),当然自然界的计算方式就是大规模的繁衍和选择,能够幸存的就是局部最优解。因此遗传多样性是能够求解的前提,使得最后能够不至于收敛到离整体最优的结果。
24野生动物在养殖的情况是低生育率的,这是多层次原因导致的,是一种反馈结构。因此各种保护措施的采用可能产生相反的效果,因为具体的存在是其背景多因素竞争博弈形成的动态平衡。牵一发而动全身,我们需要充分考虑各种复杂关系,而自然规则是之前形成的局部最优路径(如小规模放火能够减少大面积火灾,保护性破坏),可以遵循其来减少大规模试错即减少计