第一个讲座的题目是《simplest stochastic model of tumor progression》。讲座者Tibor Anal对肿瘤的发展用演化动力学建立简单的模型。由于相关的专业知识我并不懂,我只能简单地理解一下他的思路。所有正常细胞都有常规的生命周期。然而在细胞复制的过程中出现了一些细胞发生了突变。他们的生存时间比一般细胞更长。这就是肿瘤细胞。所谓细胞变异的产物,肿瘤细胞如何体内如何发展的呢。Tibor Anal考察了单个变异的例子和多重变异的例子。在细胞的分裂复制的过程中,一个细胞A分裂成两个细胞A。这是正常的过程。但是一些情况下一个细胞A分裂产生一个细胞A和一个细胞B甚至产生两个细胞B。在不断分裂的过程中细胞B又会发生变异产生细胞C。于是变异就使得新生的细胞与原有的正常细胞之间的差别越来越大。对于变异细胞发生的比率分布,Tibor Anal运用了随机过程模型对细胞变异过程进行了建模,如Backward kolmogorov equation wright-fisher equation。他建立一个简单的模型,并通过详细的实验进行了验证,发现模型确实能够比较好地模拟实验结果。模型同时可以提供一些精确的方程解。这说明简单的演化动力学公式在肿瘤研究领域可以适宜的运用。他主张变异会为肿瘤发展研究提供新的启发。
第三讲的题目是《evolutionary dynamic of matabolic system》。Thoma Pfeiffer从cross feeding ,rate/field,emergent of network property三个方面介绍了在新城代谢系统中演化动力学的应用,作者把化学系统的演化也看成是受演化动力学支配。新陈代谢的关键问题是ATP的生产。指标有ATP的生产速率、酶浓度和中介浓度。新陈代谢就涉及到以上这些指标的优化。其中低资源浓缩会生成长期路径,高资源浓缩会生成短期路径。这儿就出现了速率和领域的权衡。这也成为了cross-feeding演化的重要前提。作者用计算机模拟新陈代谢的演化规律。从初始链开始(E1......Em),计算稳定状态、浓度和种群大小。多次重复,其中让最好的变异链入侵,再计算新的稳定状态(变异链可以与原链并存或竞争过原链)。如果不存在可以如期的新链时演化终止。模拟的结果发现cross-feeding确实可能来自对期望高稀释率和高中介成本的路径优化。要注意的是临界行为的微小变化会导致种群结构的巨大变化。在热力学中ATP生产速率和领域之间的权衡会导致一种两难困境。如果种群使用资源高效,那么支付就高。反之,支付低的资源使用效率就低,更容易被其他高效变异入侵。Thoma Pfeiffer把慢而有效的ATP生产类比于合作行为,快而低效的ATP生产类比于自私行为。这就把ATP的生产效率问题转化为了合作的演化问题。Richard Lenoki的对E coli的长期演化实验提供了实证的证据。它表明领域/速率的权衡确实会导致公共品困境。最后,Thoma Pfeiffer讨论了新城代谢网络的演化。他认为酶的共同演化以及不同种群之间的复制和特殊化导致了新陈代谢网络的演化。新城代谢网络也符合无尺度网络的特性,符合幂律关系。group transfer是hub涌现的必要条件。
第四讲的题目是《origin of life --critical transition in prebiotic chemistry》演讲者michael manapat将前进化动力学和选择动力学结合起来组成方程来考察 。
为了解释生命的起源问题,作者提出了前进化、前生命作为进化的逻辑起始点。
前进化动力学是
\dot{x_{i}}=a_{i}x_{i}-(a_{i0}+a_{i1}+d)x_{i}
Xi是长度为i的序列数量,a代表前体i'产生序列i化学反应速率常数,d代表所有序列以d的速率消失(死亡)
在前生命环境的选择中, 速率b>a时,会产生主序列(master sequence)
如果b足够大 主序列会成为主导,即
b>\frac{a+d}{logk}n
k为功能RNR
当b趋向于无穷 ,u=0时,主序列的均衡数量会达到最大化
对于主序列的选择,为了达到最大值的u/k比值需要满足
\mu<\frac{logk}{n}(b\rightarrow\infty)
如果将前进化动力学和复制动力学结合起来就会产生以下公式
\dot{x_{i}}=(a_{i}x_{i}-(a_{i0}+a_{i1}+d)x_{i})+rx_{i}(f_{i}-\phi)
\mu<\frac{logk}{n}(b\rightarrow\infty)
其中要使replicator成为主导序列,要满足
\mu<\frac{1}{n}log(\frac{rf_{i}}{d+a_{i0}+a_{i1}})
对于单项式的复制动力学,作者设置公式为
\dot{x_{i}}=ax_{i-1}+(a+d)x_{i}+rx_{i}(f_{i}-\phi)
即将d由二项式简化为单项式
通过对复制动力学的探讨和模拟,作者探索了从前生命到生命的哪一段过程。(具体见论文http://linkinghub.elsevier.com/retrieve/pii/S002251930800516X)
以上三个讲座,限于背景知识的缺乏,只能简单地把记下的内容复述一下。下面两个社会科学方面的应用确实对我有一些启发。
第二个讲座的题目是《winner don't punish》这个研究是Novak对人类合作问题的最新研究,2008年发表在了Nature上(http://people.fas.harvard.edu/~drand/dreber_rand_fudenberg_nowak_nature_2008.pdf)了,引起了比较大的反响。通俗介绍文章见http://feed.yeeyan.com/articles/view/8jie/5952?tag_related。
讲座者David G. Rand开始提出了合作博弈的一般形式
对手策略
合作 背叛
本人策略合作 b-c -c
背叛 b 0
其中b>c>0,b-c是双方合作的收益,-c是合作者遭遇对手背叛的损失,b是背叛者从合作者身上获得收益。如果双方背叛,那么各自收益为0。
按单步合作博弈的推理,背叛是最优策略。进化的逻辑是最优者生存。然而合作在人类社会有广泛存在,两者出现了矛盾。于是合作如何在进化中是可能的成了进化研究的热点。David G. Rand简要提了合作进化研究的五个取向:kin selection,direct reciprocity, indirect reprociprocity, graph selction, group selection(Matin novak等在《theoretica ecology:principle and application》3rdl写的《How populations cohere: five rules for cooperation》一文有较详细的描述)。作者介绍自己采用系统取向(system approach)研究合作进化:建立动力学模型用计算机模拟结果,采用行为实验的方式在现实人身上进行验证。
David G. Rand首先介绍了自己对文化进化理解。他认为文化进化是观念/策略的传播。人们互相模仿从而产生了比较固定的行为模式。对于新的策略,人们会进行实验,根据结果决定取舍。更优的策略会在人群中传播开来
对合作的研究中,有人提出人们用有代价的惩罚来维持合作。换句话说,个体通过付出一定的损失,使对手输掉game。在非重复博弈中,有代价的惩罚能够使合作得到稳固。因为重复/名声是理解人类行为的关键,所以真正有效的行为规范在重复博弈中也必须得到验证。于是Novak和讲座者在对重复囚徒博弈中的有代价惩罚进行了研究。他们在合作层次、群体支付和个体支付中等方面进行了系统分析。分析的结论就是讲座的题目:胜者不会惩罚。
他们设计了一个行为实验中,104名学生参加了重复囚徒困境博弈(修正过)实验。被试坐在计算机旁,匿名通过软件z-TREE互相交互。他们按照指导语自由选定相应的策略(合作、背叛、惩罚),每一轮结束后向被试呈现对手的选择和分数(具体过程见http://people.fas.harvard.edu/~drand/dreber_rand_fudenberg_nowak_nature_2008.pdf)。实验结果发现在群体层次上,有代价的惩罚确会产生更多的合作,但是平均支付值并没有提高。因为运用惩罚导致了对手的反惩罚,通过宽恕对手的背叛反而能维持合作。在演讲的过程中,观众问了一些实验操作方面的问题,如何控制情绪、性别、年龄和文化差异之类的混淆变量。演讲者作了说明,承认将实验结果在不同年龄和文化上进行推广是一个重要的问题,需要跨文化和跨年龄的验证。这儿他举了中科院Yi Tao小组的重复实验,实验结果再次证明了胜者不会惩罚,甚至惩罚会导致更低的分数。通过演化动力学的分析和实验研究,David G. Rand得出结论:惩罚是无效的。
David G. Rand又介绍他的有代价惩罚的直接互惠研究(论文见http://people.fas.harvard.edu/~drand/rand_ohtsuki_nowak_2009_jtb.pdf)。通过计算机模拟,他们考虑了各种反应策略。结果发现,只有在合作的成本大于惩罚的成本的情况下,才会出现唯一的均衡合作策略-GTFT。在对有限群体的演化动力学进行模拟发现,自然选择更偏好GTFT而不是有代价的惩罚。从而他再次论证了研究的结论:惩罚对个体是坏的,对群体是无效的,是不被自然选择所偏好的。
为了进一步说明以上结论,David G. Rand将研究范式从囚徒困境的成对博弈推广到公共品博弈(http://www.sciencemag.org/cgi/content/full/325/5945/1272?ijkey=HBgDvgAf6FZm.&keytype=ref&siteid=sc)i。在公共品博弈中针对性的合作变得更不可能。但通过行为实验发现合作能够破坏惩罚,使得针对性的互动增加。奖赏的作用在最后一轮以外都有效(end-game-effect)。积极的互动能够促进公共合作,三个实验组在贡献、最大支付、总支付都产生了积极的结果。因此互惠的优势通过实验得到了证明。奖赏得到了更高的偿付,惩罚得到了更低的偿付。惩罚不能增加贡献却耗费了成本。他总结说重复公共品博弈试验中,奖赏和惩罚一样有效。但奖赏能创造收益,而惩罚只会破坏。
David G. Rand最后提了一些可能的问题,他承认在一些情况下惩罚可能是适应性的,如个体限制了活动的空间,asymmetric/dominance game、保护财产、强迫情况下。他还提了机构性惩罚
感想: 讲座中,David G. Rand比较细地介绍了行为实验的细节,如性别、年龄、流程和报酬(30刀,中科院是50元)。这对我了解行为实验的程序有很大的帮助。他的研究说明单纯的惩罚是无法维持长时间的合作的。但是如果先进行口头的惩罚警告,即在背叛后一轮依旧保持合作,但同时提出对下一轮惩罚的警告,是否可以更好地维持合作?还有就是作者假设个体之间是随机交互的,如果个体处于某种特殊的人际网络中,如几个族群的互动,族群内部成员相互较为熟悉,惩罚的效果会有什么变化么?
第五讲的题目是《imitation for vaccination》演讲者Daniel Rosonbloom试图利用演化动力学找出疫苗接种过程中的机制。
他首先提出疫苗接种中的问题:
1、自愿接受疫苗在什么时候有效
2、什么时候我们会遇到麻烦出现疫苗恐慌
3、疫苗和媒体之间的关系是什么?
Bauch2005年提出了一个简单的模型解释了疫苗过程中出现的现象(http://rspb.royalsocietypublishing.org/content/272/1573/1669.full#ref-19),但是并没有完全解释这种现象。作者的模型试图包括疫苗恐慌和达到herd-immunity的可能性/普遍免疫几个特殊现象。他的基本假定是
1、疫苗能够防止自己和邻居感染病毒
2、人们模仿成功行为的邻居,
3、在不接种疫苗时人们有一定的概率感染病毒
作者的模型中,人口中有比例为x的人付出代价v(0
f(P_{i}-P_{j})=\frac{1}{1+e^{-\beta(P_{j-}P_{i})}}
Pj,Pi是上一轮的支付函数
这样作者通过对模型进行计算机模拟发现了很多有趣的结果。
计算机模型中会出现纳什均衡。纳什均衡情况下,疫苗的支付为-r, 非疫苗的支付是-1-x, x=1-r。社会优化的结果是在x=1-1/r^2时最大为-xr-(1-x)^2。
模型中出现了疫苗困境(vaccination dillema)。疫苗困境中,模仿而不是自私成为现实问题。人们倾向于模仿邻居的行为,这就使得疫苗接种出现非理性的因素。
模型中,人口结构是把双刃剑。r低的情况下,人口结构促进疫苗接种,空间结构会阻碍传染病的传播但是在临界值r以上,疫苗的覆盖率急剧降低(类似疫苗恐慌)。临界值r的数量级相比于完全混合的总体要更高。对于无尺度网络 hubs使疫苗接种更频繁。高节点度的节点有多于10%的可能性进行疫苗接种。感染的效果仅仅依赖于未接种疫苗邻居的数量而不是比例。
对于模型的结果通过修正模型风险函数、采用不同的更新动力学进行重复验证,结果没有改变
作者通过模型提出三点建议
1、自愿接种疫苗应该成为一个重要的政策
2、接种疫苗成本的极小波动会对疫苗覆盖率产生很大的影响
3、一点点信息是个糟糕的事情。
最后作者展望了随后的研究方向:从成对感染动力学到同伴影响网络,将疫苗成本设为随机变量,而不是固定参数。
作者设置了模仿这种非理性行为。虽然简单,但模仿机制确实能够再现疫苗恐慌和疫苗接种比例这些宏观现象。而不同的网络结构又能对接种疫苗行为产生深远的影响。借助模仿机制和无尺度网络,作者较好地模拟了疫苗接种行为。这两者在未来也许也能成为我有重要的参考价值。如何增加计算机模拟实验的外部效度?作者通过更新动力学进行重复验证,来尽可能保证结果的有效。这种思路也值得我借鉴。
中间休息的时候,和中科院理论研究所的同学聊天,了解他们进行演化动力学的编程工具是C、matlab、maple(尤其提到画图功能很强)。用这些基础的软件进行模拟,真够汗的!他们承认文化很难量化,倾向于把文化看成一种倾向、偏好。他们采用的基本博弈范式是dawk-dove、snow-drift、prisoner dillema 范式。对于现在的演化动力学,他们似乎还不是很满意,因为计算机模拟中经验假设过多。比如合作者旁边合作者比背叛者旁边合作者更多,就作为一个没有严格验证的重要前提。因此演化动力学还是要走用计算机模拟结果提出假设,依靠行为实验进行验证的路子。现在的演化动力学和复杂网络日益结合,采用scale-free newwork、small world network作为模拟网络。在他们看来,网络结构越简单,拟合越好,但演化越慢。对非理性的量化还停留在模仿行为等简单的非理性行为方面。
这一天,总的来说了解了演化动力学前沿的几个重要的领域,认识到了演化动力学的强大威力。同时也见识了哈佛大学博士的风采。五位哈佛博士稳重自信的风格给我留下了很深的印象。他们对自己的领域都有自己独到的理解和把握。也许,自己的专业兴趣和对演化动力学的独特理解是他们能够提出好的issue的原因所在。对于自己来说,还是应该在理解进化的基础上走自己的路。