2009年10月20日星期二

12号演化动力学讲座笔记

12号一整天听了5个演化动力学的报告。虽然领域很杂,很多背景知识不熟悉,听的也头昏脑胀,但是收获还是不少的。下面是对听的内容的一点整理。

第一个讲座的题目是《simplest stochastic model of tumor progression》。讲座者Tibor Anal对肿瘤的发展用演化动力学建立简单的模型。由于相关的专业知识我并不懂,我只能简单地理解一下他的思路。所有正常细胞都有常规的生命周期。然而在细胞复制的过程中出现了一些细胞发生了突变。他们的生存时间比一般细胞更长。这就是肿瘤细胞。所谓细胞变异的产物,肿瘤细胞如何体内如何发展的呢。Tibor Anal考察了单个变异的例子和多重变异的例子。在细胞的分裂复制的过程中,一个细胞A分裂成两个细胞A。这是正常的过程。但是一些情况下一个细胞A分裂产生一个细胞A和一个细胞B甚至产生两个细胞B。在不断分裂的过程中细胞B又会发生变异产生细胞C。于是变异就使得新生的细胞与原有的正常细胞之间的差别越来越大。对于变异细胞发生的比率分布,Tibor Anal运用了随机过程模型对细胞变异过程进行了建模,如Backward kolmogorov equation wright-fisher equation。他建立一个简单的模型,并通过详细的实验进行了验证,发现模型确实能够比较好地模拟实验结果。模型同时可以提供一些精确的方程解。这说明简单的演化动力学公式在肿瘤研究领域可以适宜的运用。他主张变异会为肿瘤发展研究提供新的启发。


第三讲的题目是《evolutionary dynamic of matabolic system》。Thoma Pfeiffer从cross feeding ,rate/field,emergent of network property三个方面介绍了在新城代谢系统中演化动力学的应用,作者把化学系统的演化也看成是受演化动力学支配。新陈代谢的关键问题是ATP的生产。指标有ATP的生产速率、酶浓度和中介浓度。新陈代谢就涉及到以上这些指标的优化。其中低资源浓缩会生成长期路径,高资源浓缩会生成短期路径。这儿就出现了速率和领域的权衡。这也成为了cross-feeding演化的重要前提。作者用计算机模拟新陈代谢的演化规律。从初始链开始(E1......Em),计算稳定状态、浓度和种群大小。多次重复,其中让最好的变异链入侵,再计算新的稳定状态(变异链可以与原链并存或竞争过原链)。如果不存在可以如期的新链时演化终止。模拟的结果发现cross-feeding确实可能来自对期望高稀释率和高中介成本的路径优化。要注意的是临界行为的微小变化会导致种群结构的巨大变化。在热力学中ATP生产速率和领域之间的权衡会导致一种两难困境。如果种群使用资源高效,那么支付就高。反之,支付低的资源使用效率就低,更容易被其他高效变异入侵。Thoma Pfeiffer把慢而有效的ATP生产类比于合作行为,快而低效的ATP生产类比于自私行为。这就把ATP的生产效率问题转化为了合作的演化问题。Richard Lenoki的对E coli的长期演化实验提供了实证的证据。它表明领域/速率的权衡确实会导致公共品困境。最后,Thoma Pfeiffer讨论了新城代谢网络的演化。他认为酶的共同演化以及不同种群之间的复制和特殊化导致了新陈代谢网络的演化。新城代谢网络也符合无尺度网络的特性,符合幂律关系。group transfer是hub涌现的必要条件。


第四讲的题目是《origin of life --critical transition in prebiotic chemistry》演讲者michael manapat将前进化动力学和选择动力学结合起来组成方程来考察 。

为了解释生命的起源问题,作者提出了前进化、前生命作为进化的逻辑起始点。

前进化动力学是
\dot{x_{i}}=a_{i}x_{i}-(a_{i0}+a_{i1}+d)x_{i}
Xi是长度为i的序列数量,a代表前体i'产生序列i化学反应速率常数,d代表所有序列以d的速率消失(死亡)

在前生命环境的选择中, 速率b>a时,会产生主序列(master sequence)

如果b足够大 主序列会成为主导,即
b>\frac{a+d}{logk}n
k为功能RNR

当b趋向于无穷 ,u=0时,主序列的均衡数量会达到最大化

对于主序列的选择,为了达到最大值的u/k比值需要满足
\mu<\frac{logk}{n}(b\rightarrow\infty)
如果将前进化动力学和复制动力学结合起来就会产生以下公式
\dot{x_{i}}=(a_{i}x_{i}-(a_{i0}+a_{i1}+d)x_{i})+rx_{i}(f_{i}-\phi)
\mu<\frac{logk}{n}(b\rightarrow\infty)
其中要使replicator成为主导序列,要满足
\mu<\frac{1}{n}log(\frac{rf_{i}}{d+a_{i0}+a_{i1}})
对于单项式的复制动力学,作者设置公式为

\dot{x_{i}}=ax_{i-1}+(a+d)x_{i}+rx_{i}(f_{i}-\phi)
即将d由二项式简化为单项式
通过对复制动力学的探讨和模拟,作者探索了从前生命到生命的哪一段过程。(具体见论文http://linkinghub.elsevier.com/retrieve/pii/S002251930800516X)




以上三个讲座,限于背景知识的缺乏,只能简单地把记下的内容复述一下。下面两个社会科学方面的应用确实对我有一些启发。


第二个讲座的题目是《winner don't punish》这个研究是Novak对人类合作问题的最新研究,2008年发表在了Nature上(http://people.fas.harvard.edu/~drand/dreber_rand_fudenberg_nowak_nature_2008.pdf)了,引起了比较大的反响。通俗介绍文章见http://feed.yeeyan.com/articles/view/8jie/5952?tag_related。

讲座者David G. Rand开始提出了合作博弈的一般形式
对手策略
合作 背叛
本人策略合作 b-c -c
背叛 b 0
其中b>c>0,b-c是双方合作的收益,-c是合作者遭遇对手背叛的损失,b是背叛者从合作者身上获得收益。如果双方背叛,那么各自收益为0。

按单步合作博弈的推理,背叛是最优策略。进化的逻辑是最优者生存。然而合作在人类社会有广泛存在,两者出现了矛盾。于是合作如何在进化中是可能的成了进化研究的热点。David G. Rand简要提了合作进化研究的五个取向:kin selection,direct reciprocity, indirect reprociprocity, graph selction, group selection(Matin novak等在《theoretica ecology:principle and application》3rdl写的《How populations cohere: five rules for cooperation》一文有较详细的描述)。作者介绍自己采用系统取向(system approach)研究合作进化:建立动力学模型用计算机模拟结果,采用行为实验的方式在现实人身上进行验证。

David G. Rand首先介绍了自己对文化进化理解。他认为文化进化是观念/策略的传播。人们互相模仿从而产生了比较固定的行为模式。对于新的策略,人们会进行实验,根据结果决定取舍。更优的策略会在人群中传播开来

对合作的研究中,有人提出人们用有代价的惩罚来维持合作。换句话说,个体通过付出一定的损失,使对手输掉game。在非重复博弈中,有代价的惩罚能够使合作得到稳固。因为重复/名声是理解人类行为的关键,所以真正有效的行为规范在重复博弈中也必须得到验证。于是Novak和讲座者在对重复囚徒博弈中的有代价惩罚进行了研究。他们在合作层次、群体支付和个体支付中等方面进行了系统分析。分析的结论就是讲座的题目:胜者不会惩罚。

他们设计了一个行为实验中,104名学生参加了重复囚徒困境博弈(修正过)实验。被试坐在计算机旁,匿名通过软件z-TREE互相交互。他们按照指导语自由选定相应的策略(合作、背叛、惩罚),每一轮结束后向被试呈现对手的选择和分数(具体过程见http://people.fas.harvard.edu/~drand/dreber_rand_fudenberg_nowak_nature_2008.pdf)。实验结果发现在群体层次上,有代价的惩罚确会产生更多的合作,但是平均支付值并没有提高。因为运用惩罚导致了对手的反惩罚,通过宽恕对手的背叛反而能维持合作。在演讲的过程中,观众问了一些实验操作方面的问题,如何控制情绪、性别、年龄和文化差异之类的混淆变量。演讲者作了说明,承认将实验结果在不同年龄和文化上进行推广是一个重要的问题,需要跨文化和跨年龄的验证。这儿他举了中科院Yi Tao小组的重复实验,实验结果再次证明了胜者不会惩罚,甚至惩罚会导致更低的分数。通过演化动力学的分析和实验研究,David G. Rand得出结论:惩罚是无效的。

David G. Rand又介绍他的有代价惩罚的直接互惠研究(论文见http://people.fas.harvard.edu/~drand/rand_ohtsuki_nowak_2009_jtb.pdf)。通过计算机模拟,他们考虑了各种反应策略。结果发现,只有在合作的成本大于惩罚的成本的情况下,才会出现唯一的均衡合作策略-GTFT。在对有限群体的演化动力学进行模拟发现,自然选择更偏好GTFT而不是有代价的惩罚。从而他再次论证了研究的结论:惩罚对个体是坏的,对群体是无效的,是不被自然选择所偏好的。

为了进一步说明以上结论,David G. Rand将研究范式从囚徒困境的成对博弈推广到公共品博弈(http://www.sciencemag.org/cgi/content/full/325/5945/1272?ijkey=HBgDvgAf6FZm.&keytype=ref&siteid=sc)i。在公共品博弈中针对性的合作变得更不可能。但通过行为实验发现合作能够破坏惩罚,使得针对性的互动增加。奖赏的作用在最后一轮以外都有效(end-game-effect)。积极的互动能够促进公共合作,三个实验组在贡献、最大支付、总支付都产生了积极的结果。因此互惠的优势通过实验得到了证明。奖赏得到了更高的偿付,惩罚得到了更低的偿付。惩罚不能增加贡献却耗费了成本。他总结说重复公共品博弈试验中,奖赏和惩罚一样有效。但奖赏能创造收益,而惩罚只会破坏。

David G. Rand最后提了一些可能的问题,他承认在一些情况下惩罚可能是适应性的,如个体限制了活动的空间,asymmetric/dominance game、保护财产、强迫情况下。他还提了机构性惩罚

感想: 讲座中,David G. Rand比较细地介绍了行为实验的细节,如性别、年龄、流程和报酬(30刀,中科院是50元)。这对我了解行为实验的程序有很大的帮助。他的研究说明单纯的惩罚是无法维持长时间的合作的。但是如果先进行口头的惩罚警告,即在背叛后一轮依旧保持合作,但同时提出对下一轮惩罚的警告,是否可以更好地维持合作?还有就是作者假设个体之间是随机交互的,如果个体处于某种特殊的人际网络中,如几个族群的互动,族群内部成员相互较为熟悉,惩罚的效果会有什么变化么?


第五讲的题目是《imitation for vaccination》演讲者Daniel Rosonbloom试图利用演化动力学找出疫苗接种过程中的机制。

他首先提出疫苗接种中的问题:
1、自愿接受疫苗在什么时候有效
2、什么时候我们会遇到麻烦出现疫苗恐慌
3、疫苗和媒体之间的关系是什么?

Bauch2005年提出了一个简单的模型解释了疫苗过程中出现的现象(http://rspb.royalsocietypublishing.org/content/272/1573/1669.full#ref-19),但是并没有完全解释这种现象。作者的模型试图包括疫苗恐慌和达到herd-immunity的可能性/普遍免疫几个特殊现象。他的基本假定是
1、疫苗能够防止自己和邻居感染病毒
2、人们模仿成功行为的邻居,
3、在不接种疫苗时人们有一定的概率感染病毒

作者的模型中,人口中有比例为x的人付出代价v(0 f(P_{i}-P_{j})=\frac{1}{1+e^{-\beta(P_{j-}P_{i})}}
Pj,Pi是上一轮的支付函数

这样作者通过对模型进行计算机模拟发现了很多有趣的结果。

计算机模型中会出现纳什均衡。纳什均衡情况下,疫苗的支付为-r, 非疫苗的支付是-1-x, x=1-r。社会优化的结果是在x=1-1/r^2时最大为-xr-(1-x)^2。

模型中出现了疫苗困境(vaccination dillema)。疫苗困境中,模仿而不是自私成为现实问题。人们倾向于模仿邻居的行为,这就使得疫苗接种出现非理性的因素。

模型中,人口结构是把双刃剑。r低的情况下,人口结构促进疫苗接种,空间结构会阻碍传染病的传播但是在临界值r以上,疫苗的覆盖率急剧降低(类似疫苗恐慌)。临界值r的数量级相比于完全混合的总体要更高。对于无尺度网络 hubs使疫苗接种更频繁。高节点度的节点有多于10%的可能性进行疫苗接种。感染的效果仅仅依赖于未接种疫苗邻居的数量而不是比例。

对于模型的结果通过修正模型风险函数、采用不同的更新动力学进行重复验证,结果没有改变

作者通过模型提出三点建议
1、自愿接种疫苗应该成为一个重要的政策
2、接种疫苗成本的极小波动会对疫苗覆盖率产生很大的影响
3、一点点信息是个糟糕的事情。

最后作者展望了随后的研究方向:从成对感染动力学到同伴影响网络,将疫苗成本设为随机变量,而不是固定参数。

作者设置了模仿这种非理性行为。虽然简单,但模仿机制确实能够再现疫苗恐慌和疫苗接种比例这些宏观现象。而不同的网络结构又能对接种疫苗行为产生深远的影响。借助模仿机制和无尺度网络,作者较好地模拟了疫苗接种行为。这两者在未来也许也能成为我有重要的参考价值。如何增加计算机模拟实验的外部效度?作者通过更新动力学进行重复验证,来尽可能保证结果的有效。这种思路也值得我借鉴。

中间休息的时候,和中科院理论研究所的同学聊天,了解他们进行演化动力学的编程工具是C、matlab、maple(尤其提到画图功能很强)。用这些基础的软件进行模拟,真够汗的!他们承认文化很难量化,倾向于把文化看成一种倾向、偏好。他们采用的基本博弈范式是dawk-dove、snow-drift、prisoner dillema 范式。对于现在的演化动力学,他们似乎还不是很满意,因为计算机模拟中经验假设过多。比如合作者旁边合作者比背叛者旁边合作者更多,就作为一个没有严格验证的重要前提。因此演化动力学还是要走用计算机模拟结果提出假设,依靠行为实验进行验证的路子。现在的演化动力学和复杂网络日益结合,采用scale-free newwork、small world network作为模拟网络。在他们看来,网络结构越简单,拟合越好,但演化越慢。对非理性的量化还停留在模仿行为等简单的非理性行为方面。

这一天,总的来说了解了演化动力学前沿的几个重要的领域,认识到了演化动力学的强大威力。同时也见识了哈佛大学博士的风采。五位哈佛博士稳重自信的风格给我留下了很深的印象。他们对自己的领域都有自己独到的理解和把握。也许,自己的专业兴趣和对演化动力学的独特理解是他们能够提出好的issue的原因所在。对于自己来说,还是应该在理解进化的基础上走自己的路。

2009年4月14日星期二

人格系统、文化系统和动力系统理论

以下是我从复杂动力系统视角对文化心理学的思考。我准备以Micshel的文化认知-情感模型为框架,试图尽可能综合自己最近看和感兴趣的内容。

原先的人格心理学把人格看作是一系列独立于背景的稳定特质的集合。古代希腊人认为有四种类型的人:胆汁质、多血质、粘液质和抑郁质。近代心理学家卡特尔的16特质量表更是把人格分成16种互相独立的特质。在对人格进行孜孜不倦的分类的背后是对人格稳定性的信念。他们相信,人格能够预测行为,在不同的情景下人格具有一致性。然而这种相信人格稳定的观点在20年代后期得到了越来越多的质疑。研究表明,人格与行为之间只有较低的相关。人格的跨情景一致性始终没得到证实。人格的自陈报告和他人评定之间有很大的差异。甚至研究发现,没有人格跨情景一致性的个体相比能够更好地适应环境。Mischel在1968年最先提出提出这一系列问题。人格心理学界由此开始放弃人格稳定性的假说,转而重视和强调情景。

如何才能真正的了解一个人?不是从个体稳定的维度上找证据,而是看他在特定条件下的特定行为。光说一个人具有勇敢的品质是不对的,而是应该看他在遇到危险的情景下能否表现出英勇的行为。只有结合特定的情景才能真正的了解一个人的行为。所谓周公恐惧流言时,如果不是结合当时的情况理解周公的特定行为,而是单纯的从特质的角度将行为的意义无限推广和稳定化,那么就会得出周公是奸臣这个错误的结论。从情景与个体的交互过程中,我们可以抽象出if, then这个一般的模式。if后面跟着是情景,then后面跟着是行为。这个关系虽然简单,但是有很大的适用性和意义,这一点会在后面在进行详述。Mischel由此l将if then 模式看成是构成个体行为规则的稳定的基本模块。在统一个体身上,针对相似的情景,他会表现出相似的反应。

通过对夏令营儿童的研究,Mischel证实了个体内部if then模式的稳定性。他首先对儿童再夏令营生活中的基本情景进行归类。因为名义情景不等于儿童实际知觉到的情景。同一物理对不同的儿童意义是不同的。例如,成人奖励了10元钱,有的孩子会欢呼雀跃,有的孩子会表现得不满意。为了避免名义情景的似是而非,他通过对儿童的同伴和老师进行访谈的方式,收集关于儿童夏令营生活的基本生活信息,来确定真实的心理情景。通过统计上的聚类分析,Mischel 区分了五种基本情景:被同伴取笑,被同伴称赞,同伴逼近,被成人警告,被成人惩罚。在这五种基本情景下,他将收集到了儿童夏令营中的具体行为进行分析。结果发现,同一儿童的行为在相同的情景下有显著的一致性,而不同儿童在相同情景下的行为具有显著的差异性。这一研究证实了尽管个体之间的行为模式在同一情景下有很大的差异,但个体内部if then模式具有较强的稳定性。在我看来,这一研究还有一层意义,就是为个体心智模型中的因果模型的存在性和稳定性提供了有效的证据。if then 模式是因果模型的基石,个体行为的因果关系能够由此得到清楚的定义和归纳。正是在if then模式的指导下,个体认识和处理了自己与自然、社会的关系,并且在此基础上形成动态而非稳定的自我。

以个体与情景的交互作用为核心,Mischel提出了他的文化认知情感模型。简单的说,模型分为三个部分:文化与情景,认知-情感网络和if then 模式。每一个部分又有细的划分。文化和情景部分可以细分为主观文化(个体信念和价值观系统)、物理文化(客观的文化设施与实践)和名义情景(每个人在日常生活的遇到的具体情景)。三者的关系简单的说就是从抽象到具体的上下层级关系。主观文化和物理文化相互影响,名义情景是物理文化下的具体情景。认知-情感网络是由五类基本的认知情感单元组成的网络结构。五类单元分别是编码、目标、情感和情绪、期待与信念、行动计划。这五类单元构成了多样而复杂的网络。if then模式是个体根据情景和内部认知模式而形成的行为反应。它的具体数目随着情景的复杂性而变得相当庞大。三个部分又相互关联。情景的重要特质被认知情感网络根据适用性和可接近性的原则提取,在网络中进行动态扩散和激活单元后,产生特定的if then模式,引发特定的行为。同时个体对文化情景又有重要影响。文化特质可以看成是个体具体策略的涌现现象,个体的主观意识又要对客观情景进行心理上的辨别、界定和归类。三个部分的相互作用,构成了一个复杂而动态的过程。下面会围绕三个部分进行更详细的讨论。

1.文化和情景

文化是个宽泛而复杂的概念。每一个学者对文化都有不同的认识和定义。早期,文化被看作是人们对环境的一种独特的适应方式,一种生活方式。像祭祀、宗教、民俗、科学、艺术、神话、文学等等都被看成是文化的组成成分。随后,人们在文化研究中倾向于研究个体的文化性格,即国民性。这种观点把文化看成一个依附于人格的稳定特征。随着人格跨情景一致性的质疑,文化性格研究的结果也被怀疑和批判。文化的研究逐渐从客观的物理文化向主观文化转变。现在的主流观点把文化看成一个影响行为的认知、规则和意义系统。尽管文化通过局部价值规范的形式对个体发挥着作用,文化在整体上可以看成是一个文化/社会体系,是文化成员共同拥有的规则。根据杨中芳的观点,文化是个广泛的社会文化历史环境体系,个体生活在特定的社会历史环境体系中,并在具体情境中每时每刻受着它的影响。社会文化历史环境体系是一个在不断变化的意义系统,在变化的同时其基本价值规则也由个体得到了传承,具有一定的连续性。要强调的是社会历史环境体系和个体都统一的整体,两者都有着多层次结构的关系。

如果结合上面对文化的讨论和复杂系统的观点,文化是由个体行为的交互作用而涌现生成的稳定和依赖情景的知识和规则模式。人们之间共享和合作的行为有助团体和文化的产生。每一个主体发展出一系列策略,以适应不同的情景。在不断的演化过程中,每个主体形成了稳定而一致的策略。主体的行为策略机制互相关联,构成网络结构,并在情景的限制下在宏观上形成特定的稳定模式。文化就在宏观层面上涌现生成了。这个过程中,主体并不是一个完全理性的个体。它有着有限的认知容量,且受动机的支配,行为上具有一定的惯性。人们根据以上观点开展了文化的行为动力学模拟和行为博弈模拟。

文化的形成是社会历史发展的过程。因此人类行为动力学试图从影响人类行为的因果力入手,讨论人类的历史文化变迁。它关注网络互动、群体、社会运动和历史变迁这一系列现象。人类行为动力学研究首先确定所要研究的分析单元,写出单元之间的交互方程和结构,在多个层次上展开分析, 获取必要的统计量。在现有阶段,人类行为动力学主要关注两种因果力,凝聚力和阻抗力。前者有助于社区和国家的形成,,后者会导致社区和国家的解体。这两个因果力是通过人际交互而逐步产生和变化的。在微观层次上,个体之间合作行为的产生可以促进宏观层次上凝聚力的形成。根据这两个因果力,专家们建构了微分方程。借助这些方程,人们可以对历史上国家扩张速度、人口变化速率和政权稳定性进行统计分析和预测。人类行为动力学研究的指导下,人们可以对战争、革命、市场变化、民主程度等社会现象在计算机模型中得到一定程度的再现。这种取向虽然刚发展起来,却具有很强的生命力。通过改进统计数据的收集和统计方法两个阶段的工作,人类行为动力学可以在未来发挥更好的效力。

同时,行为博弈的计算机模拟研究也模拟出了文化的几个基本特性。在行为博弈模拟过程中,研究者把主体设定为具有有限认知容量,在囚徒困境和自我利益博弈情境下,将多个主体进行同时和多次模拟。结果发现计算机模拟生成了几条和文化有关的基本特性:1)个体内部行为一致性;2)个体之间的行为一致性;3)情景依赖效应;4)行为的非最优性;5)行为的粘着性。其中情景依赖效应正符合了文化认知情感模型对情景的强调,可以看成是生物进化的必然结果。

毫无疑问,情景依赖在个体行为中起着至关重要的作用。个体是在不同的情景中才逐步发展出自己的行为方式和策略的。现在很多人事测验也看重个体在具体情景中的能力。比如情景测验中的公文包测验、 无领导小组讨论、结构化面试就重点考察应聘者在具体商业情景下的能力。另外心理学家还开发出了情景判断测验,通过要求受测者看一段文字的或视屏的情景,在多个选项中选择自己认为最合适的选项。这些测验的结果与受测者未来的工作绩效都有很高的相关。同时在社会和文化心理学研究中,心理学家也可以通过模拟一系列社会情景来考察个体特定的行为反应。模拟社会和文化情景可以通过行为博弈试验、想象模拟情景和文化启动范式进行。只有在真正理解和呈现特定情景的基础上,个体的社会和文化行为才能得到很好认识和研究。

2、认知情感网络

认知情感网络是模型的核心内容。五类基本的认知情感单元互相作用,形成一个动态而复杂的网络结构。对输入的情景信息,认知情感网络首先根据适用性和可接近性原则进行筛选和分析。关于可接近性的判定,是个体在和同一文化团体成员的长期交流和分享经验的基础上形成的。在长时间的共同文化实践过程中,个体对某些情景特征产生了敏感而一致的反应,这叫做长期的可接近性。同时还存在短期的可接近性,通过短时间呈现一个背景线索,可以激活个体相应的知识、规则。比如所给被试呈现一个中国文化背景的图片(天安门、龙),会激活双文化被试的群体归因和合作行为,而呈现一个美国文化背景的图片(星条旗、白宫)会激活被试的个人归因和个性行为。短期的可接近性要求我们注意某些特定符号在特定文化背景下的重要意义。在某些认知情感单元激活以后,它们会通过网络连接扩散并陆续激活其他单元 ,并在反馈的机制下形成稳定的激活模式,最终产生可观察的行为


需要注意的是,认知情感网络中包含的概念和知识体系可能是矛盾的。赵志裕的共享内隐论认为,人们从日常生活中会总结出一系列现象规律。这些现象规律可以互相矛盾和同时存在。在文化启动范式中,我们可以看到两种不同的文化观念可以同时存在于双文化被试的意识中。在有关命运观和社会不变论的社会情境模拟实验中发现,通过实验情景操作确实可以影响被试对概念的理解和评价。认知情感网络中的概念和知识体系是在具体情景下形成了,所以社会情境和背景线索的设置确实可以影响到个体特定知识的提取。对于何种典型文化情景能够更好和有效的作为可接近性的提取线索,具体的实证研究似乎还很少。因此有必要对典型文化线索进行系统的考察和归类。

认知情感网络是如何产生的?我们可以从种群进化和个体发展两个层次进行解释。通过生物进化过程,个体形成了发达的大脑结构,具有了完整的五类认知情感单元,并具有了相对一致的网络结构框架和控制法则。个体的成长过程中,个体在特定的社会文化情景下,通过实践经历,积累了丰富的经验,逐步促成个体所独有的认知情感网络的完善。要注意的是个体的认知情感网络可以分成共享文化网络和个人经验网络。两者之间有相互影响,但也有相对的独立性。两个在中国长大的孩子,其集体主义行为可能会有较大的差别。这就是不同个人经历对它们的个人经验网络的影响。鉴于文化是通过具体情景作用于个体的,所以在研究中既要考虑文化的影响,更要重视个人具体情景的因素。

if then 模式

最后一个部分是if then模式。它组成了行为的核心框架。if then模式很简单,在计算机程序上就可以很简单的实现。然而简单的背后却蕴含着产生复杂而有效的行为的可能性。复杂适应系统提供了一个很有启发的视角。复杂适应性系统是以适应性主体作为主要单元,用if then模式组成简单的初始规则,用信用分派的方式先标记初始适应度,然后通过遗传算法,将各种规则进行同时多次模拟实验,生成更有效的新规则,以适应现有的环境(较细致的介绍可以参照blog上关于《隐秩序》的读书笔记)。通过复杂性适应系统的研究发现,主体借助遗传算法,可以自动生成各种适应环境的行为规则,其有效性和复杂性超出人们的想象。在随后提出的回声模型中,研究者让各种主体互相接触和交互作用,结果发现主体的适应性规则可以更好地产生。复杂适应性系统就为if then模式在社会文化背景下的有效应用提供了一个很好的理论框架和模拟方法。

现在已有人试图用复杂适应系统来理解人们的行为。意识的ABM(agent based model)模型试图从基本的婴儿行为规则入手,通过演化迭代来逐步生成复杂的行为规则。在模拟过程中,作者强调了语言和意识之间的紧密的联系。他准备借助语言和行动考察意识的活动。他首先确定了意识的六个层次:
意识层次0(无意识活动):指内生的认知能力,比如模仿能力,区分客体与行动能力;
意识层次1(最小意识):重复活动的内部强化,比如将手指向看到的物体;
意识层次2(刺激-反应意识):从语义型长时记忆中提取并发出语义标记,比如发出声音来使母亲笑;
意识层次3(简单的反馈性意识):可以运用语义标记促使别人行动,如当看到食物时,发声来获得食物;
意识层次4(扩展的反馈性意识):当物体未呈现时,可以发出语义标记促使别人行动,如当食物未呈现时要食物;
意识层次5(自我意识):能够通过使用语义标记产生有计划的行动序列,比如说运用一对词对两个相似物体进行分类。
用ABM的语言,可以把六种意识层次解释为:
意识层次0:如果人物T说话,那么模仿说话;
意识层次1:如果递过来一个物体,那么伸出手抓住它;
意识层次2:如果奶瓶呈现,那么说“奶";
意识层次3:如果奶瓶呈现,那么说"奶",T拿来奶瓶,如果奶瓶放在嘴边。那么喝奶;
意识层次 4,如果饿了且没有可见的食物,那么说"奶",T拿来奶瓶,如果奶瓶放在嘴边,那么喝奶;
意识层次5,如果红球和蓝球呈现,那么产生内部信号x,如果内部信号x出现且红球想要,那么产生内部信号y和说"红",如果产生内部信号x和y,那么说"球"。
根据if then模式,先确定个体的元规则,如先天的能力和行为模式,然后应用信用分派对各种规则可能的利害进行权衡和分派信用。在对元规则进行信用分派的情况下,主体通过经验逐步积累和产生新的更有效的规则(假设)。在这个过程中,主体在各个层次建立了各种行为积木。这些有用而相对稳定的积木,能够为个体在复杂环境中形成高效稳定行为提供丰富而可靠的材料。在对环境的长期适应过程中,个体发展出了成熟的内部模型。

从理论兴趣的角度上看,if then模式是因果模型的核心。if then模式的稳定和普遍性代表着因果模型的有效性。针对因果性,Pearl在《causality》一书中做了详细而专业的讨论。这儿不多叙述,作为因果模型和行为模型的基石,if then模式发挥着重要的作用,在理论和实践需要进行更广泛和深入的检验和研究。

语言与社会文化心理

在文化的动力系统理论中,一个关键的主题是语言。语言的重要性不用置疑。古希腊哲学家就普遍认为可以言说的才能成为意识。维特根斯坦也提出,对于不可言说的我们须保持沉默。语言作为人们常用的符号系统,在文化认知-情感模型的三个部分都有着有趣而深入的研究。它可以作为文化和情景的重要组成部分,承载着传递价值观、信念等文化观念的功能。在认知情感网络中,语言作为语义网络和句法网络起到认识世界和与外界交流的作用。在if then模式中,语言可以看成一个复杂性适应系统,从个人经验、社会互动和认知机制的交互模式中涌现出来。

语言作为一种人类社会特有的文化和符号系统,可以表现出使用成员团体的特有的文化特征,并渗透在民俗和文化习惯中。赵志裕的认为要认识一个社会的共享内隐论,可以从这个社会的谚语、格言、成语出发。黃囇莉更是借助维特根斯坦关于“语言游戏”的思考,把日常用语和谚语看成小传统文化,围绕着特定字(如“和”)及其语言家族(如合、同、统)进行相关的字义和成语、谚语的收集分析,考察其中含有的文化观念和功能(如和谐观)。瞿学伟归纳了进行语义分析的具体流程,1)寻找与研究文化观念有关的日常使用最频繁的词句;2)通过构词的特点寻找相近的表达法,将其意义扩大,用训诂的方式理解和贯通其内在意义;3)将其放回社会文化中理解语言背后的心理结构。以上研究可以看出语言在文化情景下的重要性。语义分析也可以为我们对文化和社会情景的划分提供重要的工具。我们可以在语义上确定考察某一特定的社会行为概念,搜寻相关的语言资料,将行为的具体背景先进行定性的初步划分,然后再在统计上进行聚类分析,从而归纳出行为发生的几个基本情景。比如说我们考察中国人的拜佛行为,我们可以搜集相关文章(确保真实)和访谈资料,对其中涉及的情景先进行定性归类,然后用聚类分析从统计上确定几个基本情景,为进一步的文化心理研究做好准备。

语言可以看成一种重要的复杂动力学网络、借助网络分析,我们可以揭示出语言的很多有趣特性。现在的研究把语言网络分成句法网络、语义网络和语音网络,三者互相影响。研究中建构句法网络的基本流程是:
1)定义单词关系,包括语义关系与先后关系;
2)各自用不同颜色(蓝、黑)箭头表示;
3)将网络上的路径理解成在给定语法下的句子的可能集合;
4)建构相关语义网络,看成是句法的描述性框架。
建构语义网络的流程类似与层次网络模型。每一个节点代表一个概念,概念之间根据他们的关系(如上位关系、下位关系和平行关系)。句法网络受着计算约束、认知约束、交流约束的制约。而语义网络受着分类和概念化过程的认知约束和意义一致性的制约。两种网络都是从在长期的进化过程和社会互动中获得的。在研究中研究者考察各种语言网络的网络特性,发现它们也具有复杂网络的各种特性,如符合Zipf律。现在的语言网络研究还是从宏观的角度却确定总体参数,在微观的角度,我们可以试图确定某一区域语言网络中聚类数比较高的节点,用来考察它们蕴含的文化特性和可能的相互关系。在个体层次上我们可以尝试通过自陈报告、启动范式确定语言概念之间的强度联系,建立个体的生活语言网络,作为分析其认知情感网络的重要材料。从语言网络的研究中,我们可以从另外一个角度对社会成员的文化习惯,个体心理和认知方式进行有效研究。语言网络是刚刚兴起的研究领域。它对文化心理的潜力如上所说,需要得到更多的重视和挖掘。

作为社会互动产物,语言可以看成复杂性适应性系统。研究者设计了多个具有初级语言能力的主体,它们互相接触,根据过去的互动结果,决定现在的行为方式,并为未来的行为取向提供指导。最初的初级语言是与行动直接相关的。通过多次交互互动,语言的一系列复杂特性会从主体身上涌现出来。比如,作为复杂性适应系统的语言会出现以下特征:语言的个体和群体两层次水平;个人习语的多样性;知觉的动态性;非线性和相变化;多种竞争因素下的适应;依赖并敏感于社会结构。研究者希望通过语言的复杂适应系统研究,对语言的日常使用和第二语言的学习机制提供新的更好的认识。Five Graces Group开展了一次主题为"语言是复杂适应性系统“的会议,并准备把会议报告作为《语言学习》杂志的专刊发表。更详细的理解和讨论样等待杂志的出版。

综上所述,语言作为一个可以操作和分析的元素,可以作为文化心理分析的一个有效的中介工具。它渗透在文化心理的各个层次,即可以反映各个部分的机制和心理特性,又把各个部分连接起来成为了一个统一的整体。一句夸张的话,语言在文化心理学的地位类似于数学在物理学中的地位。语言作为一个工具应该在文化心理学中得到更好的理解和推广、

总而言之,文化心理是一个很复杂的现象,有着各种各样的解释和理论。文化的动力系统取向试图以情景和行为的交互作用为核心,从简单的if then规则入手,以复杂网络的结构,通过演化博弈的过程,用计算机模拟(如ABM)和社会情境模拟(如行为博弈)为工具,来理解文化心理的生成、发展和人际间的文化互动过程。这种理论取向具有概念清晰和可操作性强等优点。文化认知情感模型作为一个包容性大和比较成熟的模型,能够为该理论取向提供富有启发性的有效框架。在文化认知情感模型下文化心理有两个特点:文化心理是个体与情景交互作用的过程,人在文化环境中再进行独立判断分析的同时,又自觉和不自觉地受着文化的影响,;文化心理是变异性和差异性的统一,强调情景差异性的同时,又要强调个体认知结构框架和控制原则的普遍性。这两点应该成为未来文化心理研究的核心。

上面对自己对文化心理的动力系统视角的认识做了一个大致的概括和总结。虽然有些庞杂,但是把自己的关注点都尽可能地包容了进来。界定边界是好的研究的开始 。入校的半年多,自己也觉得需要为自己的研究兴趣确定一个框架。也许观点还有很多不成熟的地方,细节还需要进一步的修改和完善, 但是总体思路作为各个神经元的互动而已经涌现出来。接下来的任务就是在具体心理现象的研究中贯彻这种认识。在这个清凉的半夜,我想到了博尔赫斯的《交叉小径的花园》和荷尔德林的《塔楼之诗》。就用它们结尾吧。

时间是永远交叉着的,直到无可数计的将来。-----博尔赫斯的《交叉小径的花园》
生命之旅迥异,犹如歧路,或群山分界。 ------荷尔德林《塔楼之诗》




参考文献
约翰霍兰《涌现》
约翰霍兰《隐秩序》
杨中芳《试论如何研究中国人的性格》
赵志裕,区颖敏,陈静《如何研究社会、文化、和思想行为间的关系?共享内隐论在理论和研究方法上的贡献》
黃囇莉《人际和谐与冲突——本土化的理论和研究》
瞿学伟《中国人的脸面观》
Chi-yue Chiu,Ying-yi Hong,《Cultural Processes: Basic Principles》
Douglas R. Whitea, 《Dynamics of Human Behavior》
Helena H. Gao ,John H. Holland,《Agent-based Models of Levels of Consciousness》
Ricard V. Sole,, et.al 《Language Networks: their structure, function and evolution》
Rodolfo Mendoza-Denton, Walter Mischel, 《Integrating System Approaches to Culture and Personality ——The Cultural Cognitive–Affective Processing System》
Jenna Bednar,Scott Page,《Can Game(S) Theory Explain Culture? The Emergence Of Cultural Behavior Within Multiple Games》
The ‘Five Graces Group’《Language is a Complex Adaptive System》

2009年2月16日星期一

《涌现》读书笔记之“内涵与展望”

隐喻与创新
在这一章,作者集中讨论了隐喻的内涵和意义,以及它对创新的影响。数字和棋类游戏,作者认为这两个是人类社会早期智慧的结晶。两者把世界的规律抽象出来,形成了一个简单而有效的思维框架,能组织起大量的现象和事实。数字现在已是数学以及整个科学的基石。棋类游戏虽然影响没有数字那么大,但是也有着丰富的内涵,人们通过棋类游戏把规则应用到简单的模块中,并形成一个动态而灵活的过程。棋类游戏本身就是人们最早建立的模型。其中概率、推理、预测、决策都蕴含在简单的棋类游戏中。作者认为从棋类游戏开始,人们发展起来了一整套逻辑规则,取得了如欧几里德几何公理体系,牛顿力学体系等诸多成果。而棋类游戏中的动态逻辑也在现在
复杂性研究、博弈论研究中拥有丰富的展现。

科学的创新的关键来自于建模。产生科学成果的过程中,有着想象力和创造力的参与。而这种想象力和创造力在建模中的体现可以彭加勒、爱因斯坦、麦克斯韦等科学家的回忆中得到体现。作者集中讨论了麦克斯韦对自己创立电磁学理论的叙述。针对新的电磁学现象,麦克斯韦把它想像成类似运动流体的几何概念,然后建立流体机械模型,在此基础上得出麦克斯韦电磁学方程式。这个过程中,为了建立目标模型(电磁学现象),麦克斯韦从源模型(假想的运动流体机制)中得到启示,然后建立两者的联系和转换。也就是说建立新的现象(目标模型)的理论,是寻找源模型并完成从源模型到目标模型的转换的过程。在这个过程中如何选择对应,强化两者的共性,简化两者的差异,这是科学研究中的技巧和关键。

对隐喻进行更有针对性的探讨,可以发现隐喻包含源事物和目标事物,以及它们之间的内涵和框架。对于“冰山,海洋上的绿宝石”我们可以联想出各种它们之间的联系,这些联系是精致、微妙而无法穷尽的。因为目标食物和源事物的联系是不断的扩展、变化的,强调一方面,而忽视另一方面。 Eco和Lakoff对此都有很多精妙的叙述。作者归纳了隐喻和模型之间的关系:存在一个源模型,它内部元素之间的关系和规则都已经清楚的确立;存在目标模型,它的机制是模糊的和需要探索的;存在从目标模型到源模型的转换,转换的方法得到了阐述。

在我们已知道积木块的情况下,创造性的活动就在于对积木块的组合。如何选择和组合积木块就是创新活动的关键。作者认为这需要 长时间的刻苦训练,以熟悉和掌握各种积木块。如何通过组合积木块探索更大程度的模式,作者承认这是一个还无法有效解决的专题,在人工智能方面还没有很好的研究。作者认为应该从适应性进化的角度看问题,把模式看成一个不断改进的过程。作者最后希望受限生成过程的发展能够为诗歌创造提供一个很好的模拟工具。

层次描述和还原方法
还原论认为,我们的世界可以通过不断分解而被制约基本成分的几个简单规律所描述。然而把现象完全分解是繁琐和不现实的。基本成分的组合数远远超过我们的计算能力。所以我们试图在宏观层次上给出一些宏观规律,就像物理学中的热力学定律。基于系统在总体上复杂多样的特性,如何选择合适的宏观定律,并与微观层次的基本规律相匹配,就是作者要考虑的重点。作者认为隐喻和跨学科比较是发现合适的宏观规律的关键。

为了是宏观现象与微观现象能够统合,就必须加入层次的概念。而确定多少以及何种层次是直觉性的、非形式化的。因此需要对层次进行仔细的考量。至于受限生成过程中什么是新的层次,作者给出的答案是取决于受限生成过程模型中把几个机制组合成更复杂的机制的可能性。具体的讲为了证明复合的结果C是一个机制,需要证明存在描述复合结果C的转换函数f,f存在独立的状态和输入。这可以通过将组成成分的机制的状态组合起来形成笛卡尔积(以及将组成成分的输入组合起来形成笛卡尔积),在此基础上定义转换函数f.作者举了元胞自动机(3×3格)的例子,先计算可能的复合状态总数和复合输入总数,然后计算机计算复合函数。在计算所有组合的情况下,复合函数的数目是个天文数字。如何应对这个庞大的数字,这考验着科学家的智慧。他们可能会寻找新的更多的基本组成形式,来简化这个过程;或者寻找新的还原方法来发现隐藏的规律,在附加假设的前提下讨论新的更高层次的规则。这给我们的启示是:尽管基本规律可以涵盖所有现象的解释,但我们应该追求较高层次的规律(尽管它们被基本规律约束),这能够增进我们对问题的理解。

涌现现象的基本概念
作者最后小结了涌现现象研究中的关键概念
等价类:删去细节用以强调被选定特征的形式化表示
函数:作为一系列对应关系的形式化表示。
生成器集合:作为规则和规律的形式化表示,给出元素初始集合和元素组合的合法方式。
IF/THEN子句:用来设定所允许的特别是主体之间的相互作用,使主体具有可变性。
状态:系统当前元素的排列组合,和系统总体的状态。两者在在不同情形下有不同的对应关系,比较难以定义。
转换函数:将所有合法的状态和叔叔作为自变量,产生对应关系。可以用概率的方式进行扩展
策略:由系统输入值集合状态的函数决定而产生的输出形式
积木块:指对自然界各种熟悉事物进行分解而产生的基本特征,这是一种灵活而又创造性的方法。
模型:选取显著的特征(等价类)和规律(发生器和转换函数),并在隐喻和“源-目标模型”指引下逐步完成转换,是我们理解新事物的重要方法。
主体:为涌现现象的系统建模提供最快方法,在《隐秩序》一书有详细的介绍。

作者总结了涌现现象的8个要点
1)涌现现象出现在生成系统中
2)在这种生成系统中,总体大于各部分之和。
3)生成系统的一个稳定的涌现现象是,组成成分不断改变的稳定模式。
4)涌现出来的稳定模式的功能是由其所处的环境决定的
5)随着稳定模式的增加,模式间相互作用带来的约束和检验使得系统的功能也在增强。
6)稳定模式通常满足宏观规律。
7)存在差别的的稳定性是那些产生了用现象的规律的典型结果。
8)更高层次的生成过程是有稳定性的强化而产生。

研究领域中的障碍

数学上的障碍:现在的数学工具的是线性假设的,无法应对非线性模型的数学要求。因此在计算机编程建模中需要人们慢慢摸索掌握技巧。元胞自动机是个有趣的例外)

认识的障碍:对于中枢神经系统如何从它从几乎无限的新异输入刺激中选取相关信息,我们还没有成熟的认识

观念的障碍
:一些人对现在科学能够解决涌现现象的复杂问题抱有怀疑的态度。

在涌现现象的进一步研究中,作者认为在明确定义受限生成过程模型的同时需要在机制函数主体行为模型元素集合这三个层次之间建立更紧密的联系。

为了建立有效的涌现理论,首先要用模型作为他探索预期机制和约束时的主要指导,同时在涌现过程中学习更多关于预测和控制的关键阶段。而学到的知识又使我们更好的理解隐喻和创新两种智慧的创造。同时也为我们理解生命和意识打下重要的基础。

《涌现》读书笔记之“西洋跳棋、神经网络和受限生成过程”

西洋跳棋
20世纪50年代塞缪尔设计出了西洋跳棋程序。这对现在的机器学习研究仍然有重要的借鉴意义。塞缪尔在建模中并不试图模拟下棋过程中选手的思维过程,而是在策略的层次上进行研究。他对使用实践经验来修正和改进策略很感兴趣。

根据作者的归纳,西洋跳棋研究中的问题有:
1)跳棋程序必须应付一系列的未知和新异的情形
2)在无法获得反馈来判断自己行为正确与否的情况下,“程序必须学习如何在对弈过程中做出正确选择,即具有一定的学习能力。
3)程序需要学会一些对棋局有利的关键的步骤
4)程序必须为对手行为建模。

而塞缪尔采取的相应的解决方案是:
1)根据棋局的共同特征进行归类,分成若干个集合。
2)程序按照以下步骤学习,先预测行为影响,如果行动后预测没有被证实,就修正所采取的行动。
3)对于关键的步骤,塞缪尔对这些走法的特征赋予一定权重,使之能够预测博弈终点的“最佳结果”
4)在对对手的建模中,塞缪尔假设对手对于优势特征和有利走法,有着和程序一样的认识,这会产生最大最小策略,是对手可能带来的最大破坏最小化。

如何通过赋予权重的方式指定策略,塞缪尔设计了“领先棋子数”(程序所拥有的棋子数减去对手的棋子数)、“领先的王数”、“双方超越中线的净突破数”、“棋子对于中心的散步程度”等组成的重要特征数组,并根据特征的重要性赋予相应的权重。特征值的加权求和就是对整个棋局的评价。这种方法也称为估价函数法。根据相应的棋局评价,程序选择能产生最大值后果的策略。程序根据不断的博弈实践,逐渐改进自己的预测和行动策略。当实际结果与估计后果不一致时,程序会调整相应棋局的预测值(比如由某个正值4变为某个负值-2)。先前越大的权重值越容易得到调整。调整的最终结果是使棋局的最终结果能够对自己有利。塞缪尔的权重改变技术是程序学习的关键所在,尽管还存在很多问题(如需要相当多的对弈经验、无法有效应对特殊情况),但是仍具有显著的启发意义。从简单的改变权重技术产生了子目标、预测对手、最大最小策略的实现、自我引导程序和对棋局的展望这5个方面的涌现后果。

作者认为西洋跳棋程序对涌现研究的启示是:
1)简单的规则和程序能够产生有组织的复杂性。在这一条中,作者强调了树的隐喻在涌现研究中的应用。比如树的分叉,各种积木(根、枝、叶、干)的组合这一些概念的启发式理解,像博弈论中的对策树。
2)未经反馈时的学习过程使得通过预测改进策略成为可能。
3)需要设计一个明确的程序来识别一些对未来棋局有很大影响的关键行动。
4)在预测其他主体行为的过程中也会产生涌现现象。

神经网络
在讨论一开始,作者举了一个神经元的蚂蚁隐喻。神经元和蚂蚁作为个体都拥有简单的规则,而它们组成的总体(大脑、蚁群)都是是一个稳定、灵活而又复杂的组织。
神经元有胞体、轴突、树突组成,通过突触传播化学递质或神经电位来彼此交流信息。神经元及其网络的特征有:
1)阈值会随时间而发生变化;
2)在一段时间兴奋后,神经元会出现疲劳现象;
3)突触权重变化符合赫布定律;
4)神经元组成的大型的复杂的网络中含有大量的环路;
5)借助环路,神经网络拥有无限期记忆的能力等。
根据以上特征,麦卡洛克、皮茨等对神经元进行建模。首先假设输入脉冲数目超过某一阈值后,神经元才会在一个时间步长结束后发射脉冲。为了完成模式识别,神经网络通过输入层、若干中间层、输出层的结构建立起来。在输入层每个神经元对环境刺激做出反应,发射脉冲,引起下一层神经元的激发,这样直至把脉冲传到输出成。神经网络中权重改变的基本原理与和塞缪尔的西洋跳棋程序相似。
通过神经网络建模,作者讨论了对涌现研究有启发性的几个观点。
1)通过相互联系的有大量回路的网络,神经元的子集有做出反射的可能性,这既可以提供长时记忆,又可以是神经元组织成为互相协作的集合,成为有组织的有序行为的积木块。
2)可变阈值、疲劳和赫布定律这三种机理推进了多神经网络产生行为的研究。
3)健全的反射神经元集合序列会通过正常的方式次级其他神经元
4)对于未曾遇到的新形式,分解成熟悉的积木块,进行新的组合

受限生成过程
根据以上两个例子的讨论,作者总结了涌现现象中几个共同要素:
1)上面两个例子都是为现实中的真实事件建模
2)每一个模型中都有一定数量的组件(如棋子、粒子或部件)
3)组件之间的组合随着时间而变化
5)相互作用受一些简单的规则的支配。

对于每个部件,作者用基于主体的模型来描述其行为(具体在《隐秩序》中讨论过),通过计算机来描述它们的行为和交互作用,进而考察整体产生的涌现现象。这里作者又一次讨论了涌现的内涵,“涌现是一种具有耦合性的前后关联的相互作用”,因为主体之间复杂的交互作用,系统呈现非线性的特性:整体大于部分之和。在建模中要注重对状态、对策树(转换函数)、规则和主体的特殊规定。在这个基础上,作者开始讨论受限生成过程普遍原理。

对于受限生成过程的理解,作者主张经过4个步骤进行
1)将规则的概念转换为机制,通过机制来来定义系统中的元素。
2)把多种机制连接并构成网络,这些网络就是所说的受限生成过程
3)在机制连接起来以后,我们会面对由带约束条件并相互作用的机制锁产生的所有可能性集合(类似对策树)
4)同时我们需要定义受限生成过程中子集合的层次,也就是积木机制。

作者举了元胞自动机的例子来简单地说明这些步骤, 如定义元胞自动机的基本机制和互相连接的机制,面对自动机生成的各种图形,作者同时观察到如形状滑翔机的简单而稳定图案(积木)。
在证明了作者总结的4个步骤的合理性后,作者试图将西洋跳棋和神经网络纳入这个受限生成过程的普遍框架中去。

对于西洋跳棋程序,作者把棋盘的32个方格看成是有同样的机制所控制。我们可以通过定义转换函数(主体机制)来决定跳棋游戏规则,然后把32个机制互相连接形成受限生成过程。对于每一个机制有至少5个输入(包括该方格棋手选择的走法和与周围四个方格的状态)。为了实施一步走法,先使用一个自由输入指明哪个方格(主体机制)是出发点,然后在用另一个自由输入指明哪个方格是目标位置。在程序中还要定义相邻方格(主体机制)之间的信号传播。

对于神经网络模型,先定义神经元(主体机制),它受至少3个输入的影响:t时刻神经元是否被激发,权重值w,现在的激发频率。转换函数根据神经元周围连接点的信息来操作。在这两个模型中,我们先定义单个主体的机制,在定义主体之间联系。考察主体间相互作用的的情形。

通过对西洋跳棋程序和神经网络模型的讨论,作者证实了自己总结的受限生成过程一般框架的有效性。

《涌现》读书笔记之“接触涌现”

(这几篇是对约翰霍兰《涌现》一书做的读书笔记,做的比较粗略,只是记了一些要点,留作以后看得时候再思考和修正吧。寒假快要结束了,不管质量如何,也算对这段时间的终结作个纪念吧)


《涌现》是约翰霍兰继《隐秩序》之后的又一本力作。他继续复杂性系统的讨论,同时把目光从复杂性适应系统(CAS)转向了受限生成过程(CGP),即涌现现象。涌现现象是指通过少数简单的规则和定律,可以形成一个复杂多样、无法预料的系统。例如一个不起眼的种子到参天的大树,两边对齐围棋简单的规则却形成了令人眼花缭乱的博弈对局。作者企图用一种建模的方式来研究涌现现象。他把涌现现象的产生者视为主体,涌现现象就是主体交互作用的结果。而涌现现象的关键是在复杂多变的主体行为中产生可识别和重复的模式。也就是积木机制。在这里作者提及了西蒙在《人工科学》中的一个钟表匠比喻,在制作钟表的过程中先制作出几个大的零件,这样可以防止因为意外中断而全部重来,增加了工作效率。复杂系统的生成过程就好比这个制作钟表的过程。先生成大的有用的积木,然后在通过积木的组合呈现出复杂特性。作者归纳了涌现现象的特点:机制(积木、生成器、主体)、永恒的新奇(大量的未重复的生成结构)、动态性、规律性,有层次的组织(在生成器结构的基础上生成更高层次的生成器),这些都是在复杂系统建模中需要认真考虑的。作者同时对模型的内涵做了探讨,他引用词典上的定义“模型是是一种理想化的试验性的结构。”科学是在模型的基础上发展起来的。在涌现现象的研究中模型会发挥更为重要的作用。

在对涌现现象进行进一步讨论之前,作者回忆了1952年自己和赛缪尔一起设计电子计算机的经历。哪个时期的计算机是个充满新奇和挑战性的机器。计算机给作者最初的直观印象是能够严格得执行设计者的指令,以极高的强度和速度完成计算建模工作。这同时也对建模者提出了更高的要求,在事先对计算机模型的整体框架就很好的理解。当时塞缪尔对西洋跳棋的计算机模拟感兴趣,而约翰霍兰对Hebb提出的神经网络模型感兴趣,致力对神经网络模型的计算机模拟。而这两个早期的模型就成了本书重点讨论的两个例子。作者试图从与计算机的最初接触中总结了计算机建模的相关经验(那时候的计算机建模受编程语言的限制较少)。

作者从自己的经历中提取了棋类游戏、数字、积木块这几个他认为对建模有启发性的概念。棋类游戏在历史上出现的很早,是人类最早建立的抽象模型之一。逻辑推理规则与棋类游戏规则在运用上有很多相似的特点。数字是对物体具体属性的抽象化,舍去了不必要的细节。而积木块正如前面所说是一种连结个体特性与总体特性,下层模型和上层模型的中间机制,是在长期的适应演化过程中形成的。从这三个概念就引申出计算机。建模时的三个要点,规则,状态,和中间机制。

在讨论具体例子之前,作者大致勾勒了一下受限生成过程的基本研究思路。他借助谈论数字和模型的关系来归纳计算机模拟的实质。作者借地图这个例子重点说明了模型的抽象化和对应性特征,对应性可以通过函数的映射关系来体现。而抽象的规则可以用博弈论的理论体系得以说明。博弈论的基本概念包括博弈时的状态空间、博弈的策略集合和对策树。对于策略集合中的策略,作者不进行具体的定义,而是通过规则指令自动生成。在博弈重复进行的情况下,具体有效的策略可以自动生成和改进。对于定义主体的具体行动,作者不采取假设参与者根据固定策略采取行动的简化形式,而是采用更复杂的版本:在博弈中参与者都在为对手的行为建立模型。在参与者互相适应对方策略的过程中,涌现现象就逐渐产生了。理解涌现现象的关键(而不是把它当成简单的混沌现象)在于系统细节的详细程度以及决定详细程度的相关机制。模型中变化的状态类似于博弈中的结构布局。为了发现复杂性系统的规律(博弈规则),需要将静态模型扩展到动态模型的形式。在这个过程中,首先确定系统的状态空间,这一步关键是确定合适的详细程度(这也是建模的艺术)。在此基础上,借助转换函数确定系统规律。通过转换函数的预测能力,在建模和涌现之间建立了深刻的联系。这样计算机通过寄存器中数字的变化模仿被模拟对象的状态变化,也就能实现对现实中涌现现象的合理模拟。

2009年2月15日星期日

《隐秩序》读书笔记之“通向理论”

介绍完适应性主体模型和回声模型,作者开始总结复杂适应性理论的方法论内容。

首先他强调了数学在复杂性理论中的重要位置。数学的优势在于它可以进行严格的推广。因为它本身就是形式上的定理。这一点是物理学实验和计算机实验所无法比拟的。只有在数学上设计良好的模型才能进行更好的推广。

作者根据回声模型,提出了更为普遍和抽象的双层模型。双层模型有两个假设:主体可以聚集成物种或种类;同一种类的主体之间的资源可以快速地交换混合。这两个假设都是CAS能够轻易实现的。底层的主体相互作用的机制,类似于台球之间相互撞击。我们通过规则计算每个主体相应的反应率和资源比例。我们于是在下层结构中建立了一个流随时间变化的数学模型(比如Lotka-Volterra模型),呈现着快速、动态的特性。而上层“物种”呈现出缓慢的适应和进化过程。如何使上层模型和下层模型耦合起来,作者指出有用的方法就是将关键的“积木”进行有条件的复制,逐步形成一个类似主体组成的聚集体。上层模型应用这遗传算法或隐式适应度的模式定理作为它的的数学基础。而积木机制和生物体的趋同现象使得下层的快速流动网络呈现出一种规律性。

作者的双层模型中,底层的动力学模型应该是最为成熟和讨论最充分的,上层模型在生态学、宏观经济学、热力学和社会学中也有相应的理论。关键是如何找到连结上层模型和下层模型的机制。作者提出了积木机制这个中间层次,通过拥有相似积木之间的主体的聚集,把下层因为快速流动而抹消的差异性通过积累而逐渐放大并显著化。作者采用了生物学作为自己思考的源对象,从单个生物体(主体),再到物种(聚集),再到整个生物圈,贯穿了从下层模型到上层模型的整个过程。这是一个比较好的类比方式。其实从物理学的角度考察微观层次到宏观层次的联系,也是一种很有启发的形式。 最初,物理学家从分子运动论开始,应用统计学规律,得出了热力学规律,形成了统计物理学这门学科。然而传统统计物理学处理的是平衡状态下的物理现象,无法解释现实中形形色色的非平衡状态。于是产生了如普里高津的耗散结构论之类的非平衡统计物理学。然而生命作为一种更高一级的非平衡模式,需要在宏观上用更强有力的方法进行模拟。这个发展过程中积累了很多微观和宏观机制的数学模型。

正如开头所说,作者在描述双层模型理论框架的时候,试图寻找复杂性适应系统理论的数学框架。对此作者显得比较谨慎,没有给出绝对的答案,只是给出了一些建议。他认为两种数学模型对复杂性理论有帮助。一种是“基于方程组的组织化的动力学理论”,可以描述下层流的特性。一种是“发生策略(积木机制)与层次结构(如缺省层次)、策略(对策中的移动类别)和策略对应的值(对策得分)关联的一种理论”,也许可以用博弈论的观点进行考虑。用数学术语总结,作者希望找到“把生成函数、‘自动机’群和改进的马尔可夫过程结合起来的方法”。

最后作者提出了自己认为的复杂性理论的几个基本要求:学科交叉性、基于计算机的思想实验、对应原理、用于重组竞争过程的数学。这几点正是作者在本书中重点强调的。多学科视角的思维方式,能够最大化的激活人的想象力,而计算机模拟可以让自己的创意相对容易地转化为实际可以操作的模型,对其中的内涵进行更充分的检验和挖掘。对应原理(见)要求我们能够最大限度地容纳相关领域旧成果的基础上建立新的模型。这可以尽可能避免模拟过程和原有现象这件的擦会议。而用于重组竞争过程的数学,是建立一个完备的数学模型所必需的。鉴于下层的动力学模型和上层的统计学模型已经有了深入的研究,作为中间层次的重组竞争过程需要更为成熟的数学。

以上就是作者试图向我们传达的复杂性适应系统的理论框架。虽然还不是完全成熟,但是充满了启发性。以简单个体之间的互动为基础,在整体上生成复杂多样的形态。作者模拟了简单生物之间交流、聚集、繁殖。我想能否用复杂性适应系统的理论来模拟心理现象,最近已经有一篇试图复杂性适应系统探讨意识层次的文章 ( http://www.santafe.edu/research/publications/workingpapers/08-12-048.pdf )。 对于日常生活中记忆现象,能否可以用CAS等复杂性理论的方式来建立模型。比如先用实验的方式考察情绪、人际交互方式、目标、语言对记忆的影响,然后根据实验中的结论建立主体的规则(IF/THEN形式),然后让主体之间相互交互作用,完成信用分派,并用输入刺激信息的稳定模式作为积木组块,通过多次模拟来考察最终形成的记忆模式及特征。鉴于原有记忆研究中比较强的计算机范式,这种适应性主体模型的方法,应该是相对可以实现。这或许就是我读完《隐秩序》一书比较简单的感受。希望自己以后能有机会进一步的思考和发展。

附:对应原理
是波尔在建立氢原子的量子力学模型,所提出的一种推理方式。他认为:“在一点上……我们可以指望和普通观念的一种联系,那就是,在经典电动力学的基础上来计算【低的光学频率】将是可能的。”(转引自派斯著《尼尔斯波尔传》P221,商务印书馆,2000),波尔通过这一个思想,从量子理论和经典理论各得出一个公式,然后通过比较两者的差异,考察将量子理论模型转化为经典理论模型所需要的限制条件(具体的阐述可以看戈革教授的相应文章和卢昌海纪念戈革的文章,http://hps.phil.pku.edu.cn/viewarticle.php?sid=2567&st=0)。
后来对应原理就用来指新发展的理论在特定条件下可以等同于旧理论的情况,比如狭义相对论和牛顿经典力学、统计力学与热力学或染色体遗传理论和孟德尔遗传三定律之间的关系(参考维基百科http://en.wikipedia.org/wiki/Correspondence_principle)。

《隐秩序》读书笔记之“回声模型”

第二章重点介绍了了单个适应性主体的模型,第三章开始讨论多个主体之间的相互作用——回声模型。

为了寻找建立一个统一的CAS理论模型的方案,作者讨论了科学研究的基本方式:先获取研究对象的完备数据,然后根据数据建立模型。他举了一个不知被多少人举烂的例子:从第谷的天文观测到开普勒发现行星运行三定律的历史(虽然如此,这个故事还是有令人激动的魅力,神圣而梦幻的星空、庞杂的数据、不懈的努力、流逝的光阴、简洁而丰富的定理和神意的启示,可以说科学的成功的精髓都包括在其中)。在把科学研究基本方式应用到CAS理论时,作者强调了计算机模拟的好处。计算机模型的定义明确性和可操作性使我们能够清晰地灵活地考察CAS理论的各个细节。特别是计算机模型作为思想实验工具发挥着重要的作用。为此研究者必须要有从特殊而多样的研究对象中抽出共同而简明的特征。他提出了回声模型的6个判据:

1.回声模型要尽可能简单,并与其他判据相容。
2.回声模型解释的行为应比较广泛。
3回声模型应有助于进行适应性进化的实验。
4.回声模型的理论构念应该在现实中有相似的对应物
5.回声模型应该尽可能包括著名的CAS特定模型(如军备竞赛模型、囚徒困境模型和抗原-抗体模型)。
6.回声模型在数学上应该尽可能严密。

在这六个判据的指导下,作者由浅入深提出了6个回声模型。我准备从作者在第六个模型后进行的小结开始,先总体上理解回声模型的基本要素,再顺着作者的思路理解六个模型。

作为考察主体交互关系的回声模型,首先要确定一个“工作环境”,也就是作者说的“由位置网络表示的地理环境”,作为主体活动的空间。每个位置含有资源和一系列主体。资源由一连串字母表示,可以随着时间而变动、更新。主体也用一系列字母串表示,可以简单地比拟为“染色体”。每个“染色体”有一个“仓库”用来存放资源。主体之间通过交换资源来生存、繁殖。“染色体”包括“标识段”和“控制端”。标识段包括三种标识进攻标志防御标识粘着标识。交互作用时主体将自身的进攻标识和对方的防御标识进行匹配,然后决定交换资源的数量。粘着标识决定主体间的粘着程度。控制端包括条件资源变换活动标记。条件有交换条件交配条件复制条件。在主体交互作用时条件会先检查对方染色体进攻标识,然后决定交换资源是否继续。交换资源每次指定一个源资源和目标资源,交换次数任意。一个主体的标记用来反映在多主体模型中该主体是否会被注意。如果标记是1,多主体会使用该主体的标识调节交互活动,否则就会被忽视。

了解了以上基本要素,我们可以看看作者介绍的6个模型

模型1进攻、防御和仓库

模型1中,主体只含有存放资源的仓库和由代表资源的字母组成的“染色体”字符串两个组成部分。“染色体”含有进攻标识和防御标识。两个主体相遇时进攻标识和防御标识相匹配,决定资源的交换。这里之所以用两个标识而不是一个标识代表主体,是为了防止单个标识所造成的交互活动的传递性。因为A影响B,B影响C,但A不一定影响C。

模型1是最基本的模型,模型2-6都是对模型1一步步的扩展,增加了一系列新的机制。

模型2条件交换

模型2相比于模型1,增加了选择性交互作用的机制。“染色体”被分成了两个部分——控制片段和标识片段。控制片段提供交换条件,用来检查另一个交互主体染色体的进攻标识

模型3资源变换

模型3增加了资源变换的机制。通过对控制片段的功能进行扩展,使之具有变换子片段的功能,来完成资源变换。资源变换的代价是主体通过收集足够多的资源(字母),来定义子片段酶,促进资源变换,通过其他资源生成主体所缺乏的资源。同时要考虑“变换速率”的问题,如能获得多少缺乏资源的副本和变换时间是否短于主体的寿命。这些都影响着资源变换的效率。

模型4粘着

模型4增加了主体之间互相粘着的机制。在标识片段加入一个粘着标识,每个主体的粘着标识与另一个主体的进攻标识匹配,计算粘着匹配分数。粘着同时形成了边界,边界又可以分成内边界和外边界,一个外边界内可以含多个内边界。边界由粘着匹配分数决定,两者匹配分数低,不会发生粘着。两者匹配分数接近且不接近于零,放入所选主体的边界内。一个主体的匹配分数远远高于另一个时,匹配分数低的主体放入匹配分数高的主体边界的边界内,即形成内边界。

模型5选择性交配
模型5增加了选择性交配的机制。在控制片段内加上交配条件。交配条件和资源交换条件相似,都与潜在配偶主体的进攻标识进行匹配。交配的选择性取决于交配条件的专一性。主体选择和它发生交配条件的主体的范围。选择性交配后为了控制主体数目,作者设置了随机死亡率,是出生率和死亡率互相平衡。

模型6条件复制

模型6增加了条件复制的机制。对于形态发生模型,作者强调用计算机模型直接描述,而不是传统偏微分方程的形式。这样能够更好的理解形态发生的动态过程。在多主体每一个区室的控制片段加上复制条件,考察其他区室的进攻标识,根据其是否满足复制条件,决定进行复制。模型6蕴含了作者小结中的各个要素。

回声模型是类比于生物中的细胞体建立的,但同时在很多方面也有了必要的简化:忽略了生物体新陈代谢机制的细节;用字符串直接表示的内部结构,类似于主体的基因型(genotype).同时主体的表型(phenotype)用标识来表示;因此,相比于适应性主体模型,并没有复杂的内部模型,而是广泛使用了标识,显得更为简单。

作者对回声模型进行计算机模拟,看它是否能够生成像生物界中那样多样性的形态。作者讨论了计算机模拟的本质:把要模拟的过程与计算机的计算过程一一对应起来。先把模拟的过程分成一个个状态,然后把状态和计算机程序中的数字对应起来。那么模拟的过程就等同于计算机的计算进程。作者重点指出任何规律都可以通过IF/THEN规则和恰当的算术计算都能在逻辑上得到精确的定义。

在回声模型的计算机模拟中,作者假定各个主体同时交互作用。主体之间的接触分为两种:交换接触和交配接触。所检验的条件如上面所述。作者为计算机模拟写了一个流程图:


(引自约翰霍兰《隐秩序》P143,上海科技教育出版社,2000)

回声模型计算机模拟的检验:
在检验中作者再次采用了囚徒困境的例子。主体之间互相接触,接触时进行囚徒困境的博弈行动。标识的作用在模拟过程中显现出来。在检验过程中使用标识的主体,对行为的选择更有倾向性,能够逐渐发展出有利于交互作用的标识和条件。它们更容易发展出“针锋相对”策略。

对于回声模型的意义,作者看来有两点:思想实验和飞行器实验。这两者是逐步递进的关系。先像伽利略那样设计出一系列思想实验,再像瓦特一样设计出一个“蒸汽机”的草图。而计算机就把这两段过程给巧妙的结合起来,并大大缩短了进程。总而言之计算机模拟既可以为我们提供洞见,又可以为我们设计蓝图。计算机在复杂性系统的作用是十分精妙和丰富的。

这部分令我印象深刻的几点,一是他对生物学模型的大量借鉴和巧妙而合理的简化,更重要的是他对科学研究方法以及计算机在科学研究中角色的讨论。从数据到模型再到应用,这是科学研究的基本流程。这一个流程在计算机模拟中得到缩短和简化。计算机模型作为一个直观化的模型,能够以动态的进程模拟各种可能情形。这使我们能够更加深入地理解模型的本质。对于模型的现实应用,计算机模型也可以以更形象化、更有针对性的方式进行转化。可以说计算机模型的潜力是无法估计的。我想对于计算机模拟的细节,自己还需要在以后多加学习、实践和体会。

2009年2月7日星期六

《隐秩序》读书笔记之“适应性主体”

(《隐秩序》这本书买的挺早了,但是只是最初浅读了一遍,对其中的一些概念和要素有了大概的了解,具体细节并不清楚。这个寒假准备把这本书和他的姐妹篇好好读一下,做一些笔记增加自己的收获)

在第一章作者详细介绍了复杂性系统的七种基本元素(聚集、标识、流、非线性、多样性、积木机制,内部模型),第二章开始采用这些基本要素组建适应性主体。

作者一开始用纽约市的例子对七种要素进行了简单的归纳,简而言之:在纽约市这个复杂系统以各种各样的公司为主体(聚集),公司外部有各种各样的广告商标(标识)。公司内部有不同部门组成(积木机制),充满了形形色色、花样翻新的交易方式(内部模型)。公司之间互相交易,之间充满串行不息的物流和贸易(), 使得城市这个系统既丰富多彩(多样性)又复杂不可预测(非线性)。

通过上面的例子我们可以看到作者描述的复杂性系统的一般特性,其中主体是系统中的关键环节。对于细胞、公司、神经元这些形形色色的主体,能否为所有主体找到一个统一的CAS(complex adaptive systems)方法。这是这一章作者试图做到的。
作者提出了探索可能性的3个步骤:
1. 找到一个统一的方式来描述主体的性能(执行系统),
2. 根据主体在环境中的成功(和失败)分配相应的信用(信用分派),
3. 在信用分派的基础上,调整主体性能和执行规则(规则发现

作者根据这三个步骤讨论来他建立的适应性主体的计算机模型。

执行系统:

在一个缤纷复杂的环境中,主体如何处理周围的信息?作者利用计算机的输入-中央处理-输出系统进行类比。对应于计算机系统的输入输出,他设计一个探测器让主体感知周围的环境特征,然后用效应器来表现它的行为。对于执行系统的规则,作者没有采用人工智能比较盛行的复杂的规则体系,而是采用相对简单的因果性的IF-THEN规则,具体说是IF(有合适的信息)THEN(产生指令)。在规则的条件部分,作者设计语法时采用了二进制0,1以及#之类的符号,如二进制形式####…..###0#1,表示对倒数第1位是1和倒数第3位是0的任何消息作出反应,#表示不在乎该位置上的信息。作者设计一个message list作为“仓库”存储所有信息。规则之间是并行的关系,在执行系统的探测器获取信息时,所有规则同时激活,无论它们之间是否存在矛盾。这与计算机串行性处理方式和传统人工智能的处理相差甚大,这也是该模型相比于从前的优势所在,它可以强化主体面对新环境时的灵活性和适应性。

信用分派:

作者把规则看成一个正在进行检验和确认的假设,目标是为了寻找矛盾,即规则提供了一系列竞争性假设。这和前面的并行性一样,是模型的精髓所在。

但是面对各种竞争性的假设,系统如何裁决它们之间的优劣?作者由此提出了信用分派规则。根据规则的有用性(在环境中的功能和适应性),为每一个规则分派一个强度。在执行系统中多个规则同时起作用时,信用分派变的很复杂。作者在这里采用了买卖中生产商、供应商、顾客交易的比喻:供应商从生产商方面进货(消耗信用币),再卖给顾客(获得信用币)。系统(供应商)从大量的规则原件(生产商)中获取可能有用的规则(货物),然后在环境(顾客)中进行检验,将检验结果进行回馈。信用币就类似与分派强度,通过多次“交易”使有用的规则获得更高的强度。通过这种作者称为传递水桶算法(bucket brigade algorithm)的方法,系统最终对规则完成合理的信用分派。

随后作者将这个进价比喻稍微修改,建构出主体的内部模型。他又加入了具体性这一个指标。语法中#的数量与信息的数量成反比,信息的数量与具体性成正比。让出价数目(即分派强度)正比于强度和具体性的乘积。这样作者可以使系统在一般规则基础上生成特殊规则(具体性高),并设计出一系列规则的共生现象。需要指出的是,用现有语法形成内部模型时,检验一般的规则比特殊的规则要容易(因为特殊规则信息量更大)

规则发现

因为建立一般的规则比较容易,所以作者建立主体的行为模式,是缺省层次(一般规则)开始的。那么如何确定缺省层次的规则(一般规则)就成了作者要解决的首要问题。首先作者先探讨如何确定候选规则,他采用“貌似真实性”法则(根据过去经验没有明显错误)。对于规则的积木(候选规则)的选择,最直接的是用规则串选定位置上的值作为潜在的积木。

在这里作者又提出了等位基因的比喻,他把规则串看成染色体,把积木(规则串选定位置上的值)看成等位基因。这就把两者的行为模式类比起来。那么我们就可以借鉴遗传学上综合适应度(overall fitness)和平均适应度(average fitness)的概念。在借鉴的过程中,为了解决非线性(因为等位基因的交互作用,适应度是等位基因的非线性函数)的困难,作者引进了一个新的忽略符号★区别于#(#属于条件集合{1,0,#},★属于模式集合{1,0,#,★},因为条件等同于接收的消息集合,模式等同于接收的条件集合,所以#定义了不同的消息,)★定义了不同的条件。也就是说★作为模式中定义的符号,处在比条件定义符号#更高一级的位置),来定义多个位置组成的积木。

在此比喻的基础上,作者全面借鉴遗传机制,先定义所有主体规则的平均强度A和某个模式规则的平均强度S, 再将S与A比较,决定该规则的适应度。在比较规则中作者提出了地貌比喻,把模式规则的平均强度看成山的高度(考夫曼的n-k地貌),用在在计算机上进行可视化的数学分析。

为了解决计算模式平均数S(b)的巨大工程量,作者创造性地提出了遗传算法这个方法。 简单的讲包括以下三个步骤:
1.规则串(染色体)根据适应度繁殖:用模式平均数计算作为启发式计算依据,高于平均数的模式有更多实例,低于平均数的模式有更少实例
2.重组:父母串通过配对、交换、突变,产生后代串。在交换中更多使用高于平均数的短模式,但可能打乱长模式。交换中的组合效应用模式定理的进行总结(数学形式是M(b,t+1)=[1-L(b)/(L-1)][1-Pmut(b)]S(b,t)M(b,t),其中 L(b)/(L-1)表示交换点落在模式b外边界的概率, Pmut(b)是突变修改模式b的概率, S(b,t)是模式b在时刻t的实例的强度, M(b,t)是模式b在时刻t的实例数,M(b,t+1)是模式b在时刻t+1的实例数)。
3.取代:后代随机取代原有的串。并引入了死亡率这个概念,使群体规模保持稳定。

以上3个步骤多次循环,使得适应度高的“积木”( 候选规则)在总体的比重越来越大,从而强化了整体的适应度。

关于遗传算法,网上有一篇约翰霍兰的文章http://www.econ.iastate.edu/tesfatsi/holland.GAIntro.htm 进行了介绍

例子

作者在叙述完建立适应性主体的规则后,举了两个经济学中的例子来说明适应性主体的巨大威力。

囚徒困境中的适应性主体

囚徒困境是博弈论中一个经典的案例,两个囚犯被隔离关押,面临审讯,如果他们都拒绝招供(双双合作),那么他们将无罪释放,如果他们有一人招供(背叛),一人拒绝招供(合作),那么背叛者会释放并得到奖励,合作者被判重刑。如果两人都招供(双双背叛),那么都会判较轻的刑。

当进行多次囚徒困境对策时,何种策略是最好的。作者应用适应性主体技术,将合作(H)和背叛(B)看成字符,将个体的策略看成字符串(如HBHBHBHBBBH………..)根据博弈结果对每个策略进行打分,然后用高分策略取代低分策略,这样就能发现更好的策略。事实经过计算机模拟实验,研究者很快发现了针锋相对策略,甚至还发现了更好的策略(考虑到受骗的情况)。

适应性主体与股票市场模拟

适应性主体还可以用于股票市场模拟。根据IF(价格A) THEN(买入)和IF(价格



以上算是把作者的本章的内容和思路做了一个完整的笔记。虽然只是一本薄书中的一章,其中的信息量还是很大的。下面谈谈作者建立模型的方法给我的不少启示。

首先是在建立规则时从一般到特殊,遵循由易到难的原则。在最低层次上的单元及规则尽可能简单,但同时要有充分的灵活性,如IF-THEN规则的应用,备选积木的选择上考虑了貌似真实性的原则。这些原则虽然简单,但是可塑性很强,在更高层次能出现更丰富的复杂模式,也有利于作者更好地考虑自己的理论前提。

第二个是比喻在建立模型中的大量应用。像经济学中的买卖交易模型,生物学中的等位基因比喻和染色体交换复制比喻,以及计算平均适应度时关于地貌的比喻。由此可以看出比喻在复杂性研究中旺盛的生命力,复杂性研究注重跨学科性,各个学科建立的经典模式,都可以产生启发性的观点,然后应用数学进行必要的转换。在约翰霍兰的理论中比喻被放在了一个非常重要的位置上,以致于他在《涌现》一书专门一章来探讨这个主题。

竞争性假设同时竞争,这或许就是复杂性研究区别与传统人工智能的地方。并行性处理既增加了处理的效率,也增加了容错性,可以根据环境进行更为丰富的调整。

积木的选择,积木是对主体系统有重要影响的有效模式。作为系统的中间机制,积木连结这上层总体特性和下层个体行为,也是系统呈现出复杂多样性和简化复分析计算的重要条件。所以积木的选择就成了主体能够发挥更大作用的关键所在。作者采用染色体交换复制的类比,试图运用进化的原理使重要积木能够自动的筛选出来,并逐渐固定化。这种充满新意的方法叫做遗传算法,在90年代成了很热门的学科。网上能搜到不少书。也许有机会可以抱着学习的态度看一看。


附:第一章主体的七个基本元素


聚集(特性):有两层含义,第一层指简化复杂系统的一种标准方法,把相似的东西聚成类。第二层是指这些较为简单的主体通过聚集相互作用,出现复杂的大尺度行为。

标识(机制):为了聚集和边界生成而普遍存在的一种机制,如如旗帜、消息标题、信息素等。

非线性(特性):整体非个体的简单的线性求和。如生态学中的捕食者-被捕食者模型÷Lotka-Volterra模型、三体模型。非线性特性会干扰用于聚集的线性方法。


流(特性):在拥有众多节点和连接的网络中资源的流动。随着时间,流和网络表现出对变化的适应性。在经济学中流有两个效应:乘数效应和再循环效应(recycling effect)

多样性(特性):一种动态的适应性的模式,从生物进化论的角度会对多样性有更深的理解。


内部模型(机制):主体用于预测未来和行为决策的关键机制,含有隐式(对一些期望的未来状态的隐式预测,指明当前行为)和显式(作为一个基础用于作为其他选择时明显的但是内部的探索,即前瞻过程)两种。

积木(机制):对一些有效和关键性的模式的重复使用,如数学中的公理,音乐中的音符,生物学中的细胞。较高层次的规律是从较低层次积木的规律中推导出来的

2009年1月24日星期六

应用多元统计笔记之统计距离

(最近在看图书馆借的《实用多元统计分析》(A约翰逊,迪安 W威克恩),觉得其用线性代数的方式解释统计的方式很受启发,再加上是借的书,所以希望作些笔记,算是总结以下自己读书的收获,准备用专题的方式把书中的一些概念记下来,同时参考一些其他资料。这也利于以后查阅)

统计距离(statistical distance)是多元统计的基础概念。它是为了解释变异差异和引入相关概念而发展起来的。试想我们测量两个变量,得到一系列数值对,每个变量的数值均值为0。两个变量的测量相互独立。而我们假定变量X1的变异量比变量X2要大。那么在以二维坐标图上(X1为x 轴,X2为y轴)表现为一个形状类似扁长椭圆的散点图。因为x轴的变异量大于y轴(因为X1变异量大于X2),所以在统计上认为将两个坐标赋予相同的权重并不合适。因此我们引进了一个标准化后的坐标 \inline$x_{1}^{*}=x_{1}/\sqrt{s_{11}}$\inline$x_{2}^{*}=x_{2}/\sqrt{s_{22}}$ 从而定义了统计距离为:
\inline$d(O,P)=\sqrt{(x_{1}^{*})^{2}+(x_{1}^{*})^{2}}$ $=\sqrt{\frac{x_{1}^{2}}{s_{11}}+\frac{x_{2}^{2}}{s_{22}}}$
(引自理查德 A约翰逊,迪安 W威克恩(2008),实用多元统计分析(影印版),清华大学出版社,以下同上)

因此统计距离是对欧式距离的推广(二维是 \inline$d(O,P)=\sqrt{(x_{1})^{2}+(x_{2})^{2}}$ ),当变量间变异量一致时,我们用欧式距离来计算距离,当变异量不一致时我们考虑统计距离。
当统计距离为常量c时, 有以下方程
\frac{x_{1}^{2}}{s_{11}}+\frac{x_{2}^{2}}{s_{22}}=c^{2}$

该方程是一个中心在原点的椭圆方程,与x轴的交点为 \inline$-c\sqrt{s_{11}}$\inline$c\sqrt{s_{11}}$与y轴的交点为\inline$-c\sqrt{s_{22}}$\inline$c\sqrt{s_{22}}$

如果对统计距离在进行推广对任何一个点P(X1,X2)到固定点Y(Y1,Y2)的统计距离是:
\inline$d(O,P)=\sqrt{\frac{(x_{1}-y_{1})^{2}}{s_{11}}+\frac{(x_{2}-y_{2})^{2}}{s_{22}}}$
统计距离还可以推广到啊更高的维度

以上的统计距离公式考虑的是变量之间相互独立的情形,因此有必要考虑变量之间相关的情形,所以引进了旋转角度的方法,如果把相关变量的散点图的坐标轴旋转至符合独立变量的情形那么可以得出
\inline$d(O,P)=\sqrt{\frac{(x_{1}^{'})^{2}}{s_{11}^{'}}+\frac{(x_{2}^{'})^{2}}{s_{22}^{1}}}$
x1’和x2’分别为 \inline$x_{1}^{'}=x_{1}cos(\theta)+x_{2}sin(\theta)$\inline$x_{2}^{'}=-x_{1}sin(\theta)+x_{2}cos(\theta)$

最终我们得出:
\inline$d(O,P)=\sqrt{a_{11}x_{1}^{2}+2a_{12}x_{1}x_{2}+a_{22}x_{2}^{2}}$

其中a11,a12,a22是由角度θ决定的

同样对于P(X1,X2)到固定点Y(Y1,Y2)统计距离为
\inline$d(O,P)=\sqrt{a_{11}(x_{1}-y_{2})^{2}+2a_{12}(x_{1}-y_{1})(x_{2}-y_{2})+a_{22}(x_{2}-y_{2})^{2}}$
同时可以把统计距离推广到更高维的地方。

要指出的是k距离并不只是和椭圆或圆联系在一起,任何距离测量只需符合以下特征:
d(P,Q)=d(Q,P)
d(P,Q)>0 如果P!=Q
d(P,Q)=0,如果P=Q
d(P,Q)<=d(P,R)+d(R,Q) (三角不等式)

对于统计距离的解释可以根据以下定理: \inline$(x-\mu)\sum^{-1}(x-\mu)$\inline$\chi_{p}^{2}$ 分布,其中 \inline$\chi_{p}^{2}$ 为自由度为p的卡方分布,\inline$(x-\mu)\sum^{-1}(x-\mu)$ 为多元正态分布的形式

根据卡方分布的定义我们可以得出
\inline$(x-\mu)\sum^{-1}(x-\mu)$$=Z_{1}^{2}+Z_{2}^{2}+........+Z_{P}^{2}$

其中 \inline$Z=\sum^{-\frac{1}{2}}(X-\mu)$$\inline$N_{p}(0,I_{p})$ 的正态分布

所以统计距离平方可以转化为p个 独立的标准正态分布变量的平方和,即把标准正态分布变量数值看成坐标值。其中 \inline$(x-\mu)\sum^{-1}(x-\mu)$ 也称作Mahalanobis距离(由P. C. Mahalanobisi在1936年提出)。Mahalanobis距离可以检测线性回归模型中的异常值。

统计距离在聚类分析中有着更广泛的应用,聚类分析有通过距离测度来获得相似性测度的方法,即通过统计距离的远近来判断案例(在坐标系中视作点)是否相似,属于同一类别(这也是统计距离的初衷所在)。所用的距离测度有:

欧式距离


(引自郭志刚《社会统计分析方法——SPSS软件应用》p122)


绝对值距离


(引自郭志刚《社会统计分析方法——SPSS软件应用》p122)

Minkowski距离

(引自郭志刚《社会统计分析方法——SPSS软件应用》p122)

Mahalanobis距离

(引自郭志刚《社会统计分析方法——SPSS软件应用》p122)


统计距离此外还有Cook距离 (http://en.wikipedia.org/wiki/Cook%27s_distance) 、Hellinger 距离 (http://en.wikipedia.org/wiki/Hellinger_distance)和Bhatta charyya距离 (http://en.wikipedia.org/wiki/Bhattacharyya_distance)等

参考文献
1.郭志刚(1999)郭志刚《社会统计分析方法——SPSS软件应用》,人民大学出版社
2.理查德 A约翰逊,迪安 W威克恩(2008),实用多元统计分析(影印版),清华大学出版社
3.维基有关statistical distance的相关条目

2009年1月15日星期四

chernoff face

今天读《实用多元统计分析》(“applied multivariate statistical analysis”)时,读到有关 chernoff face的介绍,觉得挺有意思。Chernoff face是一种有趣的数据呈现方法。它把多元数据用二维的人脸的方式整体表现出来。各类数据变量经过编码后,转变为脸型,眉毛,眼睛,鼻子,嘴,下巴等面部特征来,数据整体就是一张表情各异的人脸。Chernoff在70年代提出了chernoff face的技术。他认为chernoff face可以用来表示最多为18种变量的数据。Bernhard Flury和Hans Riedwy(1981)认为,保持chernoff face脸对称并没有意义,因此他们主张用另外18个不同的数据点来表示另外半张脸(在我看来这为数据的分半信度提供了很好的方法)。所以chernof face可以表示36个数据点。

Chernoff face是一个需要计算机才能实现的技术,很多软件提供了此类服务,比如有专门制作chernoff face的软件Faces 2.1(下载地址为http://bradandkathy.com/files/Faces2.zip)R中也有相应的代码,具体代码和使用可以看http://rss.acs.unt.edu/Rdoc/library/TeachingDemos/html/faces.html。

利用人对人脸识别的天生能力来鉴别数据的整体特征。这是一个有意思的创意。但是转化后的人脸意味着什么?我们如何把多元数据真正合理地类比为人脸,这不是一个容易回答的问题。最初的chernoff face中,变量编码为哪一个面部特征是随意的,这就使得数据呈现无法利用面部识别的特点(整体性),而且也很容易对数据的真正意义产生误解。Morris, Ebert和Rheingans等人(1999)对chernoff face的实际效果进行了实验研究,发现对被试chernoff face的识别是序列搜索任务,而不是发生在平行搜索的前注意阶段。chernoff faced的眼部表情在识别作用最大。但总体上chernoff face并不见得比其他数据呈现图形效果更好。同时chernoff face虽然有助于知觉,但是不同的面部特征之间可能会出现交互作用,因此对面部特征的知觉空间可能是非线性的。(http://eagereyes.org/VisCrit/ChernoffFaces.html)

最近有人提出了EVA(empathic visualization algorithm)的方法(http://www.cs.ucl.ac.uk/staff/a.loizides/218.pdf),对chernoff face进行了修正和扩展。EVA方法将语义上重要的数据变量编码为情绪上重要的面部特征(如脸的表情,肌肉紧张度等)。EVA强调数据的特征对面部特征起着决定作用,整体值对整体特征,缺失值对缺失特征,两者严格对应,这样的话chernoff face的面部特征就是数据的真实体现。然而要做到这一点,必须对数据进行预先的严格分析,这就要耗费比较大的精力。也许chernoff face只是一个说服别人的工具,而不是一个探索问题的工具。Chernoff face最重要的功能就是分类和校准。我们可以通过chernoff face很轻易地把一个不同于其他的数据样本挑出来。

对面部的精确识别,这是人的一个很奇妙的能力,也是心理学家试图探索而没有完整解决的问题。chernoff face应用的得与失,也许只有随着面部识别的研究进展才能更好的回答了。现在还是欣赏一下我找到的chernoff face吧:)

R中 关于chernoff face 的例子:


真人版chernoff face:
(引自http://alexreisner.com/baseball/stats/chernoff)


参考文献
1.Wiki: chernoff face http://en.wikipedia.org/wiki/Chernoff_face
2.理查德 A约翰逊,迪安 W威克恩(2008),实用多元统计分析(影印版),清华大学出版社
3.Morris CJ, Ebert DS, Rheingans(1999) "An Experimental Analysis of the Pre-Attentiveness of Features in Chernoff Faces", published by the conference "Applied Imagery Pattern Recognition: 3D Visualization for Data Exploration and Decision Making".
4.Social Science Statistics Blog: Chernoff face:
http://www.iq.harvard.edu/blog/sss/archives/2006/11/chernoff_faces_1.shtml