(《隐秩序》这本书买的挺早了,但是只是最初浅读了一遍,对其中的一些概念和要素有了大概的了解,具体细节并不清楚。这个寒假准备把这本书和他的姐妹篇好好读一下,做一些笔记增加自己的收获)
在第一章作者详细介绍了复杂性系统的七种基本元素(聚集、标识、流、非线性、多样性、积木机制,内部模型),第二章开始采用这些基本要素组建适应性主体。
作者一开始用纽约市的例子对七种要素进行了简单的归纳,简而言之:在纽约市这个复杂系统以各种各样的公司为主体(聚集),公司外部有各种各样的广告商标(标识)。公司内部有不同部门组成(积木机制),充满了形形色色、花样翻新的交易方式(内部模型)。公司之间互相交易,之间充满串行不息的物流和贸易(流), 使得城市这个系统既丰富多彩(多样性)又复杂不可预测(非线性)。
通过上面的例子我们可以看到作者描述的复杂性系统的一般特性,其中主体是系统中的关键环节。对于细胞、公司、神经元这些形形色色的主体,能否为所有主体找到一个统一的CAS(complex adaptive systems)方法。这是这一章作者试图做到的。
作者提出了探索可能性的3个步骤:
1. 找到一个统一的方式来描述主体的性能(执行系统),
2. 根据主体在环境中的成功(和失败)分配相应的信用(信用分派),
3. 在信用分派的基础上,调整主体性能和执行规则(规则发现)
作者根据这三个步骤讨论来他建立的适应性主体的计算机模型。
执行系统:
在一个缤纷复杂的环境中,主体如何处理周围的信息?作者利用计算机的输入-中央处理-输出系统进行类比。对应于计算机系统的输入输出,他设计一个探测器让主体感知周围的环境特征,然后用效应器来表现它的行为。对于执行系统的规则,作者没有采用人工智能比较盛行的复杂的规则体系,而是采用相对简单的因果性的IF-THEN规则,具体说是IF(有合适的信息)THEN(产生指令)。在规则的条件部分,作者设计语法时采用了二进制0,1以及#之类的符号,如二进制形式####…..###0#1,表示对倒数第1位是1和倒数第3位是0的任何消息作出反应,#表示不在乎该位置上的信息。作者设计一个message list作为“仓库”存储所有信息。规则之间是并行的关系,在执行系统的探测器获取信息时,所有规则同时激活,无论它们之间是否存在矛盾。这与计算机串行性处理方式和传统人工智能的处理相差甚大,这也是该模型相比于从前的优势所在,它可以强化主体面对新环境时的灵活性和适应性。
信用分派:
作者把规则看成一个正在进行检验和确认的假设,目标是为了寻找矛盾,即规则提供了一系列竞争性假设。这和前面的并行性一样,是模型的精髓所在。
但是面对各种竞争性的假设,系统如何裁决它们之间的优劣?作者由此提出了信用分派规则。根据规则的有用性(在环境中的功能和适应性),为每一个规则分派一个强度。在执行系统中多个规则同时起作用时,信用分派变的很复杂。作者在这里采用了买卖中生产商、供应商、顾客交易的比喻:供应商从生产商方面进货(消耗信用币),再卖给顾客(获得信用币)。系统(供应商)从大量的规则原件(生产商)中获取可能有用的规则(货物),然后在环境(顾客)中进行检验,将检验结果进行回馈。信用币就类似与分派强度,通过多次“交易”使有用的规则获得更高的强度。通过这种作者称为传递水桶算法(bucket brigade algorithm)的方法,系统最终对规则完成合理的信用分派。
随后作者将这个进价比喻稍微修改,建构出主体的内部模型。他又加入了具体性这一个指标。语法中#的数量与信息的数量成反比,信息的数量与具体性成正比。让出价数目(即分派强度)正比于强度和具体性的乘积。这样作者可以使系统在一般规则基础上生成特殊规则(具体性高),并设计出一系列规则的共生现象。需要指出的是,用现有语法形成内部模型时,检验一般的规则比特殊的规则要容易(因为特殊规则信息量更大)
规则发现
因为建立一般的规则比较容易,所以作者建立主体的行为模式,是缺省层次(一般规则)开始的。那么如何确定缺省层次的规则(一般规则)就成了作者要解决的首要问题。首先作者先探讨如何确定候选规则,他采用“貌似真实性”法则(根据过去经验没有明显错误)。对于规则的积木(候选规则)的选择,最直接的是用规则串选定位置上的值作为潜在的积木。
在这里作者又提出了等位基因的比喻,他把规则串看成染色体,把积木(规则串选定位置上的值)看成等位基因。这就把两者的行为模式类比起来。那么我们就可以借鉴遗传学上综合适应度(overall fitness)和平均适应度(average fitness)的概念。在借鉴的过程中,为了解决非线性(因为等位基因的交互作用,适应度是等位基因的非线性函数)的困难,作者引进了一个新的忽略符号★区别于#(#属于条件集合{1,0,#},★属于模式集合{1,0,#,★},因为条件等同于接收的消息集合,模式等同于接收的条件集合,所以#定义了不同的消息,)★定义了不同的条件。也就是说★作为模式中定义的符号,处在比条件定义符号#更高一级的位置),来定义多个位置组成的积木。
在此比喻的基础上,作者全面借鉴遗传机制,先定义所有主体规则的平均强度A和某个模式规则的平均强度S, 再将S与A比较,决定该规则的适应度。在比较规则中作者提出了地貌比喻,把模式规则的平均强度看成山的高度(考夫曼的n-k地貌),用在在计算机上进行可视化的数学分析。
为了解决计算模式平均数S(b)的巨大工程量,作者创造性地提出了遗传算法这个方法。 简单的讲包括以下三个步骤:
1.规则串(染色体)根据适应度繁殖:用模式平均数计算作为启发式计算依据,高于平均数的模式有更多实例,低于平均数的模式有更少实例
2.重组:父母串通过配对、交换、突变,产生后代串。在交换中更多使用高于平均数的短模式,但可能打乱长模式。交换中的组合效应用模式定理的进行总结(数学形式是M(b,t+1)=[1-L(b)/(L-1)][1-Pmut(b)]S(b,t)M(b,t),其中 L(b)/(L-1)表示交换点落在模式b外边界的概率, Pmut(b)是突变修改模式b的概率, S(b,t)是模式b在时刻t的实例的强度, M(b,t)是模式b在时刻t的实例数,M(b,t+1)是模式b在时刻t+1的实例数)。
3.取代:后代随机取代原有的串。并引入了死亡率这个概念,使群体规模保持稳定。
以上3个步骤多次循环,使得适应度高的“积木”( 候选规则)在总体的比重越来越大,从而强化了整体的适应度。
关于遗传算法,网上有一篇约翰霍兰的文章http://www.econ.iastate.edu/tesfatsi/holland.GAIntro.htm 进行了介绍
例子
作者在叙述完建立适应性主体的规则后,举了两个经济学中的例子来说明适应性主体的巨大威力。
囚徒困境中的适应性主体
囚徒困境是博弈论中一个经典的案例,两个囚犯被隔离关押,面临审讯,如果他们都拒绝招供(双双合作),那么他们将无罪释放,如果他们有一人招供(背叛),一人拒绝招供(合作),那么背叛者会释放并得到奖励,合作者被判重刑。如果两人都招供(双双背叛),那么都会判较轻的刑。
当进行多次囚徒困境对策时,何种策略是最好的。作者应用适应性主体技术,将合作(H)和背叛(B)看成字符,将个体的策略看成字符串(如HBHBHBHBBBH………..)根据博弈结果对每个策略进行打分,然后用高分策略取代低分策略,这样就能发现更好的策略。事实经过计算机模拟实验,研究者很快发现了针锋相对策略,甚至还发现了更好的策略(考虑到受骗的情况)。
适应性主体与股票市场模拟
适应性主体还可以用于股票市场模拟。根据IF(价格A) THEN(买入)和IF(价格
以上算是把作者的本章的内容和思路做了一个完整的笔记。虽然只是一本薄书中的一章,其中的信息量还是很大的。下面谈谈作者建立模型的方法给我的不少启示。
首先是在建立规则时从一般到特殊,遵循由易到难的原则。在最低层次上的单元及规则尽可能简单,但同时要有充分的灵活性,如IF-THEN规则的应用,备选积木的选择上考虑了貌似真实性的原则。这些原则虽然简单,但是可塑性很强,在更高层次能出现更丰富的复杂模式,也有利于作者更好地考虑自己的理论前提。
第二个是比喻在建立模型中的大量应用。像经济学中的买卖交易模型,生物学中的等位基因比喻和染色体交换复制比喻,以及计算平均适应度时关于地貌的比喻。由此可以看出比喻在复杂性研究中旺盛的生命力,复杂性研究注重跨学科性,各个学科建立的经典模式,都可以产生启发性的观点,然后应用数学进行必要的转换。在约翰霍兰的理论中比喻被放在了一个非常重要的位置上,以致于他在《涌现》一书专门一章来探讨这个主题。
竞争性假设同时竞争,这或许就是复杂性研究区别与传统人工智能的地方。并行性处理既增加了处理的效率,也增加了容错性,可以根据环境进行更为丰富的调整。
积木的选择,积木是对主体系统有重要影响的有效模式。作为系统的中间机制,积木连结这上层总体特性和下层个体行为,也是系统呈现出复杂多样性和简化复分析计算的重要条件。所以积木的选择就成了主体能够发挥更大作用的关键所在。作者采用染色体交换复制的类比,试图运用进化的原理使重要积木能够自动的筛选出来,并逐渐固定化。这种充满新意的方法叫做遗传算法,在90年代成了很热门的学科。网上能搜到不少书。也许有机会可以抱着学习的态度看一看。
附:第一章主体的七个基本元素
聚集(特性):有两层含义,第一层指简化复杂系统的一种标准方法,把相似的东西聚成类。第二层是指这些较为简单的主体通过聚集相互作用,出现复杂的大尺度行为。
标识(机制):为了聚集和边界生成而普遍存在的一种机制,如如旗帜、消息标题、信息素等。
非线性(特性):整体非个体的简单的线性求和。如生态学中的捕食者-被捕食者模型÷Lotka-Volterra模型、三体模型。非线性特性会干扰用于聚集的线性方法。
流(特性):在拥有众多节点和连接的网络中资源的流动。随着时间,流和网络表现出对变化的适应性。在经济学中流有两个效应:乘数效应和再循环效应(recycling effect)
多样性(特性):一种动态的适应性的模式,从生物进化论的角度会对多样性有更深的理解。
内部模型(机制):主体用于预测未来和行为决策的关键机制,含有隐式(对一些期望的未来状态的隐式预测,指明当前行为)和显式(作为一个基础用于作为其他选择时明显的但是内部的探索,即前瞻过程)两种。
积木(机制):对一些有效和关键性的模式的重复使用,如数学中的公理,音乐中的音符,生物学中的细胞。较高层次的规律是从较低层次积木的规律中推导出来的
在第一章作者详细介绍了复杂性系统的七种基本元素(聚集、标识、流、非线性、多样性、积木机制,内部模型),第二章开始采用这些基本要素组建适应性主体。
作者一开始用纽约市的例子对七种要素进行了简单的归纳,简而言之:在纽约市这个复杂系统以各种各样的公司为主体(聚集),公司外部有各种各样的广告商标(标识)。公司内部有不同部门组成(积木机制),充满了形形色色、花样翻新的交易方式(内部模型)。公司之间互相交易,之间充满串行不息的物流和贸易(流), 使得城市这个系统既丰富多彩(多样性)又复杂不可预测(非线性)。
通过上面的例子我们可以看到作者描述的复杂性系统的一般特性,其中主体是系统中的关键环节。对于细胞、公司、神经元这些形形色色的主体,能否为所有主体找到一个统一的CAS(complex adaptive systems)方法。这是这一章作者试图做到的。
作者提出了探索可能性的3个步骤:
1. 找到一个统一的方式来描述主体的性能(执行系统),
2. 根据主体在环境中的成功(和失败)分配相应的信用(信用分派),
3. 在信用分派的基础上,调整主体性能和执行规则(规则发现)
作者根据这三个步骤讨论来他建立的适应性主体的计算机模型。
执行系统:
在一个缤纷复杂的环境中,主体如何处理周围的信息?作者利用计算机的输入-中央处理-输出系统进行类比。对应于计算机系统的输入输出,他设计一个探测器让主体感知周围的环境特征,然后用效应器来表现它的行为。对于执行系统的规则,作者没有采用人工智能比较盛行的复杂的规则体系,而是采用相对简单的因果性的IF-THEN规则,具体说是IF(有合适的信息)THEN(产生指令)。在规则的条件部分,作者设计语法时采用了二进制0,1以及#之类的符号,如二进制形式####…..###0#1,表示对倒数第1位是1和倒数第3位是0的任何消息作出反应,#表示不在乎该位置上的信息。作者设计一个message list作为“仓库”存储所有信息。规则之间是并行的关系,在执行系统的探测器获取信息时,所有规则同时激活,无论它们之间是否存在矛盾。这与计算机串行性处理方式和传统人工智能的处理相差甚大,这也是该模型相比于从前的优势所在,它可以强化主体面对新环境时的灵活性和适应性。
信用分派:
作者把规则看成一个正在进行检验和确认的假设,目标是为了寻找矛盾,即规则提供了一系列竞争性假设。这和前面的并行性一样,是模型的精髓所在。
但是面对各种竞争性的假设,系统如何裁决它们之间的优劣?作者由此提出了信用分派规则。根据规则的有用性(在环境中的功能和适应性),为每一个规则分派一个强度。在执行系统中多个规则同时起作用时,信用分派变的很复杂。作者在这里采用了买卖中生产商、供应商、顾客交易的比喻:供应商从生产商方面进货(消耗信用币),再卖给顾客(获得信用币)。系统(供应商)从大量的规则原件(生产商)中获取可能有用的规则(货物),然后在环境(顾客)中进行检验,将检验结果进行回馈。信用币就类似与分派强度,通过多次“交易”使有用的规则获得更高的强度。通过这种作者称为传递水桶算法(bucket brigade algorithm)的方法,系统最终对规则完成合理的信用分派。
随后作者将这个进价比喻稍微修改,建构出主体的内部模型。他又加入了具体性这一个指标。语法中#的数量与信息的数量成反比,信息的数量与具体性成正比。让出价数目(即分派强度)正比于强度和具体性的乘积。这样作者可以使系统在一般规则基础上生成特殊规则(具体性高),并设计出一系列规则的共生现象。需要指出的是,用现有语法形成内部模型时,检验一般的规则比特殊的规则要容易(因为特殊规则信息量更大)
规则发现
因为建立一般的规则比较容易,所以作者建立主体的行为模式,是缺省层次(一般规则)开始的。那么如何确定缺省层次的规则(一般规则)就成了作者要解决的首要问题。首先作者先探讨如何确定候选规则,他采用“貌似真实性”法则(根据过去经验没有明显错误)。对于规则的积木(候选规则)的选择,最直接的是用规则串选定位置上的值作为潜在的积木。
在这里作者又提出了等位基因的比喻,他把规则串看成染色体,把积木(规则串选定位置上的值)看成等位基因。这就把两者的行为模式类比起来。那么我们就可以借鉴遗传学上综合适应度(overall fitness)和平均适应度(average fitness)的概念。在借鉴的过程中,为了解决非线性(因为等位基因的交互作用,适应度是等位基因的非线性函数)的困难,作者引进了一个新的忽略符号★区别于#(#属于条件集合{1,0,#},★属于模式集合{1,0,#,★},因为条件等同于接收的消息集合,模式等同于接收的条件集合,所以#定义了不同的消息,)★定义了不同的条件。也就是说★作为模式中定义的符号,处在比条件定义符号#更高一级的位置),来定义多个位置组成的积木。
在此比喻的基础上,作者全面借鉴遗传机制,先定义所有主体规则的平均强度A和某个模式规则的平均强度S, 再将S与A比较,决定该规则的适应度。在比较规则中作者提出了地貌比喻,把模式规则的平均强度看成山的高度(考夫曼的n-k地貌),用在在计算机上进行可视化的数学分析。
为了解决计算模式平均数S(b)的巨大工程量,作者创造性地提出了遗传算法这个方法。 简单的讲包括以下三个步骤:
1.规则串(染色体)根据适应度繁殖:用模式平均数计算作为启发式计算依据,高于平均数的模式有更多实例,低于平均数的模式有更少实例
2.重组:父母串通过配对、交换、突变,产生后代串。在交换中更多使用高于平均数的短模式,但可能打乱长模式。交换中的组合效应用模式定理的进行总结(数学形式是M(b,t+1)=[1-L(b)/(L-1)][1-Pmut(b)]S(b,t)M(b,t),其中 L(b)/(L-1)表示交换点落在模式b外边界的概率, Pmut(b)是突变修改模式b的概率, S(b,t)是模式b在时刻t的实例的强度, M(b,t)是模式b在时刻t的实例数,M(b,t+1)是模式b在时刻t+1的实例数)。
3.取代:后代随机取代原有的串。并引入了死亡率这个概念,使群体规模保持稳定。
以上3个步骤多次循环,使得适应度高的“积木”( 候选规则)在总体的比重越来越大,从而强化了整体的适应度。
关于遗传算法,网上有一篇约翰霍兰的文章http://www.econ.iastate.edu/tesfatsi/holland.GAIntro.htm 进行了介绍
例子
作者在叙述完建立适应性主体的规则后,举了两个经济学中的例子来说明适应性主体的巨大威力。
囚徒困境中的适应性主体
囚徒困境是博弈论中一个经典的案例,两个囚犯被隔离关押,面临审讯,如果他们都拒绝招供(双双合作),那么他们将无罪释放,如果他们有一人招供(背叛),一人拒绝招供(合作),那么背叛者会释放并得到奖励,合作者被判重刑。如果两人都招供(双双背叛),那么都会判较轻的刑。
当进行多次囚徒困境对策时,何种策略是最好的。作者应用适应性主体技术,将合作(H)和背叛(B)看成字符,将个体的策略看成字符串(如HBHBHBHBBBH………..)根据博弈结果对每个策略进行打分,然后用高分策略取代低分策略,这样就能发现更好的策略。事实经过计算机模拟实验,研究者很快发现了针锋相对策略,甚至还发现了更好的策略(考虑到受骗的情况)。
适应性主体与股票市场模拟
适应性主体还可以用于股票市场模拟。根据IF(价格A) THEN(买入)和IF(价格
以上算是把作者的本章的内容和思路做了一个完整的笔记。虽然只是一本薄书中的一章,其中的信息量还是很大的。下面谈谈作者建立模型的方法给我的不少启示。
首先是在建立规则时从一般到特殊,遵循由易到难的原则。在最低层次上的单元及规则尽可能简单,但同时要有充分的灵活性,如IF-THEN规则的应用,备选积木的选择上考虑了貌似真实性的原则。这些原则虽然简单,但是可塑性很强,在更高层次能出现更丰富的复杂模式,也有利于作者更好地考虑自己的理论前提。
第二个是比喻在建立模型中的大量应用。像经济学中的买卖交易模型,生物学中的等位基因比喻和染色体交换复制比喻,以及计算平均适应度时关于地貌的比喻。由此可以看出比喻在复杂性研究中旺盛的生命力,复杂性研究注重跨学科性,各个学科建立的经典模式,都可以产生启发性的观点,然后应用数学进行必要的转换。在约翰霍兰的理论中比喻被放在了一个非常重要的位置上,以致于他在《涌现》一书专门一章来探讨这个主题。
竞争性假设同时竞争,这或许就是复杂性研究区别与传统人工智能的地方。并行性处理既增加了处理的效率,也增加了容错性,可以根据环境进行更为丰富的调整。
积木的选择,积木是对主体系统有重要影响的有效模式。作为系统的中间机制,积木连结这上层总体特性和下层个体行为,也是系统呈现出复杂多样性和简化复分析计算的重要条件。所以积木的选择就成了主体能够发挥更大作用的关键所在。作者采用染色体交换复制的类比,试图运用进化的原理使重要积木能够自动的筛选出来,并逐渐固定化。这种充满新意的方法叫做遗传算法,在90年代成了很热门的学科。网上能搜到不少书。也许有机会可以抱着学习的态度看一看。
附:第一章主体的七个基本元素
聚集(特性):有两层含义,第一层指简化复杂系统的一种标准方法,把相似的东西聚成类。第二层是指这些较为简单的主体通过聚集相互作用,出现复杂的大尺度行为。
标识(机制):为了聚集和边界生成而普遍存在的一种机制,如如旗帜、消息标题、信息素等。
非线性(特性):整体非个体的简单的线性求和。如生态学中的捕食者-被捕食者模型÷Lotka-Volterra模型、三体模型。非线性特性会干扰用于聚集的线性方法。
流(特性):在拥有众多节点和连接的网络中资源的流动。随着时间,流和网络表现出对变化的适应性。在经济学中流有两个效应:乘数效应和再循环效应(recycling effect)
多样性(特性):一种动态的适应性的模式,从生物进化论的角度会对多样性有更深的理解。
内部模型(机制):主体用于预测未来和行为决策的关键机制,含有隐式(对一些期望的未来状态的隐式预测,指明当前行为)和显式(作为一个基础用于作为其他选择时明显的但是内部的探索,即前瞻过程)两种。
积木(机制):对一些有效和关键性的模式的重复使用,如数学中的公理,音乐中的音符,生物学中的细胞。较高层次的规律是从较低层次积木的规律中推导出来的
没有评论:
发表评论