落日朝霞: 《隐秩序》读书笔记之“适应性主体”

(《隐秩序》这本书买的挺早了，但是只是最初浅读了一遍，对其中的一些概念和要素有了大概的了解，具体细节并不清楚。这个寒假准备把这本书和他的姐妹篇好好读一下，做一些笔记增加自己的收获)

在第一章作者详细介绍了复杂性系统的七种基本元素（聚集、标识、流、非线性、多样性、积木机制，内部模型），第二章开始采用这些基本要素组建适应性主体。

作者一开始用纽约市的例子对七种要素进行了简单的归纳，简而言之：在纽约市这个复杂系统以各种各样的公司为主体（聚集），公司外部有各种各样的广告商标（标识）。公司内部有不同部门组成（积木机制），充满了形形色色、花样翻新的交易方式（内部模型）。公司之间互相交易，之间充满串行不息的物流和贸易（流），使得城市这个系统既丰富多彩（多样性）又复杂不可预测（非线性）。

通过上面的例子我们可以看到作者描述的复杂性系统的一般特性，其中主体是系统中的关键环节。对于细胞、公司、神经元这些形形色色的主体，能否为所有主体找到一个统一的CAS（complex adaptive systems）方法。这是这一章作者试图做到的。
作者提出了探索可能性的3个步骤：
1. 找到一个统一的方式来描述主体的性能（执行系统），
2. 根据主体在环境中的成功（和失败）分配相应的信用（信用分派），
3. 在信用分派的基础上，调整主体性能和执行规则（规则发现）

作者根据这三个步骤讨论来他建立的适应性主体的计算机模型。

执行系统：

在一个缤纷复杂的环境中，主体如何处理周围的信息？作者利用计算机的输入－中央处理－输出系统进行类比。对应于计算机系统的输入输出，他设计一个探测器让主体感知周围的环境特征，然后用效应器来表现它的行为。对于执行系统的规则，作者没有采用人工智能比较盛行的复杂的规则体系，而是采用相对简单的因果性的IF-THEN规则，具体说是IF(有合适的信息)THEN（产生指令）。在规则的条件部分，作者设计语法时采用了二进制0，1以及＃之类的符号，如二进制形式＃＃＃＃…..＃＃＃0＃1，表示对倒数第1位是1和倒数第3位是0的任何消息作出反应，＃表示不在乎该位置上的信息。作者设计一个message list作为“仓库”存储所有信息。规则之间是并行的关系，在执行系统的探测器获取信息时，所有规则同时激活，无论它们之间是否存在矛盾。这与计算机串行性处理方式和传统人工智能的处理相差甚大，这也是该模型相比于从前的优势所在，它可以强化主体面对新环境时的灵活性和适应性。

信用分派：

作者把规则看成一个正在进行检验和确认的假设，目标是为了寻找矛盾，即规则提供了一系列竞争性假设。这和前面的并行性一样，是模型的精髓所在。

但是面对各种竞争性的假设，系统如何裁决它们之间的优劣？作者由此提出了信用分派规则。根据规则的有用性（在环境中的功能和适应性），为每一个规则分派一个强度。在执行系统中多个规则同时起作用时，信用分派变的很复杂。作者在这里采用了买卖中生产商、供应商、顾客交易的比喻：供应商从生产商方面进货（消耗信用币），再卖给顾客（获得信用币）。系统（供应商）从大量的规则原件（生产商）中获取可能有用的规则（货物），然后在环境（顾客）中进行检验，将检验结果进行回馈。信用币就类似与分派强度，通过多次“交易”使有用的规则获得更高的强度。通过这种作者称为传递水桶算法（bucket brigade algorithm）的方法，系统最终对规则完成合理的信用分派。

随后作者将这个进价比喻稍微修改，建构出主体的内部模型。他又加入了具体性这一个指标。语法中＃的数量与信息的数量成反比，信息的数量与具体性成正比。让出价数目（即分派强度）正比于强度和具体性的乘积。这样作者可以使系统在一般规则基础上生成特殊规则（具体性高），并设计出一系列规则的共生现象。需要指出的是，用现有语法形成内部模型时，检验一般的规则比特殊的规则要容易（因为特殊规则信息量更大）

规则发现

因为建立一般的规则比较容易，所以作者建立主体的行为模式，是缺省层次（一般规则）开始的。那么如何确定缺省层次的规则（一般规则）就成了作者要解决的首要问题。首先作者先探讨如何确定候选规则，他采用“貌似真实性”法则(根据过去经验没有明显错误)。对于规则的积木（候选规则）的选择，最直接的是用规则串选定位置上的值作为潜在的积木。

在这里作者又提出了等位基因的比喻，他把规则串看成染色体，把积木（规则串选定位置上的值）看成等位基因。这就把两者的行为模式类比起来。那么我们就可以借鉴遗传学上综合适应度（overall fitness）和平均适应度（average fitness）的概念。在借鉴的过程中，为了解决非线性（因为等位基因的交互作用，适应度是等位基因的非线性函数）的困难，作者引进了一个新的忽略符号★区别于＃（＃属于条件集合{1,0,#}，★属于模式集合{1，0，＃，★}，因为条件等同于接收的消息集合，模式等同于接收的条件集合，所以＃定义了不同的消息，）★定义了不同的条件。也就是说★作为模式中定义的符号，处在比条件定义符号＃更高一级的位置），来定义多个位置组成的积木。

在此比喻的基础上，作者全面借鉴遗传机制，先定义所有主体规则的平均强度A和某个模式规则的平均强度S, 再将S与A比较，决定该规则的适应度。在比较规则中作者提出了地貌比喻，把模式规则的平均强度看成山的高度（考夫曼的n-k地貌），用在在计算机上进行可视化的数学分析。

为了解决计算模式平均数S(b)的巨大工程量，作者创造性地提出了遗传算法这个方法。简单的讲包括以下三个步骤：
1.规则串（染色体）根据适应度繁殖：用模式平均数计算作为启发式计算依据，高于平均数的模式有更多实例，低于平均数的模式有更少实例
2.重组：父母串通过配对、交换、突变，产生后代串。在交换中更多使用高于平均数的短模式，但可能打乱长模式。交换中的组合效应用模式定理的进行总结（数学形式是M(b,t+1)=[1-L(b)/(L-1)][1-Pmut(b)]S(b,t)M(b,t),其中 L(b)/(L-1)表示交换点落在模式b外边界的概率， Pmut(b)是突变修改模式b的概率， S(b,t)是模式b在时刻t的实例的强度， M(b,t)是模式b在时刻t的实例数，M(b,t+1)是模式b在时刻t+1的实例数）。
3.取代：后代随机取代原有的串。并引入了死亡率这个概念，使群体规模保持稳定。

以上3个步骤多次循环，使得适应度高的“积木”（候选规则）在总体的比重越来越大，从而强化了整体的适应度。

关于遗传算法，网上有一篇约翰霍兰的文章http://www.econ.iastate.edu/tesfatsi/holland.GAIntro.htm 进行了介绍

例子

作者在叙述完建立适应性主体的规则后，举了两个经济学中的例子来说明适应性主体的巨大威力。

囚徒困境中的适应性主体

囚徒困境是博弈论中一个经典的案例，两个囚犯被隔离关押，面临审讯，如果他们都拒绝招供（双双合作），那么他们将无罪释放，如果他们有一人招供（背叛），一人拒绝招供（合作），那么背叛者会释放并得到奖励，合作者被判重刑。如果两人都招供（双双背叛），那么都会判较轻的刑。

当进行多次囚徒困境对策时，何种策略是最好的。作者应用适应性主体技术，将合作（H）和背叛(B)看成字符，将个体的策略看成字符串（如HBHBHBHBBBH………..）根据博弈结果对每个策略进行打分，然后用高分策略取代低分策略，这样就能发现更好的策略。事实经过计算机模拟实验，研究者很快发现了针锋相对策略，甚至还发现了更好的策略（考虑到受骗的情况）。

适应性主体与股票市场模拟

适应性主体还可以用于股票市场模拟。根据IF（价格A） THEN（买入）和IF(价格

以上算是把作者的本章的内容和思路做了一个完整的笔记。虽然只是一本薄书中的一章，其中的信息量还是很大的。下面谈谈作者建立模型的方法给我的不少启示。

首先是在建立规则时从一般到特殊，遵循由易到难的原则。在最低层次上的单元及规则尽可能简单，但同时要有充分的灵活性，如IF－THEN规则的应用，备选积木的选择上考虑了貌似真实性的原则。这些原则虽然简单，但是可塑性很强，在更高层次能出现更丰富的复杂模式，也有利于作者更好地考虑自己的理论前提。

第二个是比喻在建立模型中的大量应用。像经济学中的买卖交易模型，生物学中的等位基因比喻和染色体交换复制比喻，以及计算平均适应度时关于地貌的比喻。由此可以看出比喻在复杂性研究中旺盛的生命力，复杂性研究注重跨学科性，各个学科建立的经典模式，都可以产生启发性的观点，然后应用数学进行必要的转换。在约翰霍兰的理论中比喻被放在了一个非常重要的位置上，以致于他在《涌现》一书专门一章来探讨这个主题。

竞争性假设同时竞争，这或许就是复杂性研究区别与传统人工智能的地方。并行性处理既增加了处理的效率，也增加了容错性，可以根据环境进行更为丰富的调整。

积木的选择，积木是对主体系统有重要影响的有效模式。作为系统的中间机制，积木连结这上层总体特性和下层个体行为，也是系统呈现出复杂多样性和简化复分析计算的重要条件。所以积木的选择就成了主体能够发挥更大作用的关键所在。作者采用染色体交换复制的类比，试图运用进化的原理使重要积木能够自动的筛选出来，并逐渐固定化。这种充满新意的方法叫做遗传算法，在90年代成了很热门的学科。网上能搜到不少书。也许有机会可以抱着学习的态度看一看。

附：第一章主体的七个基本元素

聚集（特性）：有两层含义，第一层指简化复杂系统的一种标准方法，把相似的东西聚成类。第二层是指这些较为简单的主体通过聚集相互作用，出现复杂的大尺度行为。

标识（机制）：为了聚集和边界生成而普遍存在的一种机制，如如旗帜、消息标题、信息素等。

非线性（特性）：整体非个体的简单的线性求和。如生态学中的捕食者－被捕食者模型÷Lotka-Volterra模型、三体模型。非线性特性会干扰用于聚集的线性方法。

流（特性）：在拥有众多节点和连接的网络中资源的流动。随着时间，流和网络表现出对变化的适应性。在经济学中流有两个效应：乘数效应和再循环效应（recycling effect）

多样性（特性）：一种动态的适应性的模式，从生物进化论的角度会对多样性有更深的理解。

内部模型（机制）：主体用于预测未来和行为决策的关键机制，含有隐式（对一些期望的未来状态的隐式预测，指明当前行为）和显式（作为一个基础用于作为其他选择时明显的但是内部的探索，即前瞻过程）两种。

积木（机制）：对一些有效和关键性的模式的重复使用，如数学中的公理，音乐中的音符，生物学中的细胞。较高层次的规律是从较低层次积木的规律中推导出来的

落日朝霞

2009年2月7日星期六

《隐秩序》读书笔记之“适应性主体”

没有评论:

我的简介

mp3

关注者

博客归档