BedRock

2022年5月14日已讀 15 分鐘

控制论、系统论与投资

已更新：4月3日

控制论与系统论是理解事物变化非常底层的学科，理解这些底层的学科对于我们更好的理解这个世界会有很多帮助。
本文来自于BEDROCK成员Jimmy，及其和团队讨论记录。

控制和反馈

控制论和系统论的研究开始于可能性空间。

事物变化的所有可能组成了其可能性空间，这个空间之外的事情是不可能做到的，比如点石成金（不考虑核聚变）。控制论的目标就是控制条件，使事物向着希望的目标变化，也就是控制就是可能性空间的缩小。

根据控制条件的方法，可以分为随机控制、有记忆的控制、共轭控制等等。

随机控制就是碰运气，例如要在一串钥匙里找到能开门的那把，就只能一个个尝试。值得注意的是，要确保正确的条件处于尝试范围之内。如果正确的钥匙不在钥匙串里，试多少遍都没用。随机控制的特点在于系统的可能性空间只有在达到目标值时才缩小，不达到目标值时，可能性空间不缩小。

如果能记住哪些钥匙已经试过了是错误的，下次碰运气时把它们排除在外，这就是有记忆的控制。这种方法的要点在于一定要仔细辨认，如果错把正确的钥匙归类到了错误的那一堆，那就永远不可能找到正确的钥匙了。

共轭控制指的是通过转换、替代的方式，扩大控制条件的作用范围。例如，曹冲称象就是把大象的重量转换为了石头的重量，从而使其变得可测量了。

负反馈控制指的是通过不断测量当前状态与目标的差值，并且不断采取措施来降低这个差值，使一次次的控制累积起来，最终完成目标。人用手抓东西、鹰抓兔子、导弹摧毁攻击目标等等都采用了负反馈控制。

负反馈控制最大的优点在于可以把多次控制的结果累积起来，相当于放大了控制能力。对个人来说，不要提前做太精确的计划，因为客观事物总是在不断变化的，只能走一步看一步，不断根据最新的情况来调整自己的行动，一步步地接近目标。

与之相反，正反馈就是一步步远离目标（或者说是平衡态、初始态）的过程，比如军备竞赛。正反馈常常被称作是恶性循环，因为它很容易导致系统的超出控制和崩溃。

BR Research：

如何识别正反馈，如何获得核心变量信息？现实中的操作难度很大，比如如何定义流动性危机的R0值就是个问题，临界值的识别也是问题
负反馈在现实中不一定能够完全实现（不一定回归，比如遇到了结构性变化。比如严重依赖人工主导的纺织业，在遇到工业革命之后，还是手工作坊的纺织业就不一定能实现负反馈）
正反馈也不一定能够最终负反馈。比如在周期下行中，如果公司挂了，没有负反馈机会。如果陷入了流动性陷阱，没有外力也无力形成新的负反馈
投资中，周期品投资是利用负反馈，竞争力研究是利用正反馈。

信息、思维和组织

"知道"，实际上就是我们头脑中关于事物变化可能性空间变大或变小的过程。在绝大多数情况下，可能性空间变小。

信息：可能性空间变化的比率的负对数。当可能性空间缩小时，信息量是正的；可能性空间不变时，信息量是零；可能性空间变大时，信息量是负的。

BR Research:

比如，在原有认为市场有规则下运作的，但发生国内教培、平台治理等问题（负信息）后，未来市场是否按照市场规则运作的可能性空间变大了。对于个人、企业如何安排消费、生产、投资的可能性空间也变大了。

作者后来写书，关于”中国的超稳定结构“。封建王朝统治结构大部分都是稳定态，但偶尔会崩溃，这种间歇性崩溃的机制其实是中国数千年整体稳定态结构的基础（大一统、中央集权等）。

信息在传递过程中的形式称为信号。不同形式的信号传递能力是不一样的，如光线、声音、电磁波等等。传递途径也是大不一样的。信息的传递就是可能性空间变化的传递。

实行控制需要获得足够的信息量。哑巴不一定是聋子，但先天性的耳聋就大概率是哑巴，就是因为没有收集到足够的信息来控制发声器官。人无法控制自己的心跳、血压也是类似的原因，如果把血压转换成视觉信号，经过训练之后就可以控制自己的血压了。

对于不同的人，同样的话有不同的意义，这种现象称为信息的主观性。人脑常常对收到的信息进行主观加工，人的认识与所发生的客观事件一般是不一样的。

信息的传递存在着通道和通道容量问题。一条通道在单位时间内，可以传递的最大信息量称力这一通道的通道容量。通道容量取决于通道的速度和人的控制能力、通道的可能性空间有多大、人对它的了解程度。

在单位时间里要传递集一定数量的信息时，选择的通道容量最好等于所要传递的信息量。比如，如果十字路口有几百个颜色的灯，反而会更难识别有效信息。

BR Research：

用在工作中很有效，沟通中减少无效信息的表达，并且要意识到无效信息会干扰有效信息的接收。因此沟通中要尽量精简、且都是干货。

信息传递的干扰分为三类：干扰发生在人控制通道的可辨状态过程中，这称为控制干扰；干扰发生在信号自然传递中，或某些外来因素影响了通道的可辨状态，这称为自然干扰或噪音；干扰发生在人接受信号过程中，这通常称为主观干扰。

消除干扰的过程称为滤波。

1）最直观的滤波方法是让信息沿着同一通道重复传递。这种方法对于排除那些随机发生的、偶然的干扰比较有效，但是它不能排除同一通道中那些系统地、有规则地发生的干扰。

2）另一个更好的滤波方法是，用完全不同的通道来传递同一个信息，再把各种结果拿来对比、分析。二次大战期间，盟军得到一个信息：“德国人还不能制造原子武器”。同时，盟军从另一条和军事方面完全没有关系的通道获知:"德国人正在用钍（tu）做牙膏。"钍是当时制造原子武器需要的化学元素。从这两条完全不相干的通道就证实了德国人还不能制造原子弹的结论。此外，异性繁殖的生物相对于有丝分裂的生物也是通过双通道（父本和母本）保证了DNA信息传递的有效性。

不同的通道指的是通道组成的各个环节尽量不同，否则在那些相同的环节中仍有可能受到特定干扰的影响。在曾参杀人的故事中，曾母接收信息的通道都是不同的人，他们有同样的信息源：是一个和曾参同名的人杀了人。

由于干扰的存在，信息量只会在传输过程中不断减少，不会增加。一般说来，信息传递通过的通道越长，环节越多，可能受到的干扰就越多。

BR Research：

研究中的重要信息，要多方比对，比如从专家、公司、同业/竞争对手、上下游、自上而下……

如果你是看好的，重视看空的信息

3）排除干扰还经常采用"阻抗滤波法"。阻抗滤波就是找到干扰和携带信息信号的本质差别，用一种装置或手段让干扰信号通不过去，而携带信息的信号能顺利通过。比如收音机能接收很多频率范围的信号，但是通过滤波，只播放某一个节目相应的无线电频率。

BR Research：

例子: 浏览式信息检索方式vs. 搜索式/推送式信息检索

4）当信息传递中遇到的干扰主要是主观干扰时，通常采用的滤波法是:让信息和它的重要性一起传递出去。比如，大声呼救时，音量大小就代表了信息的重要性。

5）反馈滤波法：利用收到的有用信号和通道互相作用，阻止无用信号通过。比如，在人眼收集到的许多信息中，人脑只关注视觉焦点的信息。

6）同步滤波：利用信号与通道开关的同步来滤波。也就是只有在需要传递信号时才打开通道，其他时间关闭通道。

除了尽量去伪存真以外，还需要一些更高级的思维规律。例如，在军事上，一些重要情报常常来之不易，它们往往只能通过某几条干扰很大的通道获得。一些著名的军事理论家指出，军事上的重大行动不能完全取决于情报，指挥官必须坚持自己的信念。

BR Research：

在投资中收集信息时，既需要通过以上这些方法来尽量去伪存真，同时也要依靠自己的常识、逻辑来判断信息的真伪。

信息加工的几种形式：

1）三段论，包括三个简单判断，每个判断都含有一定的信息量。三段论的实质是把大前提和小前提的信息加工成结论的信息。

2）概率论，通过数学计算得到有用的信息。

3）自由联想：先由一个信息A变到和它有共同部分的另一个信息B，再由B变到和它有共同部分（但和A并不一定有共同部分）的C，等等。

共扼控制在思维过程中是十分重要的。从控制论角度看,人的思维空间可以分为两个部分,一个称为形象空间,一个称为概念空间。人在进行形象思维时,形象思维就是形象空间中信息的运动。而概念空间代表抽象思维时信息运动范围。实际上,人在进行最简单的推理时,都必须牵涉到这两个空间的协调。在这种协调中,共轭控制是十分重要的。比如我们听说一个人服了敌敌畏,马上想到:这个人要死了。

BR Research：

投资也是通过对当前情况的研究来尝试得出对未来的判断，由于未来还没有发生，没人知道它一定会怎么样？在控制论当中，这其实涉及到很重要的概率判断和共轭控制，通过当前想象未来的过程。而这个映射过程实际上充满错误的可能性的，特别是利用当前的现状来对非常长时间未来的投射的时候。

组织产生的过程实际上是一个系统从无联系的状态，排除了许多別的可能联系方式，只取某一种或几种联系方式的过程。比如把混乱的人群排成队。一个系统必须获得一定量的信息才能组织起来。

在组织中，比如人类社会，每一个人都是信息源，又是信息的接受者，同时又是一个社会信息通道组成的要素。我们必须把一个事物的整个控制、反馈和信息传递过程综合起来考察。这就是系统理论。

系统及其演化

大系统中的新的因果联系：

1）因果长链。不断探寻原因的原因，就会得到因果长链。一方面为了考虑整体性，人们不得不考虑越来越多的因素，不得不把越来越长的因果链包含到研究的对象中来。另一方面，自然界的因果长链又是没有终点的，科学必须为自己规定适当的限度。

2）概率因果。经典的因果论认为任何原因都必然导致一定的结果。但是事实上，自然界许多事物之间的联系是有随机性的，原因A不一定会引起结果B。比如量子力学？

3）互为因果和自为因果。比如某一个经济系统中，缺煤导致机械厂生产不出机械，但采煤机器不足又导致了煤矿产量低。实际上，我们在研究因果长链时，总会发现因果链的闭合现象。不发生闭合的因果链在自然界几乎是不存在的。

BR Research

闭合：有终点。能找到最终原因？因果链不一定是直链（没有尽头），而是网状的，可以闭合。

也可以这样理解：在有限变量的封闭系统中，因果链是闭合的；在开放系统中，因果链是无限延伸的

4）因果网络：某一事件可能是许多原因共同作用的结果，而这一事件也可能造成许多结果。如生态学、经济学、生物组织等等。

建立相对孤立体系：首先，我们沿着因果长链追溯时，忽略那些影响概率足够小的因素，把它看作系统所受的干扰和系统之外的。其次，一个相对孤立体系尽可能是自相闭合的互为因果网络。第三，根据我们研究的目的和系统变化的时间尺度，抓住主要的互为因果变量，构造出系统模型。比如，如果研究的时间尺度不很长，那么我们可以把鹿群、森林、捕食者三个作为一个系统来研究，把土壤、气候的影响排除在外。

采用人为规定系统的方法，也就是对客观事物之间错综复杂关系的一种科学抽象，把无限的问题变换成了有限的问题来考察。

4）因果网络：某一事件可能是许多原因共同作用的结果，而这一事件也可能造成许多结果。如生态学、经济学、生物组织等等。

采用人为规定系统的方法，也就是对客观事物之间错综复杂关系的一种科学抽象，把无限的问题变换成了有限的问题来考察。

系统会从一种稳态变成另一种稳态，如果新稳态有不止一种可能性，就叫做分叉。这时，系统到底演化到两种稳定结构的哪一种去，就或多或少带有一点偶然性。当系统演化面临分叉现象时，单纯的决定论是不适用的。很多时候，初始条件微小的差异，可以导致系统演化到有巨大差异的不同系统。

但是不同的稳态最终也会趋同，称为汇流。比如草食类动物大多数都进化出来了蹄子。

自繁殖系统：在一定条件下，某变量值越大，变量值增加越快。比如核爆炸，雪崩。

自繁殖的特征：

1）任何自繁殖过程往往存在一个临界值，只有当一个系统变量大于这一临界值，才会有自繁殖发生。

2）自繁殖系统内部存在着一条有因果关系的自动增长链。

3）很多自繁殖系统的形成是由于负反馈控制机制破坏引起的。

自繁殖系统这种变量增长的现象不会无限延伸下去，一般会导致系统的崩溃，并最终到达新的稳态。

自组织系统：组织过程是在一组事物或变量之间自动发生的，不需要这组事物或变量以外的力量进行干预。

特点：

1）先有一个组织核心。

2）自组织系统是一个不稳定系统，或者是一个亚稳定系统。

3）自组织系统内部存在着一条有因果关系的自动选择链。

4）自组织过程是不可逆的。

5）自组织核心微小的差别，可以导致最后形成大组织的巨大差别。

BR Research：

自组织系统是正反馈的一种表现形式，具有极大的力量。

网络效应就是一种自组织形态，往往一旦形成就不可逆的越来越大，且很难被其他网络所替代。

自组织系统：组织过程是在一组事物或变量之间自动发生的，不需要这组事物或变量以外的力量进行干预。

特点：

1）先有一个组织核心。

2）自组织系统是一个不稳定系统，或者是一个亚稳定系统。

3）自组织系统内部存在着一条有因果关系的自动选择链。

4）自组织过程是不可逆的。

5）自组织核心微小的差别，可以导致最后形成大组织的巨大差别。

BR Research：

自组织系统是正反馈的一种表现形式，具有极大的力量。

网络效应就是一种自组织形态，往往一旦形成就不可逆的越来越大，且很难被其他网络所替代。

质变的数学模型

质变可以通过飞跃和渐变两种方式实现。比如水结冰是质变，但是玻璃是逐渐变硬的。

判别飞跃的原则：如果质变中经历的中间过渡态是不稳定的，那么它就是一个飞跃过程。如果中间过渡是稳定的，那么它就是一个渐变过程。雪崩是飞跃，而滚雪球是渐变。爆炸是飞跃，燃烧是渐变。

在两个质态相互转化的过程中，有两个跟条件的变化相关的基本因素，即维持旧质态稳定性的因素和建立新质态稳定性的因素，如果新质因素增强的同时，旧质因素没有明显减弱，质变就可能以飞跃方式进行；如果新质因素增强的同时，旧质因素明显减弱，质变就可能以渐进方式进行。

质变可以用突变函数来表示。当控制变量不多于4个，状态变量不多于2个时，有7种模型，这些是最基本的模式。当影响突变的控制变量多于5个时，突变模型有无限多种类型。

矫枉过正现象是有严格的条件的，只有当质变以飞跃方式进行时才可能发生，比如水超过100°时才能沸腾，水蒸气要低于100°时才能冷凝。但不是一切有飞跃出现的场合矫枉都必须过正。

极端共存：在一定的条件下，大系统的各个子系统可能同时处于各种完全不同的质态之中。比如水有两态共存区，液态和固态可以同时存在，但是不存在中间态。比如在一个风暴很多的小岛中，昆虫只有两种进化结果：要么没有翅膀，躲在草丛里；要么翅膀很强，可以对抗狂风。

BR Research：

人类社会本身，市场涨跌，科技进步，甚至心理状态等都有可能呈现出渐变和质变的结果，即使是对比较大级别的模式转换paradigm shift，也有可能存在不同的变化模式。

很多成长类投资本质上就是投资那些正在进行当中的新质因素，但需要警惕的是当前的新质因素某一天被更新的因素所替代。

而很多价值投资本质投资的是相对旧质的因素会相对稳定（因为其往往占据主导，且处于回馈现金的成熟阶段），即使是缓慢的渐变的下滑，往往都是可以有充分预期的。但一旦被新质因素以某种不能被察觉的方式质变替代（黑天鹅往往都是突发的、严重的偏离趋势线的形式存在），则可能造成巨大的损失，因为意味着严重的定价不足。

黑箱认识论

控制论把人们认识和改造的对象看作黑箱。对于一个黑箱（客体），我们用一组可观察变量和可控制变量构成的系统来描述它。

控制论认为，认识客体黑箱有两种不同的方法。一种叫不打开黑箱的方法，一种叫打开黑箱的方法。比如钟表，可以观察它的指针运动规律，也可以拆开研究里面的齿轮啮合关系。

根据黑箱外部的输入输出而提出的关于黑箱内部的情况的假定，在控制中称为模型。模型只是一种假设，它不一定表示黑箱内部的实际结构。当有能力打开黑箱时，原有的模型往往需要改进，这就是科学进步的过程。但是新的系统仍然是一个黑箱。因此人们总得采用一些不打开黑箱的方法来研究问题，解决问题。

毛泽东提出的“实践-理论-实践”的模式就是根据认识与实践的差值来不断修改主观认识的负反馈控制过程。但是，它受到了五点限制：

1）可观察变量和可控制变量的限制。如果这些没有改进，理论也就无法进步

2）理论的清晰性。也就是理论要给出一定的信息量，这样才能与实践检验作比较。相当于科学的可证伪性。

3）模型逼近客观真理的速度。要使一个反馈调节有效，反馈调节的速度必须大于客体变化的速度，否则就会发生振荡现象，从一种极端走向另一种极端，不能达到有效控制的目的。例如，如果检测的速度慢于物质变化的速度，就无法得到正确的模型。物理学中有一个很重要的假设就是规律是不随时间、空间变化的。

4）反馈过度。任何负反馈调节系统如果出现反馈过度，都会从一个逐步逼近目标的稳定过程转化振荡过程。例如，光学在粒子说——波动说——粒子说之间振荡，直到量子场论对光的本性作出正确的解释才结束。

5）可判定条件。实践结果和理论结果之间的误差必须要能够反映理论跟客观真理的接近程度。例如，牛顿发现的万有引力定律差一点被他放弃掉，因为根据当时测量的子午线算出的引力大小跟他的理论不符合。在以实践作为检验真理的最终标准的同时，尤其是可判定条件不满足时，人们还运用着一些中间标准。例如，爱因斯坦为了解释光的二重性，曾提出了"导场"的理论，但是这个理论不满足能量守恒定律，所以爱因斯坦一直没有发表它。

某一规律成立所依赖的条件越少，这一规律越普遍。随着人控制自然的能力的增加，其认识规律的普遍性越大。

当人类对自然谋求更大的控制权时才会产生科学，而那些人类一时无法控制但又企图去控制的事物便会成为科学研究的第一批对象。因此，科学有一个中心，有一个出发点，这个中心就是人本身，而出发点则是他最初所具有的控制能力及其可能控制的那一批变量。

对投资的启发

控制论从一个不同的视角提出了新的认识世界的方式，其中的很多概念都是可以直接应用到投资中的。比如，系统往往具有一个稳态，但是又常常表现为围绕着这个稳态的震荡运动。就像是经济发展中的金融危机，在萧条和泡沫之间摆动；或者是股价的波动，长期来看它是围绕着公司的价值变化的。在复杂系统中，运用控制论的方法寻找出最终的稳态是能做到的，但是要确定它具体的变化过程却是无比困难，因为变量太多且各个变量之间相互影响，一点微小的扰动就会造成巨大的变化。所以在投资中，价值投资的核心就是寻找到长期的稳态结构，也就是公司的价值，而短期的变化则是难以预测的。

BR Research：

索罗斯的反身性就是寻找正反馈的非稳态，从里面赚钱。但他不是早早就进去的，而是等到临界点出现之后再进场。

临界点的判断，在过程中识别也不容易，也是一个不断试错的过程。针对不同的过程，临界点的判断方法也不一样，只能具体问题具体分析。

本拾投资

控制论、系统论与投资

最新文章

Comments