前天的文章结尾承诺这周末要写两篇文章,但一直到这会儿,周六的晚上八点半,我还没想好从哪下笔,要写的东西我大概有数,但如何循序渐进地把这些东西写出来能让文章可读性更强,对我来说是个难题。
今天要写的内容,大部分都来自《复杂性思维》、《资本市场的混沌与秩序》这两本书,其中第一本书我是在CSDN博客上查看的中文版翻译,另外一本书是从网上下载的PDF文档。
有很多思想的形成,是自发性的,如果早些年在我没有形成自己的交易体系之前,即使读这些书,也一样很难有收获,因为书中没有大家所希望寻找的“交易圣杯”或者“屠龙术”。但如果有了完善的交易体系,再去读这些内容,就完全不会觉得这是“有趣但毫无用处”的知识了。
对于这一系列内容来说,我计划分成最少5-10篇文章来写,是个大工程。我会把答应大家的关于缠论和MACD等等大家所感兴趣的内容也都融合在这个系列里。
今天的话题从沙堆悖论说起。
对于每个上过初中的朋友,都知道“集合”的概念,利用上大学后学的逻辑门“与或非”,我们可以把事物清晰地分成不同的集合。
举个例子,我们可以把人类按性别分成男性he或者女性she,很多人抬杠会说“人妖不是男也不是女”,那么男女这两个集合就不能构成完整的全集。但如果我们把人类划分成“男性”和“非男性”,就可以构成完整的全集,“非男性”就是“男性”的补集。
下边我们再举个例子,沙子和沙堆。
如果有一堆沙子,我们拿走一颗,是不是还是一堆沙子?接下来我们拿走一颗,再拿走一颗,继续拿走。。,一直到只剩下最后一颗沙子,这一颗沙子肯定不能再称为“沙堆”,那么问题来了:从什么时候开始,这一堆沙子开始变得不能叫“沙堆”呢?
这个案例用传统的集合论就无法定义了,“沙堆悖论”是模糊集合的一个经典案例。
类似的例子是我们在生活中时常用到但难以定义的,比如大和小,美和丑等等。孙红雷和小岳岳的眼睛肯定都不算大眼睛,但谁也没仔细测量过,我们用肉眼一眼就能看出来。
模糊集合的创立者——美国学者洛特菲札得 曾这样阐述模糊集合:
当复杂性出现时,精确性陈述失去意义,而有意义的陈述失去精确性。
我们从来不会这样描述一个人的外貌“面部皮肤色码#FFFAFA,鼻尖高2.6cm,两眼间距2.1cm,上眼脸弧度,下眼睑弧度,额头宽,表面粗糙度。。。”,你能看出来我在描述范冰冰吗?
模糊集合是模糊数学的基本概念之一,现在的人工智能研究领域所研究的大量课题都是关于模式识别的,也就是模糊集合的处理。
对于股市来说,理解模糊集合有什么意义呢?
举个例子,一只股票,我们有一组标准来评估它是否合算,十项标准里有九项都满足,但有一项不满足,这时候我们可以认为这只股票相当合算,但是某一项不太合算。
是不是有点熟悉的感觉?这是多因子模型的常用方法。
平时大家即使不使用量化交易,是不是也时常会不自觉地用到类似的表述,“这只股票基本面没有问题,什么时候入场是个难点”——换句话说“基本面满足条件,技术面不太满足”。“这只股票技术形态不错,但具体如何引爆不清楚”——是不是万事俱备只欠东风?
在我以往的文章中,多次使用了后边这一类表述方式。今天这篇文章读完之后,大家就会恍然大悟“原来这是模糊集合的概念。”
在模糊集合里,会有一个区域,既属于一个子集,也属于这个子集的补集。
在股票市场上,某些敏感区域就是这样的存在,它既可以演化成看涨形态,也可以演化成看跌形态。比如我在11月的文章里谈到当时的市场位置,就比较系统实时地谈到了市场是如何演化的。关于这部分分析,明天再详细谈。
。。。。
下边谈另外一个概念——贝叶斯概率。理解贝叶斯概率对理解资本市场至关重要。
平时我们在很多文章和书籍上都在谈论炒股炒“概率”,然后还会有人和你说“大数定律”、“凯利公式”、“反等价鞅”,说的好像挺明白一样。另外还有人说炒股的统计规律那是“频率”,不是“概率”,巴拉巴拉。今天,就再和大家掰扯掰扯关于概率。
平时大家所说的“概率”,就是“或然率”,是指不依赖于样本本身的大小而存在的随机事件发生的可能性。比如掷骰子,每一面出现的概率都是1/6。比如抛硬币,正反面出现的概率都是0.5,即使前边连续出现十次正面,下次出现反面的概率仍然只能是0.5,而不会增加也不会减少。这是传统的“概率”的概念。
对于某些赌博游戏来说,是完全符合概率,并且在这种情况下是可以用到“大数定律”的。
18世纪英国数学家托马斯贝叶斯提出了“贝叶斯概率”的概念,用数学语言表达是这样的:
支持某项属性的事件发生的越多,则该属性成立的可能性就越大。
贝叶斯概率
举个简单例子:一个人总是做好事,那么他下次遇到类似的情况继续做好事的可能性就更大。
是不是很符合人们的日常心理?比如银行的征信系统,一个人一直有良好的信用记录,那么他下次仍然保持良好信用记录的可能性就更大。(贾跃亭和王思聪暗暗冷笑。。。)
这就是“先验概率”,当我们没办法穷举一个人一生中所有行为的时候,只能通过ta的历史记录来判断下次发生的概率。为了和贝叶斯概率相区分,也可以把传统概率称为“频率概率”。
很有意思的一点是,贝叶斯概率提出的时间是175x年,距今已经差不多250年了,但他的理论一直得不到足够的重视,同时,经济领域又在大量地使用贝叶斯概率作为分析工具,比如刚才提到的征信系统。
(插一个题外话,按百度百科上的说法,贝叶斯是在1763年提出贝叶斯概率的观点,同时又清晰地记录了贝叶斯死于1761年,所以我对贝叶斯概率的提出时间存疑。)
贝叶斯概率中有个非常重要的概念,叫做“置信度”和“置信区间”,如果对数学不敏感的话,你可以简单理解为量化判断一个概率区间,置信区间越大,贝叶斯概率接近真实概率的把握就越大。
大家可以回顾下我以往的文章,我们谈到过严监管下无牛市,提到过牛市需要宽信用的支持,提到过高通胀下无牛市,等等,这些都是先验概率,就是根据既往经验得出的样本概率。
现在的监管政策、信贷政策、经济数据、消息面、技术面,都“看起来像”要向上突破。那么,如果对比贝叶斯概率的数学表达,再贴一次:
支持某项属性的事件发生的越多,则该属性成立的可能性就越大。
贝叶斯概率
你会得出什么样的结论?
如果一个东西看起来像是牛肉,吃起来也像牛肉,摸着也像牛肉,那ta很可能就是牛肉。
今天先写到这,明天再继续。
晚安。