微软前总裁高群耀说过一句话让我印象深刻,大意是我们努力了那么多年,取得了不小的成就,我相信我们一定做对了一些事情。我觉得能够做对事情的一个重要前提是,我们想对了一些事情,而要想对事情就需要掌握一些正确的思考方法。
巴菲特和芒格一定不是靠掷筛子下注的,他们比一些人更接近真相的最重要原因是因为他们掌握了更正确的思维方式。
我个人将思考问题分成7个步骤。
1.正确的定义问题Define Question
我们的身体常常不太聪明,表面现象常常另有所指。牙齿脱落可能是肾虚;而头发疼可能是脑子出了毛病。同样的,我们的大脑常常不聪明,大脑提出的问题未必是真正需要解决的问题。
一个打算跳槽的做人力资源的学妹曾经问我,“我投的一家大公司即将给我offer了,可是现在所在民营企业的老板答应给我加薪升职,我还该不该跳槽呢?”
我问她“为什么要跳槽呢?”
“想去外资企业。”
“为什么想去外资企业呢?”
“外企规模大,也更加正规。”
“为什么要去规模大的企业呢?”
“因为规模大的企业有一套完善的流程。”
“有完善流程的企业对你有什么帮助呢?”
“能够让我学到更加完整的人力资源体系。”
“学到这个对你意味着什么?”
“这是我职业发展的方向和向上突破的重要基础。”
“好,那么现在的企业即使给你升职,是否能让你学到完整的体系呢?”
“不能,我明白了。”
这个时候学妹头势和思路就非常清楚了。其实,在这个过程中我只是帮她纠正了定义问题的方法。她的问题不该是一开始问的“该不该跳槽”,而应该是“哪个公司能给我我要的学到完整人力资源体系的机会”。
我曾经留意过一天中被问到的问题。我发现,2/3以上的提问者自己都没想清楚自己最终想知道什么。我们得不到答案往往是因为没有问正确的问题。
2.建立逻辑树Set up Logical(Decision)Tree
巴菲特最好的合作伙伴查理.芒格曾经形容过巴菲特的思维方式的优点,其中一点就是巴菲特及其善于运用逻辑树,又叫决策树。
什么是决策树?就是由所问的问题展开的要解决这个问题需要考虑的因素(把问题作为结果,即是会影响结果的因素)。这是我自己的定义,未必准确。
例如,我想知道为何阿凡达的票房会如此火爆,请问你该如何回答。是因为炒作?因为实力?还是因为导演知名度?
这些答案都没有错,但是这个问题的答案可能更复杂一些,复杂到我们不能仅仅通过拍脑袋想到或者媒体上看到的几种可能性来下定论。
我和自己做了一下头脑风暴,得到了如下逻辑树,见图。
阿凡达剧中有棵生命之树,是潘朵拉星球生命的根源,万物由它而生。把我们的问题当作生命之树,衍生出的各种可能性和影响因素通过层层剥离的方法列出,就形成了逻辑树。此处我只粗略列了2个1级目录,4个2级目录以及16个细分原因,如果认真思索,一定能想到更多。
3.奥多姆剃刀Dirty Filter
你一定也发现了,逻辑树中有几处原因有明显的问题。例如,内部因素->人的因素->演员。
不清楚导演的用意何在,这部片子的演员基本都不是大牌,可能是为了节约片酬成本(反正看不清脸),也可能是个人习惯(当年的《泰坦尼克号》启用的也不是当时的大牌)。因此,由于演员吸引了观众而促使《阿凡达》火爆的说法显然站不住脚。我们可以直接将他从逻辑树中删除。
奥多姆剃刀的原意已经很难考(我已经看到众多版本,这也不是本章的目的),我的解释是为确保高效简洁和操作性,保留核心,大胆删除不相关部分或者相关度低的部分。
4.提出假设Build Hypothesis
到了最关键的一步了。
大多数人的思维方式是正向思维(这也是人类大脑“原装”的思维方式),即演绎的思维。要回答阿凡达为何火爆的问题,我们可以收集海量的各种数据,动用大量的人力物力精力,综合分析,最后计算出无数种可能性,最后从庞杂的数据库中寻找相关联系,最后找出问题的答案。
然而我们往往没有这样无限的资源,即使有,我们是否存在更好的方法呢?
逻辑学家提出了归纳的方式,这种思考方式在数学家手中发展出了递归的思维方法。当运用到科学领域的时候,科学家总结出了一种有效的思维模型:假设-检验。
也就是说,在我用海量数据进行分析之前,先进行假设。例如,我根据自己的常识,感觉以及少量的数据,进行判断,提出一个假设,“《阿凡达》的火爆票房是因为经济大萧条引起的”。这个假设不是空穴来风,确有许多经济学家发现一个隐藏的违背常识的规律:当经济萧条的时候,就是娱乐产业爆发的阶段。好,既然这个假设是有可能成立的,我们接下来就要找到相应的数据,来支持,或者推翻我们的假设。
5.确定数据Define Data
我现在就要找到数据来检验我的假设,“《阿凡达》的火爆票房是因为经济大萧条引起的”。那么我需要哪些数据呢?
如果我以美国为例,如果假设成立,那么美国经济的发展趋势是否和娱乐产业相悖?美国有几次经济萧条?萧条期娱乐产业发展速度如何?那么非萧条期娱乐产业发展又如何?(在证明一件事情是什么的时候必须同时证明他不是什么)娱乐产业,尤其是电影产业有哪几个爆发的阶段?这些阶段GDP的发展如何?在欧洲,日本,中国等国家和地区是否有同样趋势?
此外,如果我们想把问题解决的更加严密,还需要考虑这样几个问题:《阿凡达》多大程度能够代表电影产业和娱乐产业?(毕竟娱乐产业再好的时候毁掉的电影也不在少数)电影产业的火爆是因为经济萧条引起的?还是仅仅同时发生但并无因果关系?如果有因果关系,产业链又是如何从经济引导到一部具体的电影的?这些问题,有需要哪些数据来支持?
回答完这些问题,我们就确定了收集数据的方向。
6.写出数据来源List Data Source
我们已经明确了需要哪些来源,好比我们已经为晚上的Party开好了菜单,那么现在我们就要规划好去哪里买菜了。是去大卖场,还是超市,菜场,还是便利店。不同的产品需要从不同的渠道采购,数据也是一样。
7.收集数据Collect Data
开始着手收集需要的信息,并在这个过程中不断调整计划。
好,到这里为止,我们完成了一个思维循环。我们在处理任何的问题时,一种有效的方法就是以果为始。以最终的结果作为思考的开始,以最初需要的数据或者信息为这个循环思维的终点。在思考一个重要问题,或者做出重要结论前,先确定真正的问题,思索一下所有的相关因素,进行清理。然后针对重点提出假设,并明确支持或者推翻假设需要的数据,然后明确目的地,收集数据。这样的思考方式,能帮助我们变得更高效,科学和强大。
今天是个信息爆炸的时代,我们不缺少信息,唯独缺少有效的辨别信息的思维方式。就好比缺乏一杆标尺,帮助我们衡量哪些信息是重要的,哪些是我们不需要浪费时间的,而哪些根本就是垃圾。
1.实证模型
首先,有很多问题是无法通过数据得到理性科学结果的。请问,以下哪个问题是我们能够通过数据解释从而解决的呢?
1)人生的意义是什么?
2)甲型猪流感被治愈的概率是多少?
3)灵魂转世是否存在?
回答问题之前,先要知道什么是“实证”。一个最简单明了的理解:“实证的”就是指能够通过客观事实来证实的。
科学的思考方法的一个重要基石就是实证主义,即任何一个理论或者理念要被确认为正确的话,首先他必须是能被观察的,能现实存在的。否则就无法被科学地承认。
如果有人认为科学其实也未必“科学”,还有大量科学未能解释的现象例如用意念移动电视机,所以我们凭什么相信“实证”就是对的呢。对不起,我只讨论科学系统中的思考方法,人文主义的理解不在此讨论。
接下来,我们使用实证模型看待之前的三个命题,很显然,1)人生的意义是什么?是我们无法通过实证来证明的,这个问题直接pass,我们根本不需要花时间讨论,因为根本没有终极的答案,当然这不妨碍我们思考这个问题。
2)甲型猪流感被治愈的概率是多少?无疑是能够被现实观察和证明的。
3)灵魂转世是否存在?这是个有趣的问题,貌似很难观察和证实,而事实上我们还是能找到方法来证明的
2.可证伪模型
我们在互联网上常常看到许多颠覆性的言论,惊为天人。想想总觉得有什么不对但是又不知道问题在哪里。这时候可证伪是个非常有用的模型。
可证伪性模型有3点需要注意。
1) 可证伪的定义。可证伪定义比较长,我的通俗表达就是:当这句话/理论是为真时,发生A,如果不为真时,发生B。A和B互斥。
好了,就是那么简单。我记得曾经有个足球解说嘉宾,他显然很好的掌握了可证伪这个模型,所以反过来使用忽悠观众。他每场比赛开始都会说,“这场比赛主队优势非常大,只要好好打,胜利就是他们的。但是,如果对手好好打,那么可能就要输了。”最后不忘补充一句,“当然,如果大家都发挥不错,平也是有可能的”。我听了就想把脚上臭袜子塞他嘴里去。现实生活中,我们可以运用可证伪这个模型来辨别信息的正确性(或者反过来说是可笑性)。
2) 能解释一切的东西往往不具可证伪性。
刚才的解说嘉宾就解释了一切可能性,不管主队最后是胜平负,他都是正确的。因为他的“正确”是建立在不可证伪的基础上的,因此事实上他“很可能”是错的。
另外一个典型的例子就是星座。星座认为人的出生时间决定了这个人的性格,未来,甚至人生轨迹。总之这个人他妈决定什么时候生他就给他一生定了性了。
我试图举出反例证明星座很可能是不存在的,我的例子是有一对孪生姐妹,因为被不同的家庭抱走了,因此性格迥异,人生遭遇也迥异,但他们确实是同时出生的。如果星座是对的,那么他们的未来应该是完全相同至少非常接近的。
但是马上有许许多多星座的拥趸来指出了我的“无知”。他们告诉我,星座是很精确的,精确到每0.00000000(此处省略200个零)1秒。所以,虽说是孪生姐妹,但是他们在出娘胎的时间上也是有细微分别的。而正因为星座对时间的解释是如此精确,所以孪生姐妹几乎不可能在同一时间出生,他们的性格和未来迥异是很正常的啊!最后得出结论,即便是孪生姐妹悖论也无法证明星座的无效性,星座是万能的,是终极真理,是千秋万代,一统江湖。
好吧,既然如此,我也无话可说了。
3) 可证伪是有强度的。强度不同,可信度也不同。
我说我能预测扑克牌的大小,随便抽一张王之外的扑克,我预测这张牌一定大于等于1,小于14,你是不是想抽我一顿?
是的,这就是所谓股神使用的技巧。股神提供的预测往往是貌似能够证伪,实则可证伪强度很低的。
股神会先发表预测,看好某类股票,并告知大家,他预测股票一定会涨,除非国际市场发生变化。这个所谓“国际市场的变化”的范围其实非常大,大到通用破产了小到邻居流产了。但是杀红了眼的投资者往往不会仔细考虑这些信息的可证伪强度。最后,如果预测对了,股神微微一笑故作神秘;如果错了,就会说这是由于某某国际事件的意外影响。总之股神是不会错的,因为他的话虽然可证伪,但是可证伪强度几乎为零。
可证伪模型能够帮我们辨别信息的可信度。
3.信息来源模型
信息是否准确,一个重要的衡量标准是信息的来源是否可靠。这个可靠包含两层含义。第一层是这个信息的根源是否可信。第二层含义是信息宣传的来源渠道是否可信。
在第一个层面上,最可信的渠道就是得到行业认可的专业学术刊物。一个理性的科学观点如果要成为社会的主流,那么必然要能够经历同行的考验。
面对当前国内雨后春笋般的经济学家,要分辨其是真有实力还是仅仅哗众取宠,只要看他是否曾在国际核心刊物上发表过论文。郎咸平教授虽然具有“走江湖”人士才具备的出众口才,但是其发表在Journal of Financial Economics和ournal of Finance的论文能够证明他在国际上是能说上话的,并非哗众取宠。
而曾经盛行网上的“X个奇异事件”,其实只需要留心其信息来源,就会发现要不是不知名的八卦小报,要不就是凭空编造的的来源信息,即便是确有起源,也是假借其名,在第二层面上进行造价。
通过业内认可的专业期刊获得的信息是比较可信的,而其他来源的信息,需要谨慎得追根溯源,否则可能研究半天得到一堆垃圾。
4.个案见证模型
我们经常可以在网上看到这类故事:某国(一般不是美国就是俄罗斯)专家发现某种独特治疗癌症的方法(意料之外情理更之外的方法),例如吃屎或者长时间倒立,可以有效治愈癌症,并已在多名志愿者身上试验成功。
此类信息,基本不可信。原因是一件事情如果只能靠“个案”或者“见证者”是无法证明其真实性和有效性的。那么哪类信息是可信的呢?是拥有大量样本的统计数据。
格兰德维尔有一本书叫《Outlier》,中文名字叫《异类》,描述了与大的群体表现不符合的一小部分人的情况。但是,outlier是大自然中的少数,outlier的存在是无法代表大多数的。
因此,在判断一个论断,或者一个发现的时候,只需要分辨这个结论的依据是大量的实验或者统计数据,还是仅有的几个个案。
个案见证模型可以帮我们分辨信息的代表性,从而判断是否需要采用。
5.具象模型
大部分的信息都是抽象的,如果将之具体化形象化,简称具象,会加深这个信息给我们的印象,增大在我们心中的影响。具象模型分成2个部分,分别是“鲜活形象效应”和“当下发生效应”。
举例说明“鲜活形象效应”。当你听到全世界受饥荒影响的人口是地球总人口的30%,你可能只是获得一个数字,不会有更深一次的感触。而如果你看到的是一部纪录片,记录了某国3个贫困儿童在饥荒中和狗争食,捡人们抛弃的垃圾为生的生存现状的话,你一定会被深深触动,从而认为饥荒的情况非常严重。后者因为形象鲜活,而不是一个冷酷的数字,使人主观夸大了信息的影响力。
再看“当下发生效应”。电影《阿凡达》最火爆时,很多人认为这是人类历史上最伟大的电影。其实,这并不单是因为《阿凡达》本身优秀,而是因为这是当前发生的事情,人类善于遗忘的天性让我们无意中将当前发生的事情的影响力夸大。再过若干年,《阿凡达》应该也会成为我们记忆中某一部已经被淘汰的“有点印象”的电影。
使用“具象模型”,我们就能轻易的解释,为什么飞机作为全世界最安全的交通工具却有许多人宁愿做汽车而不敢坐飞机。
具象模型给我们提供了一种思路,哪些重要的信息是被我们主观意识夸大的,从而是我们可能客观的其影响。
看侦探小说最大的乐趣不在于知道结局,而在于侦探提出犯罪假设,到现场寻找线索,然后在脑中思考这些线索的关联和矛盾,从而建立犯罪真相的模型,最后将线索填入模型,Bingo!得出结论的思考过程。
这个主题将分享我的5个寻找真相模型,体验成为数据侦探的乐趣。
1.因果关联模型
我上大学时,我发现一个非常有趣的规律。周围哥们和女朋友分手的概率是和他最近去学校小卖部的概率成正比的,我把这个叫做“超市夺妻理论”。
这个发现乍一看很令人惊讶,男人去超市的次数怎么会和与女友分手成正比关系呢?如果这两者没有关系,为什么数字上呈现明显的正相关呢?
仔细观察后我发现,事情原来是这样的。一般人去超市购买生活必需品的频率基本是相同的,同时一个人的生活习惯和购买习惯不会轻易改变的。但有一件东西的购买频率是很容易改变的,就是香烟。为什么呢?因为香烟和这个人近期的心情有很大关系。除了少数见人就发烟的豪杰,大部分人的香烟都是买来供自己抽的。
如果一个人最近抽烟数量猛增,一般只有两种可能。一是精神压力极大,这往往是因为生活上遇到了困难。例如考试考不出,工作找不到,考试没抄着答案,或是抄着了答案但是被发现了。这种情况下,这哥们会陷入低潮,心情失落,脾气特差,也疏忽了女友的感受,这些因素是感情产生了摩擦,导致了感情的裂缝最终导致分手。第二种可能是喜欢上了某种上瘾的嗜好。比如麻将,打牌,网游等等。这种比较刺激的大众文化娱乐活动非常耗费体力脑力,需要一只只的香烟提神。于是女友因为无法忍受男友的不求上进而提出分手。
上面这个例子说明了一件事情,当我们看待一个事件或者数据时,A和B同时发生,未必代表A和B有因果关系,他们可能只是有相关性而已。
因果关联模型就是在脑中建立一个报警器,当看到两个高度相关的事件或者数据时,敏锐的识别出他们究竟是因果关系还是仅仅只有相关性,以防止我们被表面现象或者所谓专家举出的别有用心的数据所迷惑。
2.第三因素模型
我们知道了AB相关并不代表因果,那么尝试进一步思考,AB究竟为何会呈现如此高的相关性呢?背后的原因是什么?
答案是第三因素。也就是说AB之间存在一个隐藏的关系C,其实是AB和C发生因果关系。
例如,当我们发现一个地区燕尾服的销量越高,该地区的出生率越低。为了达到农民不要生太多孩子的目的,我们是否要求农民都穿着燕尾服去种地呢?
显然不是的。假设燕尾服的销量是A,出生率是B,那么一定存在一个经济发达指数C。当经济越发达,高级宴会等需要燕尾服的场合会相应增加,同时经济发达也早就了更多的丁克族,从而降低了出生率。所以我们可以说C导致了A,也导致了B。所以C才是和AB发生因果关系的幕后黑手。
第三方模型在因果关联模型的基础上提供了发现幕后驱动因素的思考方法。但是,现实生活中的第三方因素并不都像燕尾服的例子那么显而易见,我们应该如何通过科学的方法找到并确定第三因素呢?
3. “If…So…”控制模型
我们在思考的时候可以借鉴科学研究中常用的“控制实验法”。用最简单的语言解释“控制实验法”就是:确保其他因素不变,找到发生影响的根源。
心理学家Harlow做过一个非常有趣的实验。(例子来自于<How to think straight about psycology>)他想回答一个困扰大众多年的问题,人们的恋母情节究竟是什么因素造成的,是因为母亲的哪方面特质是孩子迷恋母亲?当时流行的假设是因为母亲提供了食物(乳汁),其他可能的相关因素有体温(母亲抱着孩子),舒适的触感(孩子抚摸母亲)等。
Harlow用猴子做了实验,小猴将接触2个假的不同的母猴,经过一段时间后,看小猴更喜欢哪个母猴。实验中,他每次都保证其他变量不变,而只改变他要测试的变量,例如母猴子都不提供食物,体温都一样,但是只有触感不同。这样他就控制了第三方变量。
Harlow发现,一段时间后,相比起硬邦邦的电线制作的母猴子,小猴子明显偏爱触感更佳的绒线做的母猴子。然后Harlow再加入其他变量,例如温暖的电线猴子和冰冷的绒线猴子;能提供乳汁的电线猴子和不能提供乳汁的绒线猴子。他发现小猴子依然偏爱绒线猴子。所以他得出了恋母情结是来自婴儿时期抚摸的触感这个结论。
实验通过保证其他变量不变,而只改变要测试的量,来达到发现第三方变量的目的。
同样,当我们在思考的时候,我们需要在脑中建立一个“If…So…”的控制模型。当其他的条件不变,如果这个情况变了,那么事情会受到什么影响。那么我们就能辨别什么是事情的驱动因素。更重要的,一旦这个驱动因素发生了变化,我们就能最快预见到未来会发生什么。
4.交互影响模型
但是,再一次,现实生活要比拿猴子做实验复杂的多。
例如,女人为什么会爱上某个男人?显然答案就不是一个简单的“金钱”,“外貌”,“性格”,“幽默”能够完全解释的了。这是一个多种因素结合的结果。这类由多种因素相互作用共同作用于结果的影响就叫做交互影响。
这个结论非常简单,但是放眼世界,我们能发现无数忽视交互影响的人。看一下财经博客就会发现,无数自封的经济学家或者投资专家依然在仅通过通货膨胀,CPI,某项技术性指标,央行的某项措施甚至罗斯柴尔德家族的动向等单一数据/信息解释股市的走向。
在脑中建立一个交互影响的模型,就是当看到一个数据/信息的时候,将该数据/信息放入过滤器过滤,判断是属于单一因素起决定作用,还是众多因素相互影响共同作用。如果是交互影响,又有哪些因素共同作用,哪些作用大?哪些作用久?哪些又对其他因素产生影响?
作为数据侦探,如果没有嵌入交互影响的思考模型,就会夸大片面数据/信息的影响,而得出错误的结论,变成屡犯错误的毛利小五郎。
5.安慰剂效应模型
安慰剂效应的概念非常普及,也很便于理解。最经典的关于安慰剂的案例是,把相同病症的病患随机分成两组,一组吃最新研制的特效药,另一组吃无疗效的镇定剂;一段时间后,吃特效药和吃镇定剂的病患都认为自己的病症减轻了。
既然如此简单,那么为什么我们还需要建立一个关于安慰剂效益的模型呢?因为以上这个普及版的安慰剂概念是错误的。
为什么说是错误的呢?以上这个案例的内容结合“安慰剂”三个字会让人产生一种误解:病症的减轻是因为镇定剂带来的心理暗示(安慰)作用,所以由这种心理暗示(安慰)作用带来的以为自己好转的现象叫做安慰剂效应。
而事实上,安慰剂效应指的是,“错误地认为自己所采取的行动对结果产生了积极的作用,而最有代表性的例子就是服用安慰剂案例。”
在该案例中,让我们举一反三。人体本来就具有一定程度自我修复的功能,所以服用镇定剂一组确实可能好转,而并不是心理安慰的作用。同样,服用特效药一组的好转也可能是因为自我修复能力,而特效药可能根本是无效,是研发失败的。
安慰剂效应模型可以帮助我们质疑看似无懈可击的错误逻辑,发现隐藏的真相。正确的理解了安慰剂效应模型,我们就能看看它对我们是多么有效了。我们带着安慰剂模型再来尝试回答下列问题:通用电气的一时繁荣,是否真的来源于杰克.韦尔奇的改革措施?美国经济指标的好转,是否真的来源于奥巴马政府的经济措施?温室效应的日渐明显,是否真的来源于人类的污染行为?
还是因为,他们本来就会这样,即使我们什么都不做?
6.因果方向模型
我有个朋友身高矮小,他常常后悔少年时代没有打篮球而是一直踢足球,因为他认为打篮球能帮助人长高。他的理由是,你看NBA的人都那么高,还不是打篮球打出来的?可是他错了。NBA的人不是因为打篮球所以长那么高,而是因为长得高,所以适合打篮球。
我们以为A导致了B的发生,可事实上可能正好相反。我们常常犯因果倒置的错误,从而得出完全错误的结论,这就是为什么因果方向模型如此重要。
此外,因果的方向不是固定的,是可能发生互换的。比如巴菲特早期选股凭的是眼光,他挑选可能会上涨的股票;而到了晚年,巴菲特选股可以靠影响力,他挑选股票的消息本身就会造成股票上涨,因为市场相信巴菲特的眼光。
所以,我们看待一个数据/信息时,需要首先找到它的假设前提。许多假设前提都是隐藏的,但却决定了作者基于假设的观点正确与否。因果方向模型提供了解构和质疑假设前提的一种思维方式。
正确思考的一个重点是正确的阅读和分析数据/信息。首先需要使用因果关联模型分辨关联与因果的差异性,在这基础上使用第三方模型寻找可能的驱动因素,通过控制模型确定真正的第三方因素。然后通过交互影响模型全面的认识本质,通过安慰剂效应模型了解现象改变的真正原因。最后通过因果方向模型结构信息的假设,从而正确认识数据/信息,形成自己的思考结论。