枸杞岛攻略人人都有超级大脑,你我为何还这么蠢-孤独大脑

人人都有超级大脑,你我为何还这么蠢-孤独大脑
1、
挖一个比特币要耗多少电?
你在谷歌或者百度搜索一次的耗电量能烧开一壶开水吗?
比特币的“挖矿”,是利用芯片的计算能力 (“hashpower”),在比特币全球网络的区块中不断进行“哈希碰撞”,比竞争对手更快地求解,以此赢得在公开账簿上的记账权,获得系统奖励的比特币。
Digiconomist的评估结果是:一枚比特币耗电近1000度。而腾讯上的一篇最新文章认为,一币耗电18000度。
2012年的一次粗略研究表明,每Google搜索1次耗能相当于烧半壶开水。
战胜李世石的AlphaGo,其耗电量是多少呢?
分布式AlphaGo的配置是:1202个CPU+176个GPUs(同时有40个搜索线)金主请上当。CPU+GPU的满载能耗是8.972万W,所有元器件总耗能≥15万W。即使按最低使用率20%计,能耗高达3万W。
一个人脑的耗能呢?大概30W。职业棋手对弈时的能耗会比较高,但对比计算机,真是太节能了。
有篇论文专门解释了能耗如此之大的原因:
现有的计算机是通过冯·诺依曼构架方式进行信息存储与处理的,即信息存储与信息处理在物理上是分离的,在处理器和存储器之间需要进行大量的信息传递;
而人脑则是由近千亿个神经元相互交叉连接而形成的神经元网络所构成。神经元之间的连接称为突触。信息通过改变神经元之间的连接强度(称为突触权重)来进行存储与处理,并且具有自学习功能,实现了存储与处理的一体化。
IBM曾打造了一台模拟人脑的超级计算机,涵盖了约100亿个类似于人类大脑神经元的组织,虽然在神经元数目上已经达到了人类大脑的10%以上,但这台计算机的运行速度只有人类的1/1500。按照该设计方案,想要让计算机达到与人脑一样的处理速度,所需的电力与旧金山和纽约的耗电量相仿。
考虑到人类的大脑是在漫长的进化中,靠修修补补才成为今天的样子,居然能够实现如此高效的计算,我们在自豪之余,忍不住要问:
既然人人都有这样一个超级计算机,为何我们还那么蠢呢?
2、
大脑作为一种超级计算机,也有一些天生短板,例如,对于概率和统计,大脑的直觉经常不起作用。
斯坦福大学的概率和统计学家Persi Diaconis总结:“我们的大脑生来就不太会搞概率,所以这么多人弄错也正常蛮荒大巫师。”
卡尼曼在《快与慢》里探索了这个难题:为什么人类很难具备统计型思维?
我们思考时总是会把多种事情联系起来,会将一件事情比喻成另一件,会突然想起一件事来,但统计学要求同一时间把多件事情串联起来,而这一点大脑的直觉很难做到。
3、
让我们先从一道简单的题开始:
帽子里有三张卡片。一张两面都是红色(“红-红”),一张两面都是白色(“白-白”),一张一面红色一面白色(“红-白”)。
从里面随机抓出一张卡片扔向空中,落地后红色一面朝上。问:这张卡片是“红-红”的概率是多少?
请你准备三张纸片,写成上面的样子,以便更直观地思考。
看起来很简单猛龙雷克顿啊,根据已有信息qq奶奶,这张牌要么是(“红-红”)那一张,要么是(“红-白”),二者出现的可能性是一样的,所以是“红-红”的概率是50%,不是吗?
正确答案是:2/3。
《不确定世界的理性选择》一书中,对此给出了清晰直观的解答。
正确的问题表征是根据卡片的面,而不是整张卡。
所有结果的样本空间包括六个事件——每张卡片的每一面各为一个事件。
由于红色的一面向上,因此在“有效样本空间”中共有三个事件:红白(红面向上)、红-红(一个红面向上)、红-红(另一个红面向上)。
因此正确答案是 2/ 3——三个等概率事件中,其中两个是红-红。
我们的错觉在于,红-红这张牌每回只能出现一次,为什么其两面可以“拆”成两个独立事件呢?
我们用穷举法,以“概率树”的形式,加上书中的配图(如下),更容易理解:

4、
再来一题:
一家两个小孩,已知生男生女概率相同,已知一个是女孩博伊卡,请问另外一个也是女孩的概率是多少?
解答:用穷举法78挂靠网,两个小孩有如下四种可能--
第一胎 第二胎男男男 女女 男女 女
所以,已知有一个是女孩,所以排除第一种可能,剩下三种可能性,答案是1/3。
这一题的有两类让人迷惑之处:
a、已知一个是女孩幽灵箭毒蛙,另外一个要么是男孩,要么是女孩,答案应该是1/2呀?
b、如果按照穷举法,就像上面那题“红-红”牌要分正反面,这道题两个女孩,为什么不分姐妹呢?
5、
再来一题,以下内容来自《悖论:破解科学史上最复杂的9大谜团》一书。
假设你想购买两只小猫。你打电话到附近的宠物店,老板说有两只同一胎出生的小猫在今天刚送达:一只黑猫,一只花猫。你向老板询问它们的性别剩女修真记,设想两种可能(其实是两个问题)的回答:
问题(a)他告诉你:“我只检查了其中一只,是公的。”如果没有其他信息,两只小猫都是公的概率是多少?
问题(b)他告诉你:“我只检查了花猫,是公的。”这种情况下,两只小猫都是公的概率又是多少?
这两种状况的答案其实是不同的。虽然我们知道两者都至少有一只猫是公的,但只有在第二种情况里,我们才知道公的是哪只,而这正是改变概率大小的额外信息。
以下我们来看看这个额外信息如何让概率产生变化。
首先,列出小猫性别的所有可能组合,共计四种:

考虑问题( a)魅尊。“至少其中一只是公的。”意味着可能是前三种组合之一:
( 1)两只都是公的;( 2)黑猫是公的,花猫是母的;( 3)黑猫是母的,花猫是公的。所以两只都是公的概率是三分之一。
在问题( b)里,你已经得知花猫是公的,这个额外信息除了排除第四种组合之外,同时也排除第二种组合。可能的组合只剩下两种:两只都是公的;或者花猫是公的,黑猫是母的。这种情况下,两只都是公猫的概率是二分之一。
因此可知,一旦你得知哪只猫是公的,两只都是公猫的概率立刻从三分之一变成二分之一。
“指定”和“未被指定”,差别极大。
典型的例子是“生日巧合”:有一群人,我和你打赌说,这群人里至少有两个人是同一天生日,你扫描了一下,觉得人不算多,而一年有365天,巧合并不容易,于是和我打赌。
事实是只要房间里有23个人,我的胜率就比你大。
假如指定了某个人,然后找出与该人同一天生日的,概率就要小很多。
但是因为“未被指定”,有两人同一天生日的概率,惊人地高,尽管有悖直觉。
再回到上一段的那个问题,我们更改一下:
一家两个小孩,已知生男生女概率相同,已知老大是女孩,请问另外一个也是女孩的概率是多少?
答案是:1/2。因为已知的那个女孩被“指定”了。
看看,尽管没有出现一个公式,尽管只是将所有的可能性罗列出来雪球花,尽管最多只出现了小学级别的分数,我们的脑袋还是被绕得有些晕。
在上面这道题里,“先验概率”和“贝叶斯定律”已经若隐若现。在今后的文章里,我不可避免地要触及这个“简单”而神秘的话题。
6、
这个方向最经典的问题,莫过于“三门问题”。
聪明如你一定看过这类题,但我会加问几个问题。请看:

该问题最早出现于《美国统计学人》,出名却是因为玛丽莲·沃斯·莎凡特,她在 1980年代中期,创造了吉尼斯世界纪录中的最高智商纪录,测验结果为 185。
莎凡特在发行量高达数千万份的美国周刊《大观杂志》开设专栏,回答读者提出的各种问题,包括数学益智问题、脑筋急转弯、逻辑机智问答等。有人向她提出如上问题,由此引发了一场超级论战。
莎凡特给出了如下正确答案,却招来大量质疑和指责,包括大学教授、数学家、博士在内的专业人士和聪明人,都对她进行了不亚于今日网络攻击的批评。

疑惑在于:
1)打开一扇门之后,剩下两扇门,难道每扇门之后有汽车的概率不是一样的50%吗?
2)如果主持人打开一扇门,那扇门原有的1/3可能性,为什么全部分配到C门了李治延?A和C有什么区别呢?
3)到底是什么神秘的力量,导致了概率的重新分配?
即使你知道并理解了这个问题的答案,还是可能忽略了本题的一个关键点:
主持人到底是否知道B门的后面没有汽车。
《不确定世界的理性选择》对此有精确的描述:
主持人的规则至少有三种可能的解释。
第一种规则:主持人总是随机打开没有被参与者选择的门(例如,在上面的情境中,主持人掷一枚硬币来决定打开 2号或 3号门)。这表示主持人可能打开一扇门并展示出门后的轿车,然后(和观众一起)笑话你选错了门,游戏结束。
第二种规则:假设主持人总是挑选后面藏着山羊的门打开,决不打开参与者挑选的门;当参与者已然选中了藏有轿车的门,主持人就随机打开一扇门。这样,参与者的选择和主持人开门之间的关系就更复杂了。
第三种规则:假设主持人总是挑选藏有山羊的门打开,决不打开参与者挑选的门;在参与者已然选中了藏有轿车的门之后,主持人有偏向地挑选剩下两扇门中序号较小的一扇打开(针对这种规则可能存在其他偏差)。
尽管这三种规则均符合上述问题的表述,但其潜在概率却各不相同。
在上面的题目里,我们留意到,主持人前面有个定语:
假如他知晓汽车的下落九宫剑法。
那么问题来了,假如主持人不知道汽车在哪个门的后面,这时他打开B门,发现后面没有汽车,那你换不换?
答案是:不换。因为这时A和C后面有汽车的概率,都是1/2。
我们大脑的直觉对此深表疑惑:
不管主持人是否知道B门后面没有汽车,他都是做的相同的动作(打开B门),并且得到了相同的结果(B门后面没有汽车),为什么会有截然不同的答案?
原因是:假如主持人知道车在哪里,对比不知道,即使做了相同的动作,他引入了额外的信息。
如同前面的题目,假如他知道,其实他“指定”了B门(这里的指定意思有所不同)。
又是“先验概率”和“贝叶斯定律”。
用贝叶斯定律可以非常简明地解答三门难题,证明:主持人是否知道实情,会令结果不一样。有兴趣的同学可以研究下图(请将盒子换做门,原图中有些表述也不太精确,但公式和结果都是对的):

也可以用前面概率树的穷尽法,来找寻更加直观的解释与答案。
我们把概率树的分枝,理解为某件事情的各种可能性,用文艺的方法描述,就是一切可能存在的n个平行宇宙。
例如我们扔一个骰子,假如六个面完全是一样的,结果只能有一个面朝上(排除单点立住的可能性)。那么,既然每个面朝上的可能性都是一样的,当某个面最终朝上,其它面朝上的可能性去哪里了?
我们可以这样设想:当骰子被随机扔出来时,就其未来状态而言,出现了6个平行宇宙。最终我们只观察到了其中的一个。
假如主持人不知道B门后面有没有汽车,那么他随机打开B门并发现是羊,只是关掉了B门后面是汽车的一连串平行世界;
假如主持人知道B门后面没有汽车,那么B门和C门后面有车的各自1/3、合计2/3有车可能性的平行世界,完全都在他的掌控下,他主动选择了关掉B门后面1/3有车可能性的平行世界,并将其概率赋予给了C门。
7、
我知道上面的描述不能令读者满意。对直觉上无法判断该问题,你我不必懊恼,当年有那么多科学家和数学家都在三门问题上卡壳。
我们也不必怀疑该题目。智商185的莎凡特,发动了1000多所学校采用“一试便知”的方法进行测试,实验结果显示在主持人知道汽车在哪儿的前提下,换门是正确的选择。
对于“3”中的三张卡片题目,我们也可以用连续赌博的方式,加以测试。
但是本文,我的兴趣不在于概率的基本计算方法,而是信息的“做功”。
我第一次看到“三门问题”时,一直卡在那儿绕不出来。我忘记在哪里看到的,但显然作者没有提及,主持人到底是否知道门的背后是否有车。这一点令我疑惑了很久。
即使知道了正确的答案,何权谋当我们试图将其与直觉建立起某些联系时,还是会遇到障碍:
如果说主持人引入额外的信息,那么,该额外信息到底是如何“做功”的?
做功是能量由一种形式转化为另一种的形式的过程。做功的两个必要因素:作用在物体上的力和物体在力的方向上通过的距离。
经典力学的定义是:当一个力作用在物体上,并使物体在力的方向上通过了一段距离,力学中就说这个力对物体做了功。
主持人知道信息,和不知道信息,其“做功”的差别是什么?
概率到底是客观存在的事物?还是主观想象的事物?
即:概率究竟存在于现实,还是存在于人的大脑?
当一个门后有汽车的概率是1/2时周才伟,是否如同薛定谔的猫?
根据量子力学的哥本哈根诠释,在实验进行一段时间后,猫会处于又活又死的叠加态。可是,假若实验者观察盒子内部,他会观察到一只活猫或一只死猫,而不是同时处于活状态与死状态的猫。这事实引起一个谜题:到底量子叠加是在什么时候终止,并且坍缩成两种可能状态中的一种状态神剑伏魔录?
8、
贝叶斯公式本身非常简单,但我们的直觉却很难直观地感受其运行的方式和力度。
尽管如此,据科学家研究,我们大脑的底层机制,可能就是依照贝叶斯定律设计的枸杞岛攻略。这也是为什么小孩子可以在非常有限的信息下,快速学会很多东西。
所以,大脑好玩儿的地方是宝胜国际,它会计算最复杂的那部分,而你自己并不知道。
我们感觉不到的“超级大脑”负责自动驾驶,我们能感觉到的“自我意识”负责貌美如花,乱干蠢事。
而且,尽管绝大多数个体都以一种低智商、自私、贪婪、愚昧的方式运行着,整个社会似乎又能体现出某种强大的计算性,就像人类那个看起来并不先进的、修修补补的大脑。
也许,我们的“意识”这部分,是在1000亿个神经元无意识的黑盒子般的计算基础之上涌现出来的什么东西。
正如社会或者是无意识的75亿人类个体聚合后的涌现结果。
其中,无论是否被感知,概率都在其中,被应用于核心算法天魔异种。
将光与电统一起来的伟大科学家麦克斯韦说:
当今的逻辑学只擅长于分析确定的、不可能的或完全不确定的事情,而这三类事情其实都没有分析的必要(谢天谢地)许茂山。因此,这个世界真正的逻辑在于概率计算过程,即一个理性者头脑中认为概率是多大,或应该多大。
一想到我们可以什么都不做正义无限,就能进行这个世界上最复杂的计算,并且在其庇护下自由自在地干蠢事,就觉得人类真是万物之灵,非上帝之子,怎会有如此幸运?
难道,概率就是上帝本人?
又或者如马斯克所说:
“我们只有十亿分之一的概率生活在现实世界中。”