githik999 / TacitKnowldgeReadingNote

暗知识:机器认知如何颠覆商业和社会
GNU General Public License v3.0
0 stars 0 forks source link

2.1贝叶斯学派——机器从结果推出原因的概率 #3

Open githik999 opened 2 years ago

githik999 commented 2 years ago

符号学派认为有因必有果,有果必有因。贝叶斯学派问,因发生果一定发生吗?感冒是发烧的原因之一,但感冒不一定都发烧。贝叶斯学派承 认因果,但认为因果之间的联系是不确定的,只是一个概率。 我们的经验中比较熟悉的是当一个原因发生时结果出现的概率,例如你感冒后会发烧的概率,但我们的直觉不太会把握逆概率,即知道结果要 求推出原因的概率,也就是要判断发烧是感冒引起的概率。贝叶斯定理就是教我们怎么算这样的概率

所以贝叶斯定理告诉我们的基本道理是:一个结果可能由很多原因造成,要知道一个结果是由哪个原 因造成的,一定要先知道这个原因在所有原因中的占比。

一个结果可能有很多个原因.

有什么例子可以举例.什么情况下.一个结果.可能是很多个原因.多种原因.造成的这个结果.

比如一条路不通.有可能是中间的桥断开了.有可能是中间被某个大石头堵住了.

电脑无法开机.有可能是内存有问题.有可能是cpu有问题.有可能是主板有问题.有可能是硬盘有问题.

这里每一个概率都比较容易得到。这在机器学习里叫作“朴素贝叶斯分类器”。这个分类器广泛应用于垃圾邮件的过滤。我们知道垃圾邮件往往 会有“免费、中奖、伟哥、发财”这类词汇,这类词汇就相当于感冒会出现的症状,垃圾邮件就相当于感冒。过滤垃圾邮件变成了判断在出现这些词 汇的情况下这封邮件是垃圾邮件的概率,也就是通过统计P(出现“免费”|垃圾邮件),P(出现“中奖”|垃圾邮件)等的概率,来算出P(垃圾邮件| 出现“免费、中奖、伟哥、发财”……)的概率。

githik999 commented 2 years ago

如果一封邮件里面有免费字眼.那么这封邮件是垃圾邮件的概率有多大.

这个时候就需要大量的数据和统计.

githik999 commented 2 years ago

因为它是通过采集大量数据统计出每个单词和它们分别对应的发音的频率来判断一个发音是什么单词 的。这些数据越多,判断的准确性就越高。 在这个例子里,“知识”是知道当一个结果发生时是哪个原因造成的。这个知识被清晰地表达为一个条件概率。机器通过统计每种原因的占比来 算出从结果到原因的概率。

githik999 commented 2 years ago

我们生活中很多经验来自类比。医生一看病人的面部表情和走路姿势就基本能判断出是普通感冒还是流感,因为流感症状比感冒厉害得多。

第一,两个东西的某些属性相同,它俩就是类似的;第二,如果它们的已知属性相同,那么它们的未知属性也会相同。开好车上班的人 可能也会用苹果手机,喜欢看《星球大战》(Star?Wars)的人可能也会喜欢看《三体》等。类比的逻辑可以明确表达,但具体的类比常常是默知 识。例如老警察一眼就能看出谁是小偷,但不一定说得清楚原因。

githik999 commented 2 years ago

所以这是一种直觉吗.直觉往往可能就是我们身体内的机器学习在起作用.

githik999 commented 2 years ago

在类推学派中,第一件事是要定义“相似度”。相似度可以是身高、收入等连续变量,也可以是买了某一类书的次数的统计变量,也可以是性别 这样的离散变量。总之,只有定义了相似度,才能度量一个分类方法是否最优。人可以感受相似度,但无论是人的感官还是大脑都无法量化相似度 。人类在做相似度比较时,甚至都不知道自己在比较哪些特征和属性,但机器可以很容易量化这些相似度。所以只要机器抓准了特征和属性,比人 的判断还准。

githik999 commented 2 years ago

前两位的主要贡献是发现了人类视觉系统的信息处理采用分级方式,即在人类的大脑皮质 上有多个视觉功能区域,从低级至高级分别标定为V1~V5等区域,低级区域的输出作为高级区域的输入。人类的视觉系统从视网膜(Retina)出发,经过低级的V1区提取边缘特征,到V2区的基 本形状或目标的局部,再到高层V4的整个目标(例如判定为一张人脸),以及到更高层进行分类判断等。也就是说高层的特征是低层特征的组合,从低层到高层的特征表达越来越抽象和概念化。 至此,人们了解到大脑是一个多层深度架构,其认知过程也是连续的。

githik999 commented 2 years ago

1、光线进入眼睛

2、眼睛把光线携带的信息转化成电信号,传给大脑

3、大脑对视觉信号进行处理,变成视觉体验,并影响人的行为和思想

githik999 commented 2 years ago

1、 光(本质是电磁波)携带着外部世界的结构信息,经过一系列折光系统(如晶状体、玻璃体等),投射在眼球底部的视网膜上。

2、 视网膜上的光感受器细胞,将光信号转换为电信号(光电转换),传递给视网膜的其他细胞(比如双极细胞、水平细胞、无长突细胞等),进行初步的信息整合加工。

githik999 commented 2 years ago

人类的视觉系统.是提取.过滤的.

githik999 commented 2 years ago

视觉信息进入大脑后,先进入位于丘脑的一个小小的核团——外侧膝状体。在那里,视觉信息被进一步整合加工,关键的视觉信息被提取出来,无用的信息被舍弃或扣留在低级脑区。经过加工后的关键视觉信息,通过名为“视放射”的神经纤维束,传递到初级视觉皮层。

githik999 commented 2 years ago

5、 初级视觉皮层进一步提取视觉信息中的关键特征(比如朝向信息、运动信息、色彩信息等),向高级的视觉皮层传递。

6、 高级视觉皮层有好多个区域,它们各司其职,有的专门负责检测运动,有的专门负责检测形状,有的专门负责识别人脸……它们通过等级森严的协同分工,共同完成了对视觉信号的处理,并将最终结果传递给其他脑区,从而影响人的行为和思想。

githik999 commented 2 years ago

在介绍循环神经网络之前,我们先看个例子。譬如我们在下面的句子里猜词填空:“我是广东人,会讲_____话。”在这里如果我们没有看到第一句“我是广东人”就很难填空。这就是一个典型的 根据前面出现的信息对后面可能会出现的信息的预测。循环神经网络就特别适合处理这类问题。这个网络有两个特点,分别对应时间序列信息的两个特点:一是输入端可以接收连续的输入,二是 可以记住信息的先后顺序。