修正1.13.3、1.13.4、1.13.5和1.18的内容
This commit is contained in:
parent
5a95660876
commit
21c402d7eb
|
|
@ -7,7 +7,7 @@
|
|||
一个标量表示一个单独的数,它不同于线性代数中研究的其他大部分对象(通常是多个数的数组)。我们用斜体表示标量。标量通常被赋予小写的变量名称。
|
||||
|
||||
**向量(vector)**
|
||||
一个向量表示一组有序排列的数。通过次序中的索引,我们可以确定每个单独的数。通常我们赋予向量粗体的小写变量名称,比如xx。向量中的元素可以通过带脚标的斜体表示。向量$X$的第一个元素是$X_1$,第二个元素是$X_2$,以此类推。我们也会注明存储在向量中的元素的类型(实数、虚数等)。
|
||||
一个向量表示一组有序排列的数。通过次序中的索引,我们可以确定每个单独的数。通常我们赋予向量粗体的小写变量名称,比如xx。向量中的元素可以通过带脚标的斜体表示。向量$X$的第一个元素是$X_1$,第二个元素是$X_2$,以此类推。我们也会注明存储在向量中的元素的类型(实数、虚数等)。
|
||||
|
||||
**矩阵(matrix)**
|
||||
矩阵是具有相同特征和纬度的对象的集合,表现为一张二维数据表。其意义是一个对象表示为矩阵中的一行,一个特征表示为矩阵中的一列,每个特征都有数值型的取值。通常会赋予矩阵粗体的大写变量名称,比如$A$。
|
||||
|
|
@ -332,9 +332,9 @@ $$
|
|||
2. 正态分布是具有相同方差的所有概率分布中, 不确定性最大的分布, 换句话说, 正态分布是对模型加入先验知识最少的分布.
|
||||
|
||||
正态分布的推广:
|
||||
正态分布可以推广到$R^n$空间, 此时称为**多位正态分布**, 其参数是一个正定对称矩阵$\sum$:
|
||||
正态分布可以推广到$R^n$空间, 此时称为**多位正态分布**, 其参数是一个正定对称矩阵$\Sigma$:
|
||||
$$
|
||||
N(x;\vec\mu,\sum)=\sqrt{\frac{1}{2\pi^ndet(\sum)}}exp\left(-\frac{1}{2}(\vec{x}-\vec{\mu})^T\sum^-1(\vec{x}-\vec{\mu})\right)
|
||||
N(x;\vec\mu,\Sigma)=\sqrt{\frac{1}{(2\pi)^ndet(\Sigma)}}exp\left(-\frac{1}{2}(\vec{x}-\vec{\mu})^T\Sigma^{-1}(\vec{x}-\vec{\mu})\right)
|
||||
$$
|
||||
对多为正态分布概率密度高效求值:
|
||||
$$
|
||||
|
|
@ -344,11 +344,11 @@ $$
|
|||
|
||||
### 1.13.4 指数分布
|
||||
|
||||
深度学习中, 指数分布用来描述在$x=0$点出取得边界点的分布, 指数分布定义如下:
|
||||
深度学习中, 指数分布用来描述在$x=0$点处取得边界点的分布, 指数分布定义如下:
|
||||
$$
|
||||
p(x;\lambda)=\lambda1_{x\geq 0}exp(-\lambda{x})
|
||||
p(x;\lambda)=\lambda I_{x\geq 0}exp(-\lambda{x})
|
||||
$$
|
||||
指数分布用指示函数$I_{x>=0}$来使$x$取负值时的概率为零。
|
||||
指数分布用指示函数$I_{x\geq 0}$来使$x$取负值时的概率为零。
|
||||
|
||||
### 1.13.5 Laplace 分布
|
||||
|
||||
|
|
@ -382,16 +382,16 @@ $$
|
|||
条件概率公式如下:
|
||||
|
||||
$$
|
||||
P(A/B) = P(A\cap B) / P(B)
|
||||
P(A|B) = P(A\cap B) / P(B)
|
||||
$$
|
||||
|
||||
说明:在同一个样本空间$\Omega$中的事件或者子集$A$与$B$,如果随机从$\Omega$中选出的一个元素属于$B$,那么下一个随机选择的元素属于$A$ 的概率就定义为在$B$的前提下$A$的条件概率。
|
||||
说明:在同一个样本空间$\Omega$中的事件或者子集$A$与$B$,如果随机从$\Omega$中选出的一个元素属于$B$,那么下一个随机选择的元素属于$A$ 的概率就定义为在$B$的前提下$A$的条件概率。
|
||||

|
||||
|
||||
根据文氏图,可以很清楚地看到在事件B发生的情况下,事件A发生的概率就是$P(A\bigcap B)$除以$P(B)$。
|
||||
举例:一对夫妻有两个小孩,已知其中一个是女孩,则另一个是女孩子的概率是多少?(面试、笔试都碰到过)
|
||||
**穷举法**:已知其中一个是女孩,那么样本空间为男女,女女,女男,则另外一个仍然是女生的概率就是1/3。
|
||||
**条件概率法**:$P(女|女)=P(女女)/P(女)$,夫妻有两个小孩,那么它的样本空间为女女,男女,女男,男男,则$P(女女)$为1/4,$P(女)= 1-P(男男)=3/4$,所以最后$1/3$。
|
||||
**条件概率法**:$P(女|女)=P(女女)/P(女)$,夫妻有两个小孩,那么它的样本空间为女女,男女,女男,男男,则$P(女女)$为1/4,$P(女)= 1-P(男男)=3/4$,所以最后$1/3$。
|
||||
这里大家可能会误解,男女和女男是同一种情况,但实际上类似姐弟和兄妹是不同情况。
|
||||
|
||||
## 1.15 联合概率与边缘概率联系区别?
|
||||
|
|
@ -404,8 +404,7 @@ $$
|
|||
|
||||
## 1.16 条件概率的链式法则
|
||||
由条件概率的定义,可直接得出下面的乘法公式:
|
||||
乘法公式 设$A, B$是两个事件,并且$P(A) > 0$, 则有
|
||||
|
||||
乘法公式 设$A, B$是两个事件,并且$P(A) > 0$, 则有
|
||||
$$
|
||||
P(AB) = P(B|A)P(A)
|
||||
$$
|
||||
|
|
@ -515,7 +514,7 @@ Corr(x,y) = \frac{Cov(x,y)}{\sqrt{Var(x)Var(y)}}
|
|||
$$
|
||||
|
||||
> 相关系数的性质:
|
||||
> 1)有界性。相关系数的取值范围是 ,可以看成无量纲的协方差。
|
||||
> 1)有界性。相关系数的取值范围是 [-1,1],可以看成无量纲的协方差。
|
||||
> 2)值越接近1,说明两个变量正相关性(线性)越强。越接近-1,说明负相关性越强,当为0时,表示两个变量没有相关性。
|
||||
|
||||
|
||||
|
|
|
|||
Loading…
Reference in New Issue