2.17.5 熵的概念以及理解 内容修订

2.17.5 熵的概念以及理解 内容修订
This commit is contained in:
CoderOverflow 2019-04-11 13:36:49 +08:00 committed by GitHub
parent c14a279892
commit dfecec6630
No known key found for this signature in database
GPG Key ID: 4AEE18F83AFDEB23
1 changed files with 2 additions and 3 deletions

View File

@ -1442,13 +1442,12 @@ $$
### 2.17.5 熵的概念以及理解 ### 2.17.5 熵的概念以及理解
熵:度量随机变量的不确定性。 熵:度量随机变量的不确定性。
定义假设随机变量X的可能取值有$x_{1},x_{2},...,x_{n}$,对于每一个可能的取值$x_{i}$,其概率为$P(X=x_{i})=p_{i},i=1,2...,n$。随机变量的熵为: 定义假设随机变量X的可能取值有$x_{1},x_{2},...,x_{n}$,对于每一个可能的取值$x_{i}$,其概率为$P(X=x_{i})=p_{i},i=1,2...,n$。随机变量的熵为:
$$ $$
H(X)=-\sum_{i=1}^{n}p_{i}log_{2}p_{i} H(X)=-\sum_{i=1}^{n}p_{i}log_{2}p_{i}
$$ $$
对于样本集合 假设样本有k个类别每个类别的概率为$\frac{|C_{k}|}{|D|}$,其中 ${|C_{k}|}{|D|}$为类别为k的样本个数,$|D|$为样本总数。样本集合D的熵为 对于样本集合假设样本有k个类别每个类别的概率为$\frac{|C_{k}|}{|D|}$,其中 ${|C_{k}|}{|D|}$为类别为k的样本个数$|D|$为样本总数。样本集合D的熵为
$$ $$
H(D)=-\sum_{k=1}^{k}\frac{|C_{k}|}{|D|}log_{2}\frac{|C_{k}|}{|D|} H(D)=-\sum_{k=1}^{k}\frac{|C_{k}|}{|D|}log_{2}\frac{|C_{k}|}{|D|}
$$ $$