Update 第二章_机器学习基础.md

This commit is contained in:
youngxiao 2019-07-08 14:30:59 +08:00 committed by GitHub
parent 004804b0be
commit c58ead6204
No known key found for this signature in database
GPG Key ID: 4AEE18F83AFDEB23
1 changed files with 11 additions and 100 deletions

View File

@ -28,7 +28,7 @@
**神经网络架构**
图2-1就是一个神经网络系统它由很多层组成。输入层负责接收信息比如一只猫的图片。输出层是计算机对这个输入信息的判断结果它是不是猫。隐藏层就是对输入信息的传递和加工处理。
![图2-2 神经网络系统](E:/DeepLearning-500-questions/ch02_%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0%E5%9F%BA%E7%A1%80/img/ch2/2.5.1.png)
![图2-2 神经网络系统](./img/ch2/2.5.1.png)
图2-1 神经网络系统
@ -236,21 +236,21 @@ $$
可解释性:分类器的预测标准的可理解性,像决策树产生的规则就是很容易理解的,而神经网络的一堆参数就不好理解,我们只好把它看成一个黑盒子。
8) 精度和召回率反映了分类器分类性能的两个方面。如果综合考虑查准率与查全率可以得到新的评价指标F1-score也称为综合分类率$F1=\frac{2 \times precision \times recall}{precision + recall}$。
为了综合多个类别的分类情况评测系统整体性能经常采用的还有微平均F1micro-averaging和宏平均F1macro-averaging )两种指标。
1宏平均F1与微平均F1是以两种不同的平均方式求的全局F1指标。
2宏平均F1的计算方法先对每个类别单独计算F1值再取这些F1值的算术平均值作为全局指标。
3微平均F1的计算方法是先累加计算各个类别的a、b、c、d的值再由这些值求出F1值。
4由两种平均F1的计算方式不难看出宏平均F1平等对待每一个类别所以它的值主要受到稀有类别的影响而微平均F1平等考虑文档集中的每一个文档所以它的值受到常见类别的影响比较大。
为了综合多个类别的分类情况评测系统整体性能经常采用的还有微平均F1micro-averaging和宏平均F1macro-averaging )两种指标。
1宏平均F1与微平均F1是以两种不同的平均方式求的全局F1指标。
2宏平均F1的计算方法先对每个类别单独计算F1值再取这些F1值的算术平均值作为全局指标。
3微平均F1的计算方法是先累加计算各个类别的a、b、c、d的值再由这些值求出F1值。
4由两种平均F1的计算方式不难看出宏平均F1平等对待每一个类别所以它的值主要受到稀有类别的影响而微平均F1平等考虑文档集中的每一个文档所以它的值受到常见类别的影响比较大。
- **ROC曲线和PR曲线**
如图2-3ROC曲线是Receiver Operating Characteristic Curve受试者工作特征曲线的简称是以灵敏度真阳性率为纵坐标以1减去特异性假阳性率为横坐标绘制的性能评价曲线。可以将不同模型对同一数据集的ROC曲线绘制在同一笛卡尔坐标系中ROC曲线越靠近左上角说明其对应模型越可靠。也可以通过ROC曲线下面的面积Area Under Curve, AUC来评价模型AUC越大模型越可靠。
如图2-3ROC曲线是Receiver Operating Characteristic Curve受试者工作特征曲线的简称是以灵敏度真阳性率为纵坐标以1减去特异性假阳性率为横坐标绘制的性能评价曲线。可以将不同模型对同一数据集的ROC曲线绘制在同一笛卡尔坐标系中ROC曲线越靠近左上角说明其对应模型越可靠。也可以通过ROC曲线下面的面积Area Under Curve, AUC来评价模型AUC越大模型越可靠。
![](./img/ch2/2.7.3.png)
@ -2300,92 +2300,3 @@ $$
[15] Breiman L. Random forests[J]. Machine learning, 2001, 45(1): 5-32.