update some chapter 2 pictures

2018-11-16 19:32:05 +08:00 · 2018-11-16 19:32:05 +08:00 · ce58ba039e
parent 701d764f2a
commit ce58ba039e
16 changed files with 9 additions and 7 deletions
--- a/.gitignore
+++ b/.gitignore
@ -1,2 +1,4 @@
- .ipynb_checkpoints
- .DS_Store
+.ipynb_checkpoints
+.DS_Store
+.gitignore
+*.ipynb
--- a/ch02_机器学习基础/img/ch2/2.1/1.jpg
+++ b/ch02_机器学习基础/img/ch2/2.1/1.jpg
--- a/ch02_机器学习基础/img/ch2/2.1/11.jpg
+++ b/ch02_机器学习基础/img/ch2/2.1/11.jpg
--- a/ch02_机器学习基础/img/ch2/2.1/2.jpg
+++ b/ch02_机器学习基础/img/ch2/2.1/2.jpg
--- a/ch02_机器学习基础/img/ch2/2.1/3.jpg
+++ b/ch02_机器学习基础/img/ch2/2.1/3.jpg
--- a/ch02_机器学习基础/img/ch2/2.1/3.png
+++ b/ch02_机器学习基础/img/ch2/2.1/3.png
--- a/ch02_机器学习基础/img/ch2/2.1/5.jpg
+++ b/ch02_机器学习基础/img/ch2/2.1/5.jpg
--- a/ch02_机器学习基础/img/ch2/2.1/7.jpg
+++ b/ch02_机器学习基础/img/ch2/2.1/7.jpg
--- a/ch02_机器学习基础/img/ch2/2.1/7.png
+++ b/ch02_机器学习基础/img/ch2/2.1/7.png
--- a/ch02_机器学习基础/img/ch2/2.16/1.jpg
+++ b/ch02_机器学习基础/img/ch2/2.16/1.jpg
--- a/ch02_机器学习基础/img/ch2/2.16/1.png
+++ b/ch02_机器学习基础/img/ch2/2.16/1.png
--- a/ch02_机器学习基础/img/ch2/2.16/2.jpg
+++ b/ch02_机器学习基础/img/ch2/2.16/2.jpg
--- a/ch02_机器学习基础/img/ch2/2.16/2.png
+++ b/ch02_机器学习基础/img/ch2/2.16/2.png
--- a/ch02_机器学习基础/img/ch2/2.18/1.jpg
+++ b/ch02_机器学习基础/img/ch2/2.18/1.jpg
--- a/ch02_机器学习基础/img/ch2/2.18/1.png
+++ b/ch02_机器学习基础/img/ch2/2.18/1.png
--- a/ch02_机器学习基础/第二章_机器学习基础.md
+++ b/ch02_机器学习基础/第二章_机器学习基础.md
@ -8,7 +8,7 @@

 |回归算法|基于实例的算法|正则化方法|
 |:-:|:-:|:-:|
-|![](./img/ch2/2.1/1.jpg)|![](./img/ch2/2.1/2.jpg)|![](./img/ch2/2.1/3.png)|
+|![](./img/ch2/2.1/1.jpg)|![](./img/ch2/2.1/2.jpg)|![](./img/ch2/2.1/3.jpg)|

 |决策树学习|贝叶斯方法|基于核的算法|
 |:-:|:-:|:-:|
@ -16,7 +16,7 @@

 |聚类算法|关联规则学习|人工神经网络|
 |:-:|:-:|:-:|
-|![](./img/ch2/2.1/7.png)|![](./img/ch2/2.1/8.jpg)|![](./img/ch2/2.1/9.png)|
+|![](./img/ch2/2.1/7.jpg)|![](./img/ch2/2.1/8.jpg)|![](./img/ch2/2.1/9.png)|

 |深度学习|降低维度算法|集成算法|
 |:-:|:-:|:-:|
@ -239,7 +239,7 @@ $$
 假设函数中有$A$和$B$两个参数，当参数发生变化时，假设函数状态也会随着变化。
 如下图所示

-![](./img/ch2/2.16/1.png)
+![](./img/ch2/2.16/1.jpg)

 想要你和图中的离散点，我们需要尽可能找到最优的$A$和$B$来使这条直线更能代表所有数据。如何找到最优解呢，这就需要使用代价函数来求解，以平方误差代价函数为例，假设函数为$h(x)=\theta_0x$。
 平方误差代价函数的主要思想
@ -253,7 +253,7 @@ $$
 **最优解即为代价函数的最小值**$\min J(\theta_0, \theta_1)$。如果是1个参数，代价函数一般通过二维曲线便可直观看出。如果是2个参数，代价函数通过三维图像可看出效果，参数越多，越复杂。
 当参数为2个时，代价函数是三维图像。

-![](./img/ch2/2.16/2.png)
+![](./img/ch2/2.16/2.jpg)

 ### 2.10.3 为什么代价函数要非负？
 目标函数存在一个下界，在优化过程当中，如果优化算法能够使目标函数不断减小，根据单调有界准则，这个优化算法就能证明是收敛有效的。
@ -278,7 +278,7 @@ $$\frac{\delta J}{\delta w}=(a-y)\delta'(z)x$$，$$\frac{\delta J}{\delta b}=(a-

 *注*：神经网络常用的激活函数为sigmoid函数，该函数的曲线如下所示：

-![](./img/ch2/2.18/1.png)
+![](./img/ch2/2.18/1.jpg)

 假设目标是收敛到1.0。0.82离目标比较远，梯度比较大，权值调整比较大。0.98离目标比较近，梯度比较小，权值调整比较小。调整方案合理。
 假如目标是收敛到0。0.82目标比较近，梯度比较大，权值调整比较大。0.98离目标比较远，梯度比较小，权值调整比较小。调整方案不合理。