更新了机器学习部分文档

This commit is contained in:
jackfrued 2024-12-28 09:35:56 +08:00
parent ebd23d6d20
commit 441047213c
1 changed files with 2 additions and 2 deletions

View File

@ -1,6 +1,6 @@
## k最近邻算法
k 最近邻算法kNN是一种用于分类和回归的非参数统计方法由美国统计学家伊芙琳·费克斯和小约瑟夫·霍奇斯于 1951 年提出。kNN 算法的原理是从历史数据中找到$\small{k}$个跟新输入实例最邻近的实例,根据它们中的多数所属的类别来对新实例进行分类或者输出新实例的属性这种算法我们在前面已经为大家做了简单的展示。与主流的机器学习算法不同k 最近邻算法没有显式的学习训练过程它用的是“近朱者赤近墨者黑”这样一种简单朴素的思想来实现分类或回归。k 最近邻算法有两个关键问题,第一个是$\small{k}$值如何选择,即用多少个最近邻来判定新实例所属的类别;第二个是如何判定两个实例是近还是远,这里就涉及到度量距离的问题。
k 最近邻算法kNN是一种用于分类和回归的非参数统计方法由美国统计学家伊芙琳·费克斯和小约瑟夫·霍奇斯于 1951 年提出。kNN 算法的原理是从历史数据中找到$\small{k}$个跟新输入实例最邻近的实例,根据它们中的多数所属的类别来对新实例进行分类或者输出新实例的目标这种算法我们在前面已经为大家做了简单的展示。与主流的机器学习算法不同k 最近邻算法没有显式的学习训练过程它用的是“近朱者赤近墨者黑”这样一种简单朴素的思想来实现分类或回归。k 最近邻算法有两个关键问题,第一个是$\small{k}$值如何选择,即用多少个最近邻来判定新实例所属的类别或确定其目标值;第二个是如何判定两个实例是近还是远,这里就涉及到度量距离的问题。
### 距离的度量
@ -268,7 +268,7 @@ model.score(X_test, y_test)
6. **ROC****AUC**
- ROCReceiver Operating Characteristic Curve绘制了召回率与假正例率的关系如下图所示。
- **ROC**Receiver Operating Characteristic Curve绘制了召回率与假正例率的关系如下图所示。
<img src="res/02_ROC_curve.png" style="zoom:38%;">