diff --git a/Day71-80/71.人工智能和机器学习概述.md b/Day71-80/71.人工智能和机器学习概述.md index 12ee4e5..3241f6f 100644 --- a/Day71-80/71.人工智能和机器学习概述.md +++ b/Day71-80/71.人工智能和机器学习概述.md @@ -119,5 +119,12 @@ $$ 5. 测试算法 6. 应用算法 -### +### Scikit-learn介绍 +![](res/scikit-learn-logo.png) + +Scikit-learn源于Google Summer of Code项目,由David Cournapeau在2007年发起,它提供了机器学习可能用到的工具,包括数据预处理、监督学习(分类、回归)、非监督学习(聚类)、模型选择、降维等。 + +官网地址: + +安装方法:`pip install scikit-learn` \ No newline at end of file diff --git a/Day71-80/72.k最近邻分类.md b/Day71-80/72.k最近邻分类.md index d880d22..b609070 100644 --- a/Day71-80/72.k最近邻分类.md +++ b/Day71-80/72.k最近邻分类.md @@ -20,3 +20,20 @@ k值的选择对于kNN算法的结果有非常显著的影响。下面用李航 实际应用中,$k$的取值通常都比较小,可以通过交叉检验的方式来选择较好的$k$值。 + + +### 算法优缺点 + +优点: + +1. 简单有效 +2. 重新训练代价低 +3. 适合类域交叉样本 +4. 适合大样本分类 + +缺点: + +1. 惰性学习 +2. 输出的可解释性不强 +3. 不擅长处理不均衡样本 +4. 计算量比较大 \ No newline at end of file diff --git a/Day71-80/res/scikit-learn-logo.png b/Day71-80/res/scikit-learn-logo.png new file mode 100644 index 0000000..ce1e105 Binary files /dev/null and b/Day71-80/res/scikit-learn-logo.png differ diff --git a/README.md b/README.md index 967336e..7233596 100644 --- a/README.md +++ b/README.md @@ -377,7 +377,7 @@ Python在以下领域都有用武之地。 #### Day80 - [推荐系统实战](./Day71-90/80.推荐系统实战.md) -### Day81~90 - 大数据分析实战 +### Day81~90 - [大数据分析实战](./Day81-90) ### Day91~100 - [团队项目开发](./Day91-100)