From fb0b0e4ccda5be2f1e6e9a7ffe75795c68527808 Mon Sep 17 00:00:00 2001 From: jackfrued Date: Thu, 13 Feb 2025 15:50:31 +0800 Subject: [PATCH] =?UTF-8?q?=E4=BF=AE=E6=AD=A3=E4=BA=86=E9=83=A8=E5=88=86?= =?UTF-8?q?=E6=96=87=E6=A1=A3=E4=B8=AD=E7=9A=84=E7=AC=94=E8=AF=AF?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- Day21-30/30.正则表达式的应用.md | 2 +- Day46-60/47.深入模型.md | 5 ++--- Day66-80/66.数据分析概述.md | 2 +- Day81-90/82.k最近邻算法.md | 4 ++-- 4 files changed, 6 insertions(+), 7 deletions(-) diff --git a/Day21-30/30.正则表达式的应用.md b/Day21-30/30.正则表达式的应用.md index 719ee9a..be53309 100755 --- a/Day21-30/30.正则表达式的应用.md +++ b/Day21-30/30.正则表达式的应用.md @@ -108,7 +108,7 @@ import re # 创建正则表达式对象,使用了前瞻和回顾来保证手机号前后不应该再出现数字 pattern = re.compile(r'(?<=\D)1[34578]\d{9}(?=\D)') sentence = '''重要的事情说8130123456789遍,我的手机号是13512346789这个靓号, -不是15600998765,也是110或119,王大锤的手机号才是15600998765。''' +不是15600998765,也不是110或119,王大锤的手机号才是15600998765。''' # 方法一:查找所有匹配并保存到一个列表中 tels_list = re.findall(pattern, sentence) for tel in tels_list: diff --git a/Day46-60/47.深入模型.md b/Day46-60/47.深入模型.md index dc9b86b..db2c62c 100755 --- a/Day46-60/47.深入模型.md +++ b/Day46-60/47.深入模型.md @@ -192,7 +192,7 @@ subject.save() 1. 查询所有对象。 ```Shell -Subjects.objects.all() +Subject.objects.all() ``` 2. 过滤数据。 @@ -334,7 +334,7 @@ Teacher.objects.filter(subject__name__contains='全栈') ```Python from django.contrib import admin - + from polls.models import Subject, Teacher @@ -678,4 +678,3 @@ Django模型字段类 8. `search`:基于全文索引的全文检索(一般很少使用) 9. `regex` / `iregex`:基于正则表达式的模糊匹配查询 - diff --git a/Day66-80/66.数据分析概述.md b/Day66-80/66.数据分析概述.md index 3af9e25..7ea14f1 100755 --- a/Day66-80/66.数据分析概述.md +++ b/Day66-80/66.数据分析概述.md @@ -28,7 +28,7 @@ HR在发布招聘需求时,通常将数据工程、数据分析、数据挖掘 ### 数据分析的流程 -我们提到数分析这个词很多时候可能指的都是**狭义的数据分析**,这类数据分析主要目标就是生成可视化报表并通过这些报表来洞察业务中的问题,这类工作一般都是具有滞后性的。**广义的数据分析**还包含了数据挖掘的部分,不仅要通过数据实现对业务的监控和分析,还要利用机器学习算法,找出隐藏在数据背后的知识,并利用这些知识为将来的决策提供支撑,具备一定的前瞻性。 +我们提到数据分析这个词很多时候可能指的都是**狭义的数据分析**,这类数据分析主要目标就是生成可视化报表并通过这些报表来洞察业务中的问题,这类工作一般都是具有滞后性的。**广义的数据分析**还包含了数据挖掘的部分,不仅要通过数据实现对业务的监控和分析,还要利用机器学习算法,找出隐藏在数据背后的知识,并利用这些知识为将来的决策提供支撑,具备一定的前瞻性。 基本的数据分析工作一般包含以下几个方面的内容,当然因为行业和工作内容的不同会略有差异。 diff --git a/Day81-90/82.k最近邻算法.md b/Day81-90/82.k最近邻算法.md index 3081d2d..ceb73b5 100644 --- a/Day81-90/82.k最近邻算法.md +++ b/Day81-90/82.k最近邻算法.md @@ -4,9 +4,9 @@ k 最近邻算法(kNN)是一种用于分类和回归的非参数统计方法 ### 距离的度量 -我们可以用距离(distance)来衡量特征空间中两个实例之间的相似度,常用的距离度量包括闵氏距离、马氏距离、余弦距离、编辑距离等。闵氏距离全称闵可夫斯基距离(Minkowski Distance),对于两个 $\small{n}$ 维向量 $\small{\bold{x}=(x_{1}, x_{2}, \cdots, x_{n})}$ 和 $\small{\bold{y}=(y_{1}, y_{2}, \cdots, y_{n})}$ ,它们之间的距离可以定义为: +我们可以用距离(distance)来衡量特征空间中两个实例之间的相似度,常用的距离度量包括闵氏距离、马氏距离、余弦距离、编辑距离等。闵氏距离全称闵可夫斯基距离(Minkowski Distance),对于两个 $\small{n}$ 维向量 $\small{\mathbf{x}=(x_{1}, x_{2}, \cdots, x_{n})}$ 和 $\small{\mathbf{y}=(y_{1}, y_{2}, \cdots, y_{n})}$ ,它们之间的距离可以定义为: $$ -d(\bold{x}, \bold{y}) = (\sum_{i=1}^{n}{|x_{i} - y_{i}|}^{p})^{\frac{1}{p}} +d(\mathbf{x}, \mathbf{y}) = (\sum_{i=1}^{n}{|x_{i} - y_{i}|}^{p})^{\frac{1}{p}} $$ 其中, $\small{p \ge 1}$ ,虽然 $\small{p \lt 1}$ 可以计算,但不再严格满足距离的定义,通常不被视为真正的距离。