每位数据科学家都应了解的 3 种距离2025年1月7日 | 阅读 4 分钟 在本教程中,我们将讨论一些数据科学家应该了解的距离。但在我们开始之前,让我们简要讨论一下什么是数据科学家。 什么是数据科学家?数据科学家是利用科学策略、技术、算法和结构从结构化和非结构化数据中提取记录和见解的专业人士。他们结合了多个学科的技能,包括数据、计算机技术知识和领域知识,以分析和解释复杂的数据系统。 角色和职责
数据科学家应了解的一些距离在下一节中,我们将讨论数据科学家应该了解的一些距离。这些距离通常用于各种应用程序和算法。以下列出了其中三种距离:
现在让我们详细讨论这些距离 公式 1:欧几里得距离欧几里得距离是最常见的距离度量,表示欧几里得空间中两点之间的直线距离。它源自勾股定理,并用于各种应用,包括聚类、分类和图像处理。 公式 d(p,q) = √∑ n i=1 (pi - qi)2 其中,p 和 q 是 n 维空间中的两个点,其中 ?=(?1,?2,?,??) ?=(?1,?2,?,??) 示例 输出 Euclidean Distance: 5.196152422706632 说明
公式 2:曼哈顿距离曼哈顿距离,也称为 L1 距离或出租车距离,是其笛卡尔坐标中绝对差值的总和。它通过仅沿着网格线移动来测量点之间的距离。 公式 对于两个点 p=(p1,p2,...,pn) 和 q=(q1,q2,...,qn),曼哈顿距离 d 由下式给出 d(p,q) = ∑n i=1 |pi - qi| 示例 输出 Manhattan Distance: 9 说明
公式 3:余弦相似度余弦相似度衡量内积空间中非零向量之间夹角的余弦值。它用于确定向量的相似度,忽略它们的幅度,通常用于文本分析和信息检索。 公式 对于两个向量 a 和 b,余弦相似度 sim 由下式给出 sim(a,b) = a⋅b / (∥a∥∥b∥) = (∑n i=1 ai bi) / (√ (∑n i=1 ai^2) √ (∑n i=1 bi^2)) 示例 输出 Cosine Similarity: 0.9746318461970762 说明
|
我们请求您订阅我们的新闻通讯以获取最新更新。