什么是多维标度分析?2025年4月26日 | 阅读 9 分钟 多维标度分析(MDS)是一种统计方法,用于可视化一组对象之间的相似性或不相似性的程度。它将数据点之间的成对距离转换到低维空间,通常是二维或三维,从而更容易发现模式、聚类和关系。 理解概念多维标度分析(MDS)基于数据点可以表示为几何空间中的对象这一概念,其中它们之间的距离对应于它们的相似性或不相似性。该技术对于没有自然坐标表示的数据特别有用,例如主观评分、偏好或定性关系。 MDS 的工作原理MDS 的第一步是以不相似性矩阵的形式收集输入数据。该矩阵表示对象之间感知到的距离,这些距离可以是测量值(例如地理距离)或抽象关系(例如调查中的相似性分数)。输入数据越准确,MDS 可视化对底层关系的表示就越好。 接下来,用户必须选择投影的维度数。通常使用二维或三维空间以便于可视化,但更高维度可以更准确地保留距离。然而,解释更高维度的输出变得更具挑战性,因此对于实际应用来说,低维表示更受青睐。 然后,MDS 算法处理不相似性数据,并尝试在所选维度中为每个对象分配坐标。目标是最小化一个应变函数,该函数测量原始不相似性与低维空间中距离之间的差异。较低的应变值表示更准确的表示。 为了获得最佳匹配,MDS 使用迭代优化技术(例如梯度下降)来调整对象的位置。算法不断完善空间配置,直到找到能够保留原始关系的最佳拟合。此步骤在计算上很密集,尤其对于大型数据集,但它确保最终的可视化尽可能准确地反映数据的真实结构。 处理完成后,最终输出是一个空间地图,其中相似性更高(根据输入数据)的对象放置得更近,而差异较大的对象放置得更远。这种可视化有助于识别聚类、发现隐藏的模式并理解复杂的关系。 多维标度分析的类型多维标度分析(MDS)可以根据其处理不相似性数据的方式和用于可视化的数学方法进行分类。MDS 的两种主要类型是度量 MDS 和非度量 MDS,它们根据数据的性质服务于不同的目的。 度量 MDS(经典 MDS) 度量 MDS,也称为经典 MDS,假定对象之间的给定不相似性是数值距离,应在低维空间中尽可能精确地保留。此方法基于特征值分解,并依赖于保留不相似性的实际幅度。 度量 MDS 的主要特点
非度量 MDS 非度量 MDS 更具灵活性,当输入数据包含排序关系而非精确数值距离时使用。该方法不保留精确距离,而是保留对象之间相似性或不相似性的顺序。当处理主观的、有序的数据(例如客户偏好或心理感知)时,它特别有用。 非度量 MDS 的主要特点
个体差异标度 (INDSCAL) 个体差异标度 (INDSCAL) 是 MDS 的一种扩展,它考虑了数据集中内的多个视角。当分析从不同个人或群体收集的数据时,它非常有用,并且旨在在考虑感知差异的同时找到共同的潜在结构。 INDSCAL 的主要特点
广义多维标度分析 (GMDS) 广义 MDS 将传统 MDS 技术扩展到非欧几里得空间,这意味着它可以处理不符合标准几何假设的数据。这在分析复杂结构、曲面或高维生物数据时非常有用。 GMDS 的主要特点
多维标度分析的步骤多维标度分析(MDS)遵循一个依赖过程,将不相似性矩阵转换为低维空间中对象的空间表示。此过程有助于可视化数据中的关系和模式。MDS 的关键步骤如下: 1. 收集和准备不相似性矩阵 MDS 的第一步是获取不相似性矩阵,它表示对象之间的成对距离或不相似性。这些值可以来自测量距离(例如,城市之间)或感知差异(例如,调查中的相似性评分)。该矩阵通常是方形且对称的,其中对角线值为零(表示对象本身之间没有距离)。 2. 选择维度数 在应用 MDS 之前,用户必须决定最终表示的维度数(通常是二维或三维)。虽然更高的维度可以提供更准确的距离表示,但为了便于可视化和解释,通常更喜欢较低的维度。 3. 应用 MDS 算法 MDS 试图将对象放置在所选的维度数内,同时保留原始距离关系。该算法
4. 计算应变值并优化 应变函数衡量低维空间中的距离与原始不相似性之间的匹配程度。较低的应变值表示更高的匹配度。该过程将继续进行,直到应变最小化,从而确保最终的空间配置。如果应变过高,增加维度数可能会提高准确性。 5. 可视化和解释结果 优化完成后,将绘制最终的空间表示。相似性更高(基于输入的不相似性)的对象彼此靠近,而相似性较低的对象放置得更远。可视化有助于识别数据中的聚类、趋势和模式。 6. 验证 MDS 解 获得最终的 MDS 配置后,通过以下方式验证其准确性非常重要:
多维标度分析的应用多维标度分析(MDS)广泛应用于各个领域,用于分析和可视化数据中的复杂关系。通过将相似性或不相似性数据转换为几何表示,MDS 帮助研究人员和分析师发现模式、检测聚类并获得见解。MDS 的一些关键应用包括: 市场研究和消费者行为 MDS 在市场研究中广泛用于了解客户感知和品牌定位。
例如,MDS 可以生成一张感知图,显示智能手机品牌在客户心目中高度相关,而另一个品牌则被视为完全不同。 心理学和社会科学 在心理学和社会科学中,MDS 帮助研究人员研究感知和认知过程。
例如,MDS 可用于可视化人们如何根据感知到的相似性对幸福、悲伤和愤怒等不同情绪进行分组。 生物信息学和遗传学 MDS 通常在生物信息学中用于分析遗传相似性和进化关系。
例如,MDS 可以帮助可视化不同物种基于遗传数据的亲缘关系,从而支持进化生物学研究。 机器学习和数据科学 MDS 用于机器学习和数据科学中的降维和数据可视化。
例如,MDS 可以帮助表示电子商务中的客户购买模式,使公司能够更有效地对目标受众进行细分。 医疗保健和医学研究 MDS 在分析和可视化患者数据和疾病模式方面在医疗保健领域发挥着至关重要的作用。
例如,MDS 可以帮助识别具有相似症状的患者亚组,从而实现更有针对性的治疗。 语言学和文本分析
例如,MDS 可用于可视化不同语言如何基于单词相似性相关联。 政治学和社会学 MDS 用于政治学和社会学以分析意识形态相似性和群体行为。
例如,MDS 可以可视化选民如何从意识形态的角度看待政治候选人,从而帮助策略师定制竞选信息。 优点和局限性优点
局限性
结论多维标度分析是可视化和理解数据中复杂关系的一种强大工具。通过将高维相似性数据转换为可解释的格式,MDS 使研究人员和分析师能够提取有意义的见解并做出明智的决策。无论是在心理学、营销还是数据科学领域,MDS 仍然是有效探索模式和趋势的宝贵技术。 下一主题Keras 教程 |
我们请求您订阅我们的新闻通讯以获取最新更新。