用于推荐系统的矩阵分解

2025年2月3日 | 阅读 4 分钟

为了从用户-项目交互数据中提取潜在特征，推荐系统经常采用强大的矩阵分解方法。当用于协同过滤时，这种方法效果特别好，因为它根据从用户偏好和行为中识别出的模式提供建议。矩阵分解算法处理大型、稀疏数据集并生成高质量建议的能力使其越来越受欢迎。

矩阵分解过程涉及将一个大矩阵分解为两个较小的矩阵，通常其中一个反映用户-项目交互。在推荐系统的上下文中，原始矩阵 (R) 由表示用户的行和表示项目的列组成。行和列的值表示用户对项目的评分或交互。由于用户行为的性质，这个矩阵通常是稀疏的——即，其大多数条目要么缺失要么为零。

矩阵分解的工作原理

数据表示： 描述用户-项目交互的大型矩阵是矩阵分解的核心组成部分。该矩阵中的每个单元格都代表用户对项目的评分或交互，而行代表个人，列代表项目。由于用户通常只与可访问产品的一小部分进行交互，因此该矩阵通常是稀疏的，这意味着其大多数条目要么为零，要么缺失。
分解矩阵： 这种稀疏的用户-项目矩阵旨在通过矩阵分解将其分解为两个较小的矩阵，即用户矩阵和项目矩阵。在用户矩阵中，每个用户都由一个向量表示，在项目矩阵中，每个项目都由一个向量表示。这些向量有时被称为潜在因子，代表影响交互和偏好的人和事物的基本特征。
发现隐藏元素： 为了使用户和项目向量结合时尽可能接近原始交互值，这些潜在组件的值必须在分解过程中学习。在这个学习过程中，通常采用迭代优化方法，通过调整潜在组件的值来减少数据集中预期交互与实际交互之间的差异。
形成假设： 学习潜在变量后，可以使用它们预测原始用户-项目矩阵中缺失的元素。例如，系统将用户的潜在因子向量与对象的潜在因子向量结合起来，以预测用户将如何评估他们尚未与之交互的项目。由此产生的值给出了用户可能对该项目的评分或参与度的估计。
提出建议： 根据这些估计值提出建议是最后一步。该算法为每个用户找到具有最大预期交互值的项目并进行推荐。通过这种量身定制的方法，您可以确信所建议的产品与用户的假定品味密切匹配。

代码

现在我们将实现它。

导入库

 
import numpy as np
import pandas as pd
from matplotlib import pyplot as plt
import tensorflow as tf
from tensorflow import keras
import os
import random

tf.set_random_seed(1); np.random.seed(1); random.seed(1) # Set random seeds for reproducibility

input_dir = '../input/movielens-preprocessing'
ratings_path = os.path.join(input_dir, 'rating.csv')

ratings_df = pd.read_csv(ratings_path, usecols=['userId', 'movieId', 'rating', 'y'])
df = ratings_df

movies_df = pd.read_csv(os.path.join(input_dir, 'movie.csv'), usecols=['movieId', 'title'])  

我们现在将构建一个模型，该模型使用点积层（Dot layer）而不是连接用户和电影嵌入层的输出并添加更多密集层来组合它们。

模型

 
movie_embedding_size = user_embedding_size = 8

# Each instance consists of two inputs: a single user id, and a single movie id
user_id_input = keras.Input(shape=(1,), name='user_id')
movie_id_input = keras.Input(shape=(1,), name='movie_id')
user_embedded = keras.layers.Embedding(df.userId.max()+1, user_embedding_size, 
                                       input_length=1, name='user_embedding')(user_id_input)
movie_embedded = keras.layers.Embedding(df.movieId.max()+1, movie_embedding_size, 
                                        input_length=1, name='movie_embedding')(movie_id_input)

dotted = keras.layers.Dot(2)([user_embedded, movie_embedded])
out = keras.layers.Flatten()(dotted)

model = keras.Model(
    inputs = [user_id_input, movie_id_input],
    outputs = out,
)
model.compile(
    tf.train.AdamOptimizer(0.001),
    loss='MSE',
    metrics=['MAE'],
)
model.summary(line_length=88)   

输出

Matrix Factorization for Recommender Systems

训练

 
 history = model.fit(
    [df.userId, df.movieId],
    df.y,
    batch_size=5000,
    epochs=20,
    verbose=0,
    validation_split=.05,
);  

 
# Load up the training stats we saved to disk in the previous tutorial
history_dir = '../input/embedding-layers'
path = os.path.join(history_dir, 'history-1.csv')
hdf = pd.read_csv(path)

fig, ax = plt.subplots(figsize=(15, 8))
c1 = 'blue'
ax.plot(history.epoch, history.history['val_mean_absolute_error'], '--', label='Validation MAE', color=c1)
ax.plot(history.epoch, history.history['mean_absolute_error'], label='Training MAE', color=c1)

c2 = 'orange'
ax.plot(hdf.epoch, hdf.val_mae, '--', label='Validation MAE (DNN)', color=c2)
ax.plot(hdf.epoch, hdf.train_mae, label='Training MAE (DNN)', color=c2)
ax.set_xlabel('Epoch')
ax.set_ylabel('Mean Absolute Error')
ax.set_xlim(left=0)
baseline_mae = 0.73
ax.axhline(baseline_mae, ls='-.', label='Baseline', color='#002255', alpha=.5)
ax.grid()
fig.legend();   

输出

我们新的、更简单的模型（蓝色所示）看起来相当不错。尽管嵌入相对较小，但这两个模型都表现出明显的过拟合。换句话说，与未见数据相比，由实线组成的训练集上的误差明显更低。

下一主题过拟合与欠拟合

用于推荐系统的矩阵分解

矩阵分解的工作原理

导入库

模型

训练

联系信息

关注我们

教程

面试题

在线编译器

Python

Java

.Net Framework

AI, ML and Data Science

Cloud Technology

B.Tech and MCA

Web Technology

PHP

Software Testing

Technical Interview

Java Interview

Python

Web Interview

Database Interview

B.Tech / MCA

Important Interview

Software Testing Interview

Company Interviews

Online Compilers

Multiple Choice Questions

机器学习

监督式学习

分类

杂项

相关教程

面试题

用于推荐系统的矩阵分解

矩阵分解的工作原理

导入库

模型

训练

相关帖子

机器学习建模中距离度量的重要性

时间序列中的季节性

机器学习中的解析解

机器学习中的遗传算法

5 个下载预训练机器学习模型的网站

贝叶斯定理的直观解释

机器学习中的人脸识别

线性回归中的因果推理：内生性

为什么在强化学习中对未来奖励进行折扣？

微分和积分微积分

订阅 Tpoint Tech

联系信息

关注我们

教程

面试题

在线编译器