推荐系统算法

Taiwan Data Forum trends and innovations
Post Reply
mimakte
Posts: 156
Joined: Wed Dec 18, 2024 6:35 am

推荐系统算法

Post by mimakte »

皮尔逊相关系数

该算法可用于识别多个客户端之间的相似性。为此,我们使用了两个特征的线性依赖性分析。需要注意的是,这种方法不适合研究一组用户。

协同过滤的原理

与硬聚类一起采用的也是这一原则,它也考虑了用户的偏好和行为,但算法更为复杂。不幸的是,它至少有两个缺点。第一个是针对新用户,由于缺乏足够的信息,新用户很难选择相关的优惠。第二种是冷启动:推荐系统中新产品数量较少。

聚类

该方法基于给定的特征空间确定用户 银行数据 之间的相似性。这些属性因资源而异,取决于内容。对于在线商店来说,这可能是服装;对于音频服务来说,这可能是音乐作品。当多个用户的特征重合或相似时,这些客户端就会被分组成簇。

内容过滤原理

对称联合滤波方法。它使用有关其他用户喜欢的信息。内容过滤涉及使用有关消费者自身标记的数据。这种方法的缺点是冷启动和建议的标准性质。

创建推荐系统的示例
例如,我们在 Yandex DataSphere 中使用了由俄罗斯 BI 和大数据市场行业领导者 GlowByte 创建的推荐算法。针对用户的个性化优惠是根据具体情况和之前的购买情况制定的。该算法根据购物车中的商品信息、购买日期、个人活动历史等信息选择一系列推荐。该方法可以用于零售和餐饮场所。公司规模及其营业额不起作用;只分析有关用户的材料。

这些说明使用合成信息,还需要有关产品、客户及其购买的数据。推荐系统的代码可以从 GlowByte 的笔记本中获取。它包括数据采样、机器学习和推荐生成。

创建推荐系统的示例

您将需要一个 Yandex Cloud 帐户和一个适当的命令行界面。

步骤1:在DataSphere中创建项目并添加信息
首先,您需要在 Yandex DataSphere 中创建一个新项目并创建数据。您将需要:购物历史记录、产品属性、购买地点的描述,以及客观信息(天气、经济状况)。

要创建新项目,您需要登录 Yandex Cloud 控制台。然后进入工作目录,点击“创建资源”并选择DataSphere。在出现的对话框中,您必须指定项目的名称和特性。此外,您还可以创建一个新的服务帐户,该帐户将来可用于通过 API 访问 Yandex Cloud 资源。

接下来,您需要打开项目并向其中添加信息。在考虑的情况下,这些是包含必要信息的 CSV 文件。您需要加载您自己的数据,合成的或真实的。可能还需要指明购买时间、购买清单及特征、用户的性别和年龄。
Post Reply