浙江大学学报(工学版), 2019, 53(9): 1788-1794 doi: 10.3785/j.issn.1008-973X.2019.09.018

计算机科学与人工智能

神经协同过滤智能商业选址方法

李诺,, 郭斌,, 刘琰, 景瑶, 於志文

Intelligent commercial site recommendation with neural collaborative filtering

LI Nuo,, GUO Bin,, LIU Yan, JING Yao, YU Zhi-wen

通讯作者: 郭斌,男,教授. orcid.org/0000-0001-6097-2467. E-mail: guob@nwpu.edu.cn

收稿日期: 2018-12-17  

Received: 2018-12-17  

作者简介 About authors

李诺(1995—),女,博士生,从事普适计算研究.orcid.org/0000-0003-3569-894X.E-mail:linuo@mail.nwpu.edu.cn , E-mail:linuo@mail.nwpu.edu.cn

摘要

为了挖掘商店类别与地址之间的关系,基于神经协同过滤(NCF)框架提出商业选址神经协同过滤方法——NeuMF-RS. 采用嵌入方式分别得到商店类别和地址的表示,利用矩阵分解的思想学习商店类别与地址之间的线性关系;利用深度学习多层感知机学习商店类别与地址之间非线性、深层次的关系;结合这2种方法学习到的关系得到最终结果. 利用北京市的餐馆数据与POI数据来评价NeuMF-RS方法的性能,结果表明,NeuMF-RS相对于其他先进的深度学习方法和协同过滤方法在商业选址方面具有更好的性能,更能兼顾线性与非线性关系.

关键词: 商业选址 ; 推荐系统 ; 神经协同过滤(NCF) ; 多层感知机 ; 矩阵分解

Abstract

A new neural collaborative filtering method, NCF-RS, was proposed based on the framework of neural collaborative filtering (NCF). In order to discover the relationship between store category and site, the linear relationship between store categories and sites was studied by matrix decomposition, the non-linear and in-depth relationship between store categories and sites was studied by deep learning multi-layer perceptron, then the two relationships were combined for the final results. Restaurants’ data and POI data in Beijing were used to evaluate the performance of NCF-RS. Results indicate that NCF-RS has better performance in intelligent commercial site recommendation than other advanced deep learning methods and collaborative filtering methods, and can take linear and nonlinear relationships into better consideration.

Keywords: commercial site recommendation ; recommendation system ; neural collaborative filtering (NCF) ; multi-layer perceptron ; matrix decomposition

PDF (1041KB) 元数据 多维度评价 相关文章 导出 EndNote| Ris| Bibtex  收藏本文

本文引用格式

李诺, 郭斌, 刘琰, 景瑶, 於志文. 神经协同过滤智能商业选址方法. 浙江大学学报(工学版)[J], 2019, 53(9): 1788-1794 doi:10.3785/j.issn.1008-973X.2019.09.018

LI Nuo, GUO Bin, LIU Yan, JING Yao, YU Zhi-wen. Intelligent commercial site recommendation with neural collaborative filtering. Journal of Zhejiang University(Engineering Science)[J], 2019, 53(9): 1788-1794 doi:10.3785/j.issn.1008-973X.2019.09.018

近年来,在城市大数据与人工智能的背景下,智能商业选址一直是一个热门的研究领域. 因为位置不仅影响企业的利润,也影响其未来的发展[1-2]. 一方面,企业的选址影响单个店铺的经济效益、发展方式和该区域居民的生活水平,另一方面,企业的选址对整个城市的布局规划造成影响. 因此,在复杂的城市空间中选取企业的最佳空间位置,以实现商店的客流量和销售利润的最大化,具有非常重要的意义.

目前已经出现很多基于地理信息服务、POI数据等多元异构信息来选择其最佳位置的研究[1, 3-5]. 这类研究大多是从多元数据中提取信息来获取各个方面的特征并返回一个数字分数,对应于商店位置的质量评估,使用回归分析的方法为商店找到最佳位置. Karamshuk等[4]依据基于位置的服务信息和人口统计信息得到地理特征(包括密度、邻居熵、竞争性和延森质量)和移动性特征(包括区域流行度、过渡密度、流入流量和过渡质量),使用回归方法为商店找出最优位置. 最近,一些研究将提取的各种特征融入矩阵分解(matrix factorization,MF)技术,进一步提高了商业选址的性能. Guo等[6]将提取的商业特征作为商店项的潜在向量,将地理特征作为地址项的潜在向量,利用矩阵分解模型得到商店的所有地址项的评分,依此选择出最优地址. 然而这些特征需要手工提取,若提取不全面便可能得不到较好的效果;此外,回归和MF方法均是线性模型,若2个特征之间存在某种关联,则此模型就不能很好地表达这些特征.

深度学习在图像识别、文本处理、计算机视觉已取得巨大成功,在推荐系统方面也取得了巨大突破[7],表明深度学习可以从内容中直接提取特征,可以更加准确地学习用户和项目的潜在特征. 因此,本文不直接计算商店特征(密度、环境、口味等)、地址特征(人流量、交通、房价等),而是从深度学习的角度出发,自动提取商店和地址的特征,得到商店对地址的评分以便于为商店推荐出地址列表.

本文使用深度学习中的多层感知机(multi-layer perception,MLP)方法非线性地表达餐馆类别对地址的偏好,同时利用MF方法线性刻画餐馆类别对地址的偏好,将2个偏好值相结合从而得到最终的餐馆类别对地址的偏好,为餐馆类别推荐地址列表. 本文的主要工作如下:1)研究He等[8]提出的神经协同过滤(NCF)框架,并将其应用于智能商业选址推荐. 2)在NCF框架基础上,提出新的应用于商业选址的神经协同过滤方法—NeuMF-RS. 使用MF和MLP技术同时表达餐馆对地址的偏好,将2个偏好值相结合得到最终的餐馆对地址的偏好,据此进行地址推荐. 3)使用大众点评的餐馆数据与高德地图的POI数据验证NeuMF-RS对于地址推荐的可行性与有效性.

1. 相关工作

1.1. 协同过滤

协同过滤(collaborative filtering,CF)基于“物以类聚,人以群分”的假设,忽略了用户或物品的信息,直接使用历史行为(偏好)数据对推荐提出建议. 具体来说,根据用户的历史行为信息分析用户的个性化偏好,找到与目标用户具有相似偏好的用户群,将这个用户群对项目的偏好视为此用户的偏好,建模得到用户对项目的预测评分,最后,将这些预测评分结果提供给用户作为参考. CF方法通常可以分为基于记忆的方法和基于模型的方法.

基于记忆的方法根据所有用户对以前收集的项目的评分进行评分预测,通常包括基于用户的CF方法和基于项目的CF方法. 这2种方法均是根据所有用户对物品的评分,找到相似的用户(项目),然后根据用户(项目)相似性来进行推荐.

基于模型的CF方法[9-10]的主要思想是使用所有收集的评级来学习模型,然后使用该模型进行评分预测. 常用的基于模型的CF方法包括贝叶斯模型[9]、最大熵模型[10]、矩阵分解模型[11-12]、线性回归模型[13]和概率关系模型[14]等. 其中,矩阵分解模型是应用最广泛的方法[15],主要通过学习用户与用户、项目与项目之间的关系来自动获得用户、项目的隐属性,相当于把用户-项目评分矩阵分解为用户隐属性矩阵和项目隐属性矩阵,然后通过用户隐属性向量与项目隐属性向量进行点乘来得到该用户对项目的评分,并依此进行推荐. 本文中NeuMF-RS的线性通道便是利用矩阵分解模型完成的. 这样不仅可以学习到餐馆类别和地址的潜在特征,还可以学习到餐馆类别与地址的固有属性. 最重要的是,本文的NeuMF-RS在矩阵分解的基础上融入了深度学习的方法,可以非线性地刻画餐馆类别对地址的偏好,很大程度上提高了推荐的准确性.

1.2. 基于深度学习的推荐方法

近年来,深度学习在语音识别、文本处理、计算机视觉等方面已取得巨大成功,可以直接从内容中提取特征;可以很容易地对噪声数据进行处理;可以更加准确地学习用户和项目的特征;可以更容易对数据进行统一处理[7]. 因此,一些研究将深度学习与CF相结合[8, 16-18],使得学习的潜在特征更有效,用户或项目的表达能力更强.

在推荐系统中一般有几种使用深度学习的方法[19]:无监督的学习方法;利用深度学习来预测CF所产生的潜在特征;使用深度学习的方法将学习到的特征作为辅助信息. 例如Ma[19]将深度学习作为一种无监督的学习方法,并通过处理电影海报数据来学习电影之间的相似性. 通常更多的是利用深度学习来对辅助信息建模,比如项目的文字描述[18]、跨域行为的用户[17]以及丰富的知识库[8],然后将深度学习学到的特征与CF的矩阵分解技术相结合. 本文则是利用深度学习来预测CF产生的潜在特征. Xue等[20]提出了一种使用深度神经网络将用户和项目映射到共同低维空间的矩阵分解方法,使用深度学习的方法同时对用户和项目建模,将学习到的用户与项目的潜在向量利用矩阵分解的方式结合得到最终的评分. 与本文直接相关的是He等[8]提出的NCF(neural collaborative filtering),该方法使用深度学习对用户-项目交互矩阵直接建模,完全取代了基于矩阵分解,或将矩阵分解作为通用模型特例用于生成用户和项目潜在特征的方法. 本文的NeuMF-RS在NCF的基础上,考虑到餐馆类别与地址的固有属性而添加了偏置项. NeuMF-RS使用深度学习表示用户、项目的潜在向量,可以线性、非线性双通道、独立地刻画用户对项目的偏好,使得整个模型的灵活性好、准确性高. 虽然本文与深度矩阵分解(deep matrix factorization,DMF)均是使用双通道结构和MLP和MF相结合的方法,但是DMF本质上仍是利用MF线性表达用户对项目的偏好,只是使用MLP的方法来描述了用户与项目的潜在表示;而NeuMF-RS则是利用MF和MLP同时描述用户和项目之间的关系,以此刻画用户对项目的偏好.

2. 采用神经协同过滤的商业选址推荐

2.1. 神经协同过滤

NCF是神经协同过滤方法的一个实例,采用双通道结构将MF与MLP相结合,并允许其学习不同的嵌入式组合,如图1所示.

图 1

图 1   神经协同过滤框架

Fig.1   Neural collaborative filtering framework


输入层包括一个用户u和一个项目i,利用one-hot编码转化为二值化稀疏向量 ${{{v}}_u}$${{{v}}_i}$,将 ${{{v}}_u}$${{{v}}_i}$通过嵌入层映射得到一个稠密向量 ${{{p}}_u}$${{{q}}_i}$,分别表示用户的特征和项目的特征. 其中, ${{{p}}_u} = {{{P}}^{\rm{T}}}{{{v}}_u}$${{{q}}_i} = {{{Q}}^{\rm{T}}}{{{v}}_i}$${{P}} \in {{\bf{R}}^{M \times K}}$${{Q}} \in {{\bf{R}}^{N \times K}}$分别为用户与项目的潜在向量矩阵,MN分别为用户的个数和项目的个数,K为潜在空间的大小.

在神经协同过滤层,从线性与非线性的角度分别对用户-项目建模,最后结合这2个模型的隐藏层的输出作为最后的输出结果.

此过程形式上可以描述为

$ {{Z} ^{{\rm{GMF}}}} = {{p}}_u^{\rm{G}} \odot {{q}}_i^{\rm{G}}, $

$ {Z ^{{\rm{MLP}}}}\! \!=\! {\alpha _X}\left( {{{W}}_X^{\rm{T}}\left( {{\alpha _{X - 1}}\!\left( \!{ \cdots {\alpha _2}\!\left(\! {{{W}}_2^{\rm{T}}{{\left[ {{{p}}_u^{\rm{M}},{{q}}_i^{\rm{M}}} \right]}^{\rm{T}}}\!\! + {{{b}}_2}}\! \right) \ldots } \right)} \right) +\! {{{b}}_X}}\! \right), $

$\widehat {{y_{ui}}} = \sigma \left( {{{{h}}^{\rm{T}}}{{\left[ {{Z ^{{\rm{GMF}}}},{Z ^{{\rm{MLP}}}}} \right]}^{\rm{T}}}} \right).$

式中: ${{p}}_u^{\rm{G}}$${{p}}_u^{\rm{M}}$分别为广义矩阵分解(general matrix factorization,GMF)和MLP部分的用户嵌入;同样地, ${{q}}_i^{\rm{G}}$${{q}}_i^{\rm{M}}$分别为项目的嵌入;σαX分别为输出层与隐藏层的激活函数;WXbX分别为X层的权重矩阵与偏置向量;h为GMF与MLP模型之间的权衡参数.

接下来学习模型参数. 一般来说,对于显性反馈使用均方根误差损失,而对于隐性反馈则使用交叉熵损失[21]. 此模型是针对隐性反馈建立的,所以,选择交叉熵损失函数(式(4))来学习模型参数,得到最终的预测评分矩阵,以便于进行推荐:

$L = - \mathop \sum \limits_{\left( {u,i} \right)\text{ϵ}\gamma \cup {\gamma ^ - }} \left[{y_{ui}}\log \;\widehat {{y_{ui}}} - \left( {1 - {y_{ui}}} \right)\log\; \left( {1 - \widehat {{y_{ui }}}} \right)\right].$

式中:γ为交互矩阵中观察到的项,γ为消极实例,可将未观察的全体样本视为消极实例,也可以采取抽样的方式将其标记为消极实例.

2.2. NCF应用于餐馆地址推荐

NCF方法是一个通用的推荐方法,对用户-项目交互矩阵进行直接建模,完全取代了基于MF,或将MF作为通用模型特例用于生成用户和项目的潜在特征的方法. 与最先进的MF方法(如eALS和BPR)和基准方法(如ItemPop和ItemKNN)在MovieLens和Pinterest数据集进行比较,结果表明了NCF的显著效果. 本节利用该方法进行餐馆类别地址的推荐.

地址块内存在某餐馆或者地址块内不存在某餐馆的现象可以视为餐馆类别与地址的交互. 若MN分别表示餐馆类别和地址的数量,定义餐馆类别-地址交互矩阵 ${{Y}} \in {{\bf{R}}^{M \times N}}$,每个元素yui值为1,表示在这个地址i上,存在着类别为u的餐馆,而yui=0则表示在地址i上,目前还不存在类别为u的餐馆. 最后,在获得餐馆类别与地址交互的数据后便可直接应用NCF方法来进行餐馆类别地址推荐.

3. 改进的神经协同过滤商业选址方法

考虑到餐馆类别与地址的固有属性,本文在NCF的基础上加以改进,得到商业选址方法—NeuMF-RS. 本章首先介绍基于神经协同过滤进行商业选址的一般框架,主要介绍改进的推荐方法—NeuMF-RS.

3.1. 商业选址框架

从推荐系统的角度,基于神经协同过滤的商业选址的框架如图2所示.

图 2

图 2   基于神经协同过滤的商业选址框架

Fig.2   Framework of commercial site recommendation based on neural collaborative filtering


1)数据:此层是数据源层,是指从爬取的原始餐馆和POI数据,经过经纬度匹配,得到如式(5)所示的餐馆类别与地址的交互数据.

2)方法:此层是研究中最核心的一部分,指出了本文为餐馆类别推荐地址所用的方法,可以形式化为

${Z ^{{\rm{SVD}}}} = f\left( {{{{P}}^{\rm{T}}}{{{v}}_u},{{{Q}}^{\rm{T}}}{{{v}}_i}{\rm{|}}{{P}},{{Q}},{\theta _f}} \right),$

${Z ^{{\rm{MLP}}}} = g\left( {{{{P}}^{\rm{T}}}{{{v}}_u},{{{Q}}^{\rm{T}}}{{{v}}_i}{\rm{|}}{{P}},{{Q}},{\theta _g}} \right),$

$ \widehat {{y_{u\iota}}} = \sigma \left( {{{{h}}^{\rm{T}}}{{\left[ {{Z ^{{\rm{SVD}}}},{Z ^{{\rm{MLP}}}}} \right]}^{\rm{T}}}} \right). $

式中: ${{P}} \in {{\rm{R}}^{M \times K}}$${{Q}} \in {{\rm{R}}^{N \times K}}$分别为餐馆类别和地址的潜在空间矩阵, ${{{v}}_u}$${{{v}}_i}$分别为ui经过one-hot编码后的向量; ${\theta _f}$${\theta _g}$分别为SVD(singular value decomposition,SVD)模型和MLP模型交互函数fg的参数;h为SVD与MLP模型之间的权重;σ为激活函数.

由于评分二值化,选择交叉熵损失函数(式(4))来学习模型参数,然后得到最终的预测评分矩阵.

3)推荐:对某餐馆类别的所有地址进行评分,并据此推荐Top-N个地址.

3.2. 推荐算法—NeuMF-RS

本文方法是在NCF的基础上设计的,主要是考虑到餐馆类别、地址的固有属性. 有的餐馆类别很广泛,普遍存在;而有的餐馆类别仅是出现在繁华地区。对于地址块,有的地址属于重要位置,此地址块内餐馆较多,但有的地址则比较偏僻,餐馆数量与种类较少. 因此,本文添加餐馆类别与地址的偏置来提高推荐的准确性,推荐算法如图3所示.

图 3

图 3   基于神经协同过滤改进的NCF-RS模型

Fig.3   NCF-RS model based on neural collaboative filtering


使用puqi分别作为嵌入层输出的值 ${{{P}}^{\rm{T}}}{{{v}}_u}$${{{Q}}^{\rm{T}}}{{{v}}_i}$,在SVD层,可以得到:

$\begin{array}{l} {Z ^{{\rm{SVD}}}} = f\left( {{{{P}}^{\rm{T}}}{{{v}}_u},{{{Q}}^{\rm{T}}}{{{v}}_i}{\rm{|}}{{P}},{{Q}},{\theta _f}} \right) = {{{b}}_u} + {{{b}}_i} + {{p}}_u^{\rm{S}} \odot {{q}}_i^{\rm{S}}. \end{array}$

式中:bu为餐馆类别的偏置,bi为地址的偏置, ${{p}}_u^S$${{q}}_i^S$分别为线性刻画的餐馆类别与地址的潜在向量. 在MLP层,定义不变,同式(2). 最后,可以得到:

$\widehat {{y_{ui}}} = \sigma \left( {{{{h}}^{\rm{T}}}{{\left[ {{Z ^{{\rm{GMF}}}},{Z ^{{\rm{MLP}}}}} \right]}^{\rm{T}}}} \right),$

$\sigma \left( x \right) = \frac{1}{{1 + {{\rm{e}}^{ - x}}}}.$

本文基于keras实现了NeuMF-RS,并选用自适应矩估计(Adam)[16]的方法来优化目标函数(式(4)). 模型优化之后,参数确定,可以用训练好的模型预测每个餐馆类别对所有地址的预测评分,据此评分可以为每个餐馆类别推荐地址.

① https://keras.io/.

算法一中给出了NeuMF-RS算法的伪代码,包括训练、测试与预测阶段.

算法一:NeuMF-RS算法

输入:餐馆类别与地址的交互矩阵

输出:餐馆类别与地址的预测评分矩阵

1) %训练模型

2) 初始化模型参数;

3)利用式(8)、(2)、(9)计算训练集中每个实例的预测评分值;

4) 通过最小化(4)优化模型的参数;

5) %测试模型

6) 利用训练的模型预测测试集的预测评分,评估推荐的性能,并记录最好的推荐性能时模型的参数;

7) %预测

8) 利用记录的模型参数得到餐馆类别与地址的预测评分矩阵;

9) 结束

4. 实验验证

4.1. 实验数据

本文研究使用神经协同过滤的方法为餐馆类别推荐地址,需要大量的餐馆数据. 从图4上可以看到北京餐馆分布广泛、数量极大,因此,本文选择大众点评网上的北京餐馆数据进行爬取,获得11 653条数据. 接着,利用高德地图API爬取了北京市的地址块POI信息. 当划分地址块时,若将区域划分为较大块,则餐馆类别与地址的交互较多,数据稀疏性小,从而推荐系统的准确性较高,但是推荐的目标地址不明确,需要进一步确定具体地址. 然而若将区域划分为较小块,则数据稀疏性大,推荐系统的准确性较低。因此,本文最终选择1 000 m×1 000 m的区域作为一个地址块的大小.

② http://www.dianping.com/.

③ http://lbs.amap.com/api/javascript-api/summary/.

图 4

图 4   北京市所有餐馆的热力图

Fig.4   Heat map of restaurants in Beijing


本文将餐馆类别与地址块交互个数大于20个的地址块保留,以防止数据稀疏性大,因此最终的数据包括35种餐馆类别、1 270个地址块,餐馆类别与地址块的之间有9 625次交互,餐馆类别与地址块的矩阵稀疏度为88.53%.

4.2. 基准方法

为了评估改进的NeuMF-RS方法的推荐性能,将其与以下推荐方法进行比较:

1)Item-KNN[13]是基于项目的CF方法,通过不同方法计算项目相似度并获取推荐列表.

2)NeuMF-RS-SVD为NeuMF-RS方法中的SVD部分,即NeuMF-RS中的线性部分.

3)SVD[12]考虑了偏置项的MF,利用均方损失函数来进行优化.

4)DMF[20]带有神经网络的深度MF模型,将用户和项目利用深度神经网络分别映射到相同的低维空间,通过计算相似度来进行预测评分.

5)NCF[8]提出了一个GMF与MLP的双通道混合模型. 线性和非线性独立的建模、用户与项目独立的嵌入,均使得推荐的模型更加灵活,性能更加稳健、卓越. 详见第2.1节.

4.3. 实验设置

为了评估项目推荐的性能,本文采用leave-one-out[8]方法评估,即:对于每一个餐馆类别,随机选择一次交互作为测试集,并将其余的作为训练集. 由于每个餐馆类别的地址选项太多,随机选择100个不与餐馆类别交互的地址,并将要测试的地址排列在这100个地址中.

排名列表的性能由命中率[8](hitting rate,HR)和归一化折扣累积增益[8](normalized discounted cumulative gain,NDCG)来衡量. HR表示推荐的前N个项目能够命中用户实际偏好的比例. 而NDGG则表明了推荐列表的排名质量.

在参数设置方面,首先用高斯分布(平均值为0,标准偏差为0.01)随机初始化模型参数,然后使用Adam来学习NeuMF-RS模型的参数. 分别测试MLP层的层数[0,1,2,3,4],学习率[0.001,0.005,0.01,0.05,0.1],梯度批次[32,64,128,256,512],采样率[4,8,16,32,64]和平衡因子[0.2,0.4,0.5,0.6,0.8]. 实验结果表明:当MLP层数为3层,学习率为0.005,梯度批次为512,采样率为32,平衡因子为0.5时,推荐的性能最佳.

4.4. 实验结果

本文首先研究推荐系统性能和潜在因子大小之间的关系. 一般来说,潜在因子越大,说明映射到的潜在向量包含的信息越多,准确度更高. 但是也存在过拟合现象,如图56所示,NeuMF-RS、DMF、MF-BPR方法中HR@10、NDCG@10均随着潜在因子K的增加而增加,但在潜在因子K=80时,DMF、MF-BPR在HR和NDCG指标上均有所降低.

图 5

图 5   推荐性能HR@10随潜在因子的变化

Fig.5   Recommendation performance of HR@10 varies with predictive factors


图 6

图 6   推荐性能NDCG@10随潜在因子的变化

Fig.6   Recommendation performance of NDCG@10 varies with predictive factors


总体来看,改进的NeuMF-RS方法对于餐馆类别的地址推荐效果更优、性能更好. 对于Item-KNN,本文测试不同的相邻尺寸作为潜在因素并报告最佳性能. 与最相近的NCF方法相比,改进的NeuMF-RS方法添加了餐馆类别与地址的偏置,推荐性能更优,虽然,从图5可知,当K=10时,NeuMF方法推荐性能更好,但是这已经是该方法的最优性能,而此时NeuMF-RS方法还没有达到其最优性能. 此外,当K=20时,虽然HR@10与NDCG@10尚未达到最高,仍然会随着潜在因子K的变大而变大,但是它增加的幅度较小,消耗的训练时间长. 因此,本文选择K=20作为餐馆类别地址推荐系统的潜在因子.

K=20时,NeuMF-RS取得最佳推荐性能,本研究在此情况下测试推荐性能随推荐长度的变化,测试结果如图78所示. 可以看出,NeuMF-RS方法优于深度学习方法(NCF、NeuMF-RS-SVD和DMF),并且平均来说,在HR指标上比NCF、NeuMF-RS-SVD和DMF分别提高了9.2%、10.8%和17.5%,在NDCG指标上分别提高了11.6%、9.5%和21.4%;同时明显优于其他没有深度学习的CF方法(Item-KNN和SVD),表明了本文的NeuMF-RS方法在餐馆类别推荐系统上的可行性与有效性.

图 7

图 7   推荐性能HR随推荐列表长度的变化

Fig.7   Recommendation performance of HR varies with length of recommendation list


图 8

图 8   推荐性能NDCG随推荐列表长度的变化

Fig.8   Recommendation performance of NDCG varies with length of recommendation list


5. 结 论

本文基于神经协同过滤方法提出了新的用于商业选址的神经协同过滤方法NeuMF-RS,将深度学习应用于选址推荐,解决了餐馆类别与地址块固有属性的问题. 在真实数据集上的验证结果表明:NeuMF-RS明显优于其他的选址推荐方法,表明NeuMF-RS用于商业选址推荐的可行性与有效性. 但NeuMF-RS存在冷启动的问题,即只能在历史的地址块上进行推荐,并不能评估其他新的地址块,因此后续研究将考虑添加餐馆类别的特征、地址块的特征来得到类别与地址块的表示,从而解决冷启动的问题,提高推荐的准确度.

参考文献

LIAN J, ZHANG F, XIE X, et al. Restaurant survival analysis with heterogeneous information [C] // Proceedings of the 26th International Conference on World Wide Web Companion. Perth: IW3C2, 2017: 993-1002.

[本文引用: 2]

ROIG-TIERNO N, BAVIERA-PUIG A, BUITRAGO-VERA J, et al

The retail site location decision process using GIS and the analytical hierarchy process

[J]. Applied Geography, 2013, 40: 191- 198

DOI:10.1016/j.apgeog.2013.03.005      [本文引用: 1]

XU M, WANG T, WU Z, et al. Demand driven store site selection via multiple spatial-temporal data [C] // Proceedings of the 24th ACM SIGSPATIAL International Conference on Advances in Geographic Information Systems. Burlingame: ACM, 2016: 40.

[本文引用: 1]

KARAMSHUK D, NOULAS A, SCELLATO S, et al. Geo-spotting: mining online location-based services for optimal retail store placement [C] // Proceedings of the 19th ACM SIGKDD international conference on Knowledge discovery and data mining. Chicago: ACM, 2013: 793-801.

[本文引用: 1]

CHEN L, ZHANG D, PAN G, et al. Bike sharing station placement leveraging heterogeneous urban open data [C] // Proceedings of the 2015 ACM International Joint Conference on Pervasive and Ubiquitous Computing. Osaka: ACM, 2015: 571-575.

[本文引用: 1]

CUO B, LI J, ZHENG V W, et al

CityTransfer: Transferring Inter-and Intra-City knowledge for chain store site recommendation based on multi-source urban data

[J]. Proceedings of the ACM on Interactive, Mobile, Wearable and Ubiquitous Technologies, 2018, 1 (4): 135

[本文引用: 1]

ZHANG S,YAO L,SUN A X,et al

Deep learning based recommender system: a survey and new perspectives

[J]. ACM Computing Surveys (CSUR), 2019, 52 (1): 5

[本文引用: 2]

HE X, LIAO L, ZHANG H, et al. Neural collaborative filtering [C] // Proceedings of the 26th International Conference on World Wide Web Companion. Perth: International World Wide Web Conferences Steering Committee, 2017: 173-182.

[本文引用: 8]

CHIEN Y H, GEORGE E I. A Bayesian model for collaborative filtering [C] // AISTATS. [S.l.]: [s.n.], 1999.

[本文引用: 2]

BROWNING J, MILLER D J

A maximum entropy approach for collaborative filtering

[J]. Journal of VLSI Signal Processing Systems for Signal, Image and Video Technology, 2004, 37 (2/3): 199- 209

DOI:10.1023/B:VLSI.0000027485.11890.15      [本文引用: 2]

KOREN Y, BWLL R, VOLINSKY C

Matrix factorization techniques for recommender systems

[J]. Computer, 2009, 42 (8): 30- 37

DOI:10.1109/MC.2009.263      [本文引用: 1]

TOROSLU Ġ H. A singular value decomposition approach for recommendation systems [D]. Ankara: METU, 2010: 1-67.

[本文引用: 2]

SARWAR B, KARYPIS G, KONSTAN J, et al. Item-based collaborative filtering recommendation algorithms [C] // Proceedings of the 10th international conference on World Wide Web. Hong Kong: ACM, 2001: 285-295.

[本文引用: 2]

GETOOR L, SAHAMI M. Using probabilistic relational models for collaborative filtering [C] // Workshop on Web Usage Analysis and User Profiling. [S.l.]: WEBKDD, 1999: 1-6

[本文引用: 1]

SHI Y, LARSON M, HANJALIC A

Collaborative filtering beyond the user-item matrix: A survey of the state of the art and future challenges

[J]. ACM Computing Surveys (CSUR), 2014, 47 (1): 3

[本文引用: 1]

KINGMA D P, Ba J. Adam: A method for stochastic optimization [J]. arXiv preprint. arXiv: 1412.6980, 2014.

[本文引用: 2]

ELKAHKY A M, SONG Y, HE X. A multi-view deep learning approach for cross domain user modeling in recommendation systems [C] // Proceedings of the 24th International Conference on World Wide Web. Florence: IW3C2, 2015: 278-288.

[本文引用: 1]

WANG H, WANG N, YEUNG D Y. Collaborative deep learning for recommender systems [C] // Proceedings of the 21th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. Sydney: ACM, 2015: 1235-1244.

[本文引用: 2]

MA W J. Deep learning meets recommendation systems [EB/OL]. NYC Data Science Academy. (2017-01-24). [2018-12-17]. https://nycdatascience.com/blog/student-works/deep-learning-meets-recommendation-systems/.

[本文引用: 2]

XUE H J, DAI X, ZHANG J, et al. Deep matrix factorization models for recommender systems [C] // Proceedings of the 26th International Joint Conference on Artificial Intelligence. Melbourne: AAAI, 2017: 3203-3209.

[本文引用: 2]

RENDLE S, FREUDENTHALER C, GANTHER Z, et al. BPR: Bayesian personalized ranking from implicit feedback [C] // Proceedings of the Twenty-Fifth Conference on Uncertainty in Artificial Intelligence. Montreal: AUAI, 2009: 452-461.

[本文引用: 1]

/