摘要:当今社会,在人们外出就餐时,就餐的选择不仅仅取决于味道,同时也受到许多其他因素的影响。因此,餐厅推荐中关键的问题便是,发掘用户选择时的潜在影响因素。本文根据当下主流餐饮社交网络的数据进行分析,在个性化推荐技术模型与算法上提出了新的模型,一方面,对于未来智能生活的餐饮推荐服务方式及其网络技术做出了探索与说明,另一方面,对大众餐饮消费文化从数据挖掘角度做出技术探索与说明,可后续为人民网解读大众餐饮消费心理做技术角度支撑。本文挖掘用户选择餐厅时所关心的、潜在的主题因素,并将其应用在餐馆推荐中。我们使用LDA模型提取了餐厅的潜在主题特征,根据潜在主题因素分布特征进行评级反馈学习以及计算相似度,并据此做出评级预测和餐厅推荐。本文利用Yelp数据集中的评论数据进行了实验,探索了算法的性能和最优主题数K。实验结果表明,该算法在评级预测方面取得了一些进展和成果。从一定程度上来说,将潜在主题分布应用于餐厅推荐问题可以解决数据稀疏性问题,减少计算维度,提高评级预测的准确性。
关键词: 潜在因素; 评级反馈; 餐厅推荐; LDA
1. 简介
近年来,餐饮业发展迅速,许多餐厅在餐饮,餐饮服务和餐饮装饰风格方面进行了创新尝试。 年轻人在选择餐厅时考虑的因素也变得多样化,而不仅仅是只关注食物的味道了。一些餐饮社交媒体提供了多方面评级机制,例如,大众点评网提供环境、品味、服务三方面评级服务。在这样的评级机制下,用户评级信息在反映餐厅特征方面仍然显得力不从心。因此,当下需要一个多维的、包含多种影响因素评级信息来表示餐厅的特征。
食品专家可以对餐具进行详细分类,但很难控制分类的粒度,也很难为相应种类的餐厅设置权重值。传统的基于物品的协调过滤推荐算法由于基于用户的历史行为进行推荐常常可以给出相关解释,这些解释通常会让用户更加信服。本文试图建立一个模型,考虑餐厅的潜在的、多样化的因素和客户的历史行为,为客户提出有效的餐厅推荐。
以前的研究表明,用户提供的评论包含的信息比常见推荐系统中处理的评级信息更丰富[1],因此,本文着重从用户产生的评论中挖掘各种潜在的餐厅主题因素。
本文提出了一种基于LDA的协同过滤算法,该算法考虑了评论中潜在的主题因素挖掘和客户的历史评级反馈,并进行了实验验证了算法的有效性。最终的成果为:1)在向用户推荐餐厅时,不仅考虑口味因素,同时也考虑各种潜在的主题因素;2)提取餐厅的潜在主题分布特征,并依此生成潜在的K-主题评级矩阵,进而分析用户的偏好。3)应用提取得到的多种潜在因素来进行餐馆推荐。
本文分为七个部分。第一部分介绍了问题的起源和背景,第二部分介绍了进行的相关工作。而到了第三部分,进行了问题的定义;第四部分则是描述了工作中提出的模型。第五部分,详细描述了实验的整体并对实验结果进行了分析。到了第六部分,是最终的结论和下一步要进行的工作。最终则是引用的文献列表。
2. 相关工作
Lihua Sun 等人在对在线中文评论进行情感分析的基础上,将不确定性理论引入餐厅推荐系统,并以此来挖掘用户的意见[1]。Sonya Zhang等人通过建立基于消费者群体餐厅评论的推荐系统,提出了内容过滤推荐系统,该系统评估个人在线评论,并为细分出的五个消费者类型分配相应的数值得分[2]。这些论文都在一定程度上启发了本文的思路。为了挖掘各种潜在的主题方面和特征,本文使用了基于挖掘用户的评论的方法来制作餐厅特色细分。
Chao Li,Srn Feng等应用LDA和WordNet组合算法挖掘研究课题的动态,取得了很好的成果[3]。Maha Amami等人将基于LDA的方法应用于科学论文推荐[4]。Shinjee Pyo等在统一的主题建模框架中,使用LDA模型分析电视用户群和电视节目,将类似的电视用户和关联描述词同时用于观看电视节目[5]。LDA模型在潜在的主题特征中表现出很大的优势,并且成功指出了适当的类别。
以往的研究表明,餐厅顾客评论可以分为多种因素,如服务质量,产品质量,菜单多样性,价格和价值,氛围等[2]。Yifan Gao等人建立了一个基于新模型的餐厅推荐系统,该模型捕获评论和数字评级中隐藏方面之间的相关性,并通过实验证明了其优势[6]。因此,建立一个考虑了从评论和客户的历史行为挖掘的潜在因素的、基于LDA模型与item-CF的餐厅推荐系统是值得和可行的。
3. 问题定义
相关阅读
赞助商广告