融合情境移动美食推荐系统研究
作者:王聪 刘启华 曹宇
来源:《电脑知识与技术》2015年第11
        摘要:随着移动互联网的快速发展,越来越多的用户选择使用移动终端来查餐馆、酒店等生活服务类信息。移动互联网环境下,用户的需求偏好与用户所处的特定情境密切相关。该文结合情境感知技术和评论挖掘技术构建了一个融合情境的移动美食推荐系统框架,并开发移动美食推荐原型系统---CHRAR,为移动用户主动提供符合其情境的美食信息。实验结果显示:用户对该方法得到的推荐结果满意度高。
        关键词: 八个月宝宝辅食食谱情境感知;评论挖掘;情感分析;移动环境;推荐系统
        中图分类号:TP393 文献标识码:A 文章编号:1009-3044201511-0255-06
        Context Relevance Assessment and Exploitation in Mobile Recommender Systems for Delicacy
        WANG CongLIU Qi-hua CAO Yu
        School of Information Technology查美食食谱 Jiangxi University of Finance and Economics Nanchang 330013China
        Abstract With the rapid development of mobile internet more and more users choose to use a mobile terminal to search restaurants hotels and other life service information. In the mobile internet enviroment the requirement of users has various relevance with different context. This paper combined with the technology of context-aware and opinion mining to build a context-aware mobile food recommender system CHRAR. By providing customized delicacy information we received overwhelming positive reaction from users.
五年级下册英语单词表
        Key words context-aware opinion mining sentimental analysis mobile -environment recommender systems
        随着移动互联网的快速发展,越来越多的用户选择使用移动终端来查餐馆、酒店等生活服务类信息。艾瑞检测数据显示,20128-20145月,移动端App和移动端网页的日均覆盖人数增长了147.0%73.7% [1]。移动终端已经成为了用户获取信息的重要媒介。然
而,在用户的信息获取成本越来越低廉的同时,信息甄别成本却变得越来越昂贵。加之移动设备的界面显示、终端处理、输入/输出等能力有限,为移动用户带来沉重的移动信息过载问题,导致移动网络资源利用率和用户体验受到严重影响。为此,移动推荐系统应运而生,它能够在分析预测用户需求基础上主动推送其可能需要但又难以获取的有用信息,并能够以用户为中心, 通过研究用户行为、兴趣和环境等,为用户推荐更具针对性的信息。
        在移动环境下,用户的个性化信息需求具有高度情境敏感性,同一用户在不同情境下会偏好不同的信息资源,并在搜索过程中采取不同的选择策略[2-3]。因此,部分学者已经开始将情境信息融入到移动推荐系统中,将传统的用户-资源两维推荐模型扩展为包含多种情境信息的多维信息推荐模型,取得了较好的效果[4-5]。但是,在很多情境感知推荐系统的研究中,往往存在着情境信息难以量化,用户情境和项目特征之间的关联度也很难准确计算的问题。为此,本文采用实证研究方法分析用户情境和美食特征之间的关联关系,并使用层次分析法和情感分析技术计算不同情境下美食商户的特征权重,为移动用户主动推荐符合其情境的美食信息。
        1 系统框架
        本文结合情境感知和评论挖掘技术构建了一个融合情境的移动美食推荐系统框架,其主要由数据采集、情境提取与建模和情境推荐三大模块组成,如图1所示。、
        1.1 数据采集
        我们使用网络旷工爬虫软件(http//www.minerspider/),在2014620-2014627日采集了大众点评网(http//www.dianping/)、去哪吃美食网(http//www.qunachi/)以及大成美食网(http//cd.qq/ieat/)上的分布在成都市的一年级语文上册课程教学视频200家餐馆的商铺信息、评论内容、人均消费、地址、等数据。最后,我们总共采集了15425条评论,在此基础上构建美食评论语料库。
       
        1 系统框架图
        1.2 情境提取与建模
        首先,我们对评论语料库进行了预处理。在此基础上,使用词频统计和机器学习的方法
构建美食特征和属性集合,并使用情感分析方法分析用户对各特征和属性的情感极性。其次,我们集成用户就餐偏好、就餐对象、就餐时间和就餐目的构建用户就餐情境。最后,我们使用调查问卷分析用户情境和美食特征之间的关联关系。
        1.2.1 数据预处理
        美食评论中含有很多出现频率高但是与观点无关的信息,如等,称之为停用词。删除停用词会提高产品特征分析的效果。本文只保留与评论特征和情感极性有关的名词(特征词),形容词(评价词)以及副词(程度词),使其构成短句,并用我不知道什么时间什么地点等作为分隔符。此外,评论语料库中的信息无法直接采用情感分析的方法对其进行处理,还需要对其进行一些必要的转换。我们采用中科院ICTCLAS开源项目软件对评论语料进行分词及词性标注。通过词性标注,可以判断评论语料的词性,帮助我们提取出产品特征和识别用户观点。
        1.2.2 美食特征抽取
        使用词频分析工具@Execl大全软件统计评论语料中的所有名词出现的频率,抽取排
名在100位之前的名词,人工判别其是否与美食情境有关。我们将会舍去衣服这些与美食情境无关的特征,保留诸如菜系”“地域这些与美食有关的特征。在此基础上将这些特征分类,由此得到美食特征和指示词,如表1所示。
        1 美食特征词和指示词列表
        [特征词\&指示词\&环境\&桌子、大厅、店面、空间、第一印象、座位、空调、餐具、环境\&位置\&位置、地方、包间、小巷子、大院、交通、\&风格\&风格、名字、文化、榻榻米、旗舰店\&氛围\&氛围、感觉、情调、风情、周围、整体\&服务\&服务、老板、服务员、店家、经理、态度\&档次\&档次、品牌、名气、装修、装饰\&人均消费\&人均、平均、价格、价位、价钱\&口感\&吃起来、尝起来、味道、蓓蕾、吃下去\&卖相\&卖相、造型、调、样式、外观\&菜量\&分量、盘、菜、菜量\&品种\&品种、种类、菜品\&等待时间\&等待时间、上菜时间、排队时间、等待、排队、上菜\&]
        1.2.3 美食评论情感分析
        美食评论中包含了用户对各美食特征的情感极性。在构建情感词典的基础上,论文使用依存句法分析方法计算用户对某一美食特征的情感得分。
        1)用户情感词典的构建
        知网Hownet提供了情感分析用词语集(beta版),包括正面情感词语、负面情感词语、正面评价词语、词语、主张词语、和程度级别六种情感分析词语集。在知网Hownet的基础上,我们构建了美食评论情感词典,其操作方法如下:
        选取知网情感词典中的正面评价词语和词语集合组成原始种子词典Q1,并为每个词条添加一个重要属性:极性强度。强度包括5个等级:±1±20。由5个人独立完成极性和强度的标注,取平均值。
        使用HOWNET对原始种子词典Q1进行同义词扩展,扩展出的观点词沿袭原始观点词的极性,形成观点词词典Q2
        提取美食评论中的形容词或副词作为观点词基础词库1,由5个人分别独立地从中选取评价词,根据五个人的选择得到较为准确的评价词构观点词基础词库2,去掉词库2中有歧义的词语,对剩余的评价词进行强度标注,方式与标注HOWNET仕馨优若家原始种子词典Q1方式一致,最终得到观点词典Q3
        将进行同义词扩展后的评价词词典Q2和获得的数据集D词典Q3进行合并,得到最终的观点词种子词典Q
        对美食评论中的程度副词进行极性标注,得到程度副词词典R
        构建否定词词典F
        2)评论情感极性分析
        通过分析大量的评论语料,我们发现,构成美食评论的基本情况大致如下:
        名词短语+形容词短语,例如:环境清幽
        形容词短语+助词的+名词短语,例如:良好的服务态度
        动词短语+助词的(得)+副词短语,例如:挤得很
        动词短语+形容词短语,例如:服务周到
        形容词短语+助词的(地)+动词短语,例如:周到的服务
        其中,名词短语主要由如下扩展方式:
        名词短语— >名词,例如:菜品美观
        名词短语— >名词短语+名词短语,例如:环境服务(都不错)
        名词短语— >名词短语+连词+名词短语,例如:环境和服务(都不错)
        名词短语— >名词短语+助词+名词短语,例如:服务员的态度(不错)
        形容词短语主要的扩展方式如下:
        形容词短语— >形容词,例如:周到的
        形容词短语— >副词+形容词短语,例如:非常周到
        形容词短语— >形容词短语++量词短语,例如:差了一些
        动词短语主要的扩展方式如下:
        动词短语— >动词,例如:上
        动词短语— >动词短语+名词短语,例如:上菜(非常快)
        根据以上规则,按中科院计算所词性标注集标注后可得到以下模式,如图2所示。
       
        2 评价搭配模式
        对于获得的美食评论数据集,对每个句子切分,按照图2前八个模式进行评论搭配的抽取,得到初始评论搭配集合M{评价对象,评价短语},其中评价短语包括了修饰性的副词和表达极性的形容词。