2006年世界旅游组织的“旅游可持续发展监测”项目拉开帷幕,十几年来,该监测计划已在中国十一地开展监测。在每年一度的旅游可持续发展监测项目中,工作人员都要去不同的目的地开展数千份的问卷调查,需消耗大量的时间和人力。因此,在2015年洛阳站的监测活动中,我们开始思考,能不能用更加便捷的方式来进行监测?是否存在更高效的数据收集手段?基于这一现实考虑,我们开始尝试探索大数据这一新技术手段在旅游可持续监测及旅游研究中的应用。回到文献中后,我们发现旅游大数据类型多样,相比与其它基于社交媒体产生的数据而言,旅游短评论的分析优势十分明显,如结构较为清晰,可比性较强,样本量大,语法结构简单,且具备基础的用户属性数据(ID、发表时间,部分用户有归属地)等。同时在文本处理方法上,对于旅游评论尚未有成熟的、既能考虑算法逻辑又能考虑情感的文本分析工具可用。几番犹豫之后,我们决定自己开拓新的方法,并一步步建立了游客情感词库,分析中文语义逻辑,制定算法规则等等,最终确立出一套计算旅游文本情感倾向的算法,直接得出三项内容:文本的情感得分、文本集合的共现矩阵和语义网络图。我们将这一套算法和分析过程命名为TSE模型(Tourist Sentiment Evaluation)。
TSE模型的情感评价原理其实非常简单,就是词频统计加上语义逻辑。在词频统计上,我们通过自己阅读,提取了旅游情境下的常用词库。语义逻辑主要从程度副词、否定副词和转折连词三个方面进行设定了若干条规则,再把规则编译成算法。这一步是相对比较难的操作,毕竟这是个纯语言学工作,为此我们也请教了语言学和传播学的同行给予批评修正。最让人兴奋的是,在开发的过程中,我们意外发现情感系数的存在,并在多轮校验之后,将这个系数确定为4,即旅游者在表达正面情感时使用的词汇量,是表达相似负面情感的四倍。再简单地说,四句好话顶一句坏话。在模型校验的工作上,旅游可持续监测中心十数年的工作积累,成为极其关键的校验数据。将监测所得的调查结果与旅游评论相比较,便可得知我们的TSE模型是否有效,也是我们开展这项工作的初衷。令人兴奋的是,最终的结果证实了该方法的有效性。这个发现转化成了团队的第一篇学术成果,即《基于大数据的旅游目的地情感评价方法探究》,于2017年6月发表于《地理研究》,这篇文章为旅游目的地评价开拓了新的路径,证实了旅游大数据的可用性。正是由于这一突出的学术价值,该文获得了文化与旅游部2017年优秀研究成果学术论文类二等奖。
在模型提出之后,我们发现又有了新的困惑,就是在现有研究已经大量使用机器学习法的前提下,是否还有必要坚持TSE这种基于自然语言处理逻辑的半自动算法?人工算法是否终究要让位于智能算法呢?
为了解决这个问题,我们进一步将TSE模型与目前流行的机器学习模型进行深度比较,以问卷调查数据和人工赋分数据为基准数据,选择了6个主流的基于机器学习逻辑的算法模型,与基于自然语言逻辑的TSE模型一同,计算旅游评论情感倾向并展开准确率的对比研究,研究发现,TSE模型表现相对良好,准确率排名第二。该成果发表于2021年的《南开管理评论》上。
在证实模型有效之后,我们应用该模型在情感地理理论场境下进行了多个尺度的探索。
在宏观层面,我们利用TSE模型研究了中国客源市场的基本空间结构和变化规律,实证了区位优势与资源属性是客源市场的关键影响因素这一经典的地理命题,又将“80%客源市场位于500km范围内”这一定律修正为1200km,并确认了在高铁、自驾游等多渠道交通方式兴起的今天,旅游客源市场的距离衰减效应依然十分明显。与此同时,我们探索了旅游资源文化属性与爱国情感的关系、自然-人文资源的情感画像差异、中国游客对“一带一路”沿线国家的情感意象和偏好,以及旅游者情绪脉搏的时空特征等话题。
在中观层面,我们研究了以澳大利亚为例的中国游客与国际游客的情感画像差异,发现现有的文化差异论或旅游者职业生涯阶梯理论只能部分解释这种差异。我们还探索了以三亚为例的地旅游目的地官方形象和游客感知之间的差异,基于TSE和IPA模型的城市旅游形象差异。
在微观层面,试图将研究对象具体到城市内部,揭示人地情感关系与旅游休闲行为的互动机制,目前我们初步揭示了城市休闲产业的空间集聚结构与特征,准备结合UGC,对这方面展开探索。
外国游客对澳大利亚的旅游意象
中国游客对澳大利亚的旅游意象
在开展理论探索的过程中,我们还对旅游评论中的无效评论展开研究。发现与一般电商环境不同,旅游行业中较少出现刷广告、刷单、水军灌水等行为,评论中的假评论、伪评论数量和种类不多。在理论探索的同时,我们将TSE模型应用到社会实践中,得到了积极的回应。2015年10月,我们首次在世界旅游组织可持续观测年会上发布了《基于大数据的中国游客情感意象研究报告》后,便将情感意象报告纳入到监测中心的常规工作内容中,至今已经完成了6份大数据监测报告以及3份专题报告。与此同时,在世界旅游组织的邀请下,我们为斯里兰卡做出了一份《中国赴斯里兰卡游客情感意象分析报告》。报告完成之后,斯方十分重视和欣赏,继而发出了继续进行二期报告研究的邀请。世界旅游组织也继续邀请团队为马尔代夫编制《中国赴马尔代夫游客情感意象分析报告》。在完成这两项工作之后,刘逸老师代表研究团队,在International Academy for the Study of Tourism在广州2017年年会上做了主题报告。2018年继续在监测工作的基础上完成了《基于大数据的开封旅游可持续发展监测报告》。TSE模型在完成监测中心的常规工作的同时,也广泛应用到社会服务中。我们借助 “游客美誉度”的概念,分析了广东省各城市的旅游市场结构、关注度和美誉度之间的关系,并完成了《基于大数据的广东省旅游城市美誉度研究报告》。在建水、元阳等多个旅游规划项目中完成了大数据分析专题,并主持完成了《阳朔大数据旅游市场研究报告》。TSE模型的社会实践应用也受到了国际同行的关注,团队受邀做了一系列的报告,包括西班牙坦桑德银行资助项目的《中国游客赴西班牙境外游市场报告》,以及针对以色列旅游官方的《基于大数据的以色列情感意象报告》。
目前研究团队在继续完成监测中心的常规大数据监测的同时,也将承担可持续旅游智能评测技术文化和旅游部重点实验室在技术智能化方面的探索工作。为了让更多同行与学子们可以使用TSE模型,团队已经将模型制作成简易网站。未来拟向广大研究者开放使用。希望这个小成果能够给大家提供便利,充分发挥其价值。更欢迎感兴趣的老师和同学多多与团队交流,提出宝贵的批评意见,共同学习共同进步!
TSE模型网页版临时地址:
http://122.51.20.60/?nsukey=aBgFwNque6uqMWT%2BhQ99kdMVyBsZeQrc7jzZ2Ffax5jwTOUKzSJOMs0ncz3jFNii2i74R18tuJ75R33oR%2Bc2Rd5kIr0KD8McPqhdHL9aSw4cl%2BhSbXXrHAJfq3zhgpVDIU9REHm1z9YP00I0BpG5D%2FWNE3katofhiZjHckeuhIL0XcugsRGzUwi%2FxYepcEi7Tc2jPc9InWX8EbLj036xzA%3D%3D
注意事项:
1. 首次登陆用户需要注册。
2. 注册完成后创建新项目即可进行计算。
3. 上传的评论文件需要使用Excel格式,并确保第4列是star(用户评分,没有的可以为空),第5列是评论文本。
详细的操作说明文档在网站页面点击“download operation manual”下载。如网站操作崩溃,可联系我们研究组的微信公众号(TEG研究组),直接发数据给我们代为处理。
1.刘逸, 陈銮, 刘子惠, 陈逸敏. 2022. 基于同位模型的休闲产业空间集聚特征研究:食色性也. 旅游学刊,2022,37(02):94-104.10.19765/j.cnki.1002-5006.2022.02.013.2.刘逸,李广涵,李晓娟. 基于UGC 评论和TSE 模型的我国游客爱国情感研究[J].旅游导刊,2021,5(4):79~96.3.刘逸,孟令坤,保继刚,赵创钿. (2021). 人工计算模型与机器学习模型的情感捕捉效度比较研究——以旅游评论数据为例. 南开管理评论. 24(05):63-74.4.Chen H, Liu Y, Chen K. Big Data in Tourism: General Issues and Challenges[J]. Journal of Tourism Hospitality, 2021, S4: 003-008.5.Borrajo-Millán, F.; Alonso-Almeida, M.-d.-M.; Escat-Cortes, M.; Yi, L. Sentiment Analysis to Measure Quality and Build Sustainability in Tourism Destinations. Sustainability. 2021, 13(11), 6015-6029.6.刘逸,蒲雪茹,2021. 粤港澳大湾区蓝皮书:粤港澳大湾区旅游业发展报告(2020). 徐红罡, 保继刚编.社会科学文献出版社,北京.7.Meng Lingkun, LIU Yi, Li Xiaojuan, Wang Yuanlei, 2021. A Big-data Approach for Investigating Destination Image Gap in Sanya City: When will the Online and the Offline Goes Aparted? Regional Sustainability, 2021(2), 98-108.8.刘逸,孟令坤,郭建楠,李想,2021. 旅游无效评论特征初探,旅游论坛,14(3)31-43.9.Liu, Yi., Huang, Kaixuan, Bao, Jigang, & Chen, Kaiqi. (2019). Listen to the voices from home: An analysis of Chinese tourists’ sentiments regarding Australian destinations. Tourism Management, 71, 337-347.10.刘逸,徐晓静,赵莹. 基于TSE和IPA模型的城市旅游形象感知和差异研究——以广东省为例. 旅游论坛,2019,12(06),41-49.11.刘逸, 陈欣诺, 保继刚, 谈可歆. 2019. 游客对自然和人文旅游资源的情感画像差异研究, 旅游学刊. 34(10),21-31.12.刘逸,保继刚,陈凯琪. 2017. 中国赴澳大利亚游客的情感特征研究——基于大数据的文本分析, 旅游学刊,31(5),46-58.13.刘逸,保继刚,朱毅玲. 2017. 基于大数据的旅游目的地情感评价方法探究, 地理研究,36(6)1091-1105.
供稿:刘逸副教授团队
编辑:黄倩
初审:何甜
审核:徐永怡
审核发布:徐红罡、黄山