首页 > 范文大全 > 正文

旅客国内旅行线路推介系统及其实现

开篇:润墨网以专业的文秘视角,为您筛选了一篇旅客国内旅行线路推介系统及其实现范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

摘 要:随着我国旅游业的发展,利用互联网平台推动旅游发展已经成为一种趋势,但是如何将两者很好的结合,为消费者提供智能化的旅游推送服务还需要进一步研究。鉴于此,我们在问卷调查的基础上研究旅客行为偏好,并利用成熟算法,进行热门景点推送,建立线路推送模型以及进行行程规划,为旅客提供更加全面的个性化的线路推送,从而促进旅游业发展。

关键词:旅行线路;线路规划;行程规划

引言

随着我国经济发展水平的不断提高,人民的生活水平不断提高,随之而来的是越来越多的人选择以旅行的方式提升生活质量,仅2015年第四季度全国旅行社国内旅游组织接待4529.87万人次、11203.71万人天,同比增长14.59%和16.91%;另一方面,由于互联网技术的迅速发展,对传统的旅游方式产生了深刻影响,特别是以去哪儿以及携程等旅游网站为代表的线上旅游商,其提供的线路信息以及价格信息查询等功能在很大程度上满足了旅客个性化旅行的需求,但是随之而来的问题是旅客在制定旅游线路时需要进行大量的搜索工作,不仅仅需要城市之间的线路信息,还得查询景点的线路,价格以及旅游评价等,而这些工作在一定程度上不单单是旅行成本或者说旅行线路的性价比的问题,旅客还得考虑自己所查询到的线路是否是最优的线路,即已存在的能满足自己最大出行需求的线路,所以针对旅客需求的旅行线路推介方法的研究以及如何对线路进行优化问题的研究十分有必要。那么旅客国内旅行线路推介系统的研究在很大程度上避免了大量的搜索工作,并且考虑到旅客对于时间和花销的要求,在一个交互式的平台当中推送最优的旅行线路以及行程的安排,尽可能的满足了旅客需求。

1 影响国内旅行路线设计的因素

对于旅行线路设计的因素的选取,我们在前人的研究当中可以看出时间,成本以及旅客偏好,或者说旅客对于某一景点的满意度等因素是重点。侯新华和文益民在2012年提出基于协同过滤的旅游景点推介方法,主要考虑对线上旅游网站当中的旅客对于景点的评价,通过评分实现景点推送;麻梅风在2014年提出基于旅客综合兴趣度的景点推送方法,提出综合兴趣度的概念,依据与目标用户兴趣相似的邻居用户对景点的评分信息预测用户对待推荐景点的评分,并进行推荐;马腾腾和朱庆华在2016年提出基于Hadoop的旅游景点推荐,在数据挖掘以及运算速度方面有所提高,但是也基于旅客对于景点的选择行为。从以上研究不难看出旅客偏好选择行为因素对于景点推送的影响,从旅客的角度来说就是景点满意度。2011年王战友,李强提出基于数学模型的线路优化设计方法,并提出了时间因素,费用因素和景点数量因素对于旅行线路的优化设计的影响;在旅游线路设计模型方面,学者唐亦运用运筹学中图论的方法,建立了旅游线路优化设计模型,模型优化的目标是时间最短;2011年陈鑫,刘汗青和徐常恒研究了在规定的时间内花最少的钱游览尽可能多的景点的旅行线路设计问题,并建立了模型;2014年曹阳利用遗传算法寻找最短路径,即考虑旅行时间最短问题;我们也不难看出时间因素以及费用的因素对于旅行线路的优化设计是不可避免的问题。那么文章就选取旅行时间,旅行成本和旅客满意度为线路设计的主要因素。

旅行线路的推介的主要对象是旅客,针对旅客需求的线路才是有意义的,对于此文章将旅客的选择行为看做其表达需求的主要途径,而旅客行为主要表现为对交通运输方式,运输价格以及线路推送方式的选择等等,而且进一步可以根据这些选择行为将旅客分为不同的类型。根据之前问卷调查的结果,我们将旅客分为学生旅客,在职休闲旅客以及离退休人员等三大类。不同类型的旅客有对各自需求影响的主要因素,即前文所提时间要求,成本因素和景点满意度,其中距离因素可以转化为时间因素。

2 国内旅行路线推介模型构建

在前面一章的叙述当中我们对线路设计的影响因素进行了阐述,我们将旅客的偏好体现在旅客对于景点的满意度当中,景点之间的距离可通过景点间的到达时间表达,而景点停留时间和成本因素将体现在建模的过程中。

旅游线路推介方法就是根据一定的限制条件以及起始地点,从所给的一系列景点之中选择合适的景点并以一定的次序推送给旅客,而这样的推送服务最终会使旅客获得满意度最大,同时其他约束条件不能超过旅客所设定的限制,并尽可能最小,而约束条件即包括了旅行时间,旅行费用等。假设在前文叙述条件下,已知热门景点,并计算出景点满意度,以及景点之间的路程时间,景点游玩的时间和费用,我们就可以建立一个景点网络图,而且图中各个景点之间是相互联通的。需要说明的是选择交通方式的不同最终体现在时间和费用上,而根据前文的叙述距离可以转化为时间,若是自驾游可以不考虑费用,若不是,按照前文解释进行处理。此时可利用全排列生成算法,进行候选景点集合的选取,在此过程中根据旅客的时间限制,费用限制以及满意度限制对产生的候选景点集合进行检验,剔除不满足约束条件的集合。那么满足条件的集合即为最优旅行线路,也可以在此基础上进一步进行行程规划。

2.1 热门景点的获取

在旅客确定目的地时,我们可以以此为关键词,利用爬虫从旅游网站爬取旅游文记,并从旅游文记当中按照规则提取地理名词,然后把这些地理名词按照地理本体树进行聚类,最后在每一个类别当中按照地理名词出现的次数有大到小排序,次数即为热度。经过筛选找出属于典型代表景点的地理名词,并根据聚类结果计算出景点的总体热度或者平均热度,从而依据热度获得热门景点。下面对获取地理本体树的流程进行说明。(如图1所示)

2.2 线路规划

在获得热门景点的基础上,我们定义景点为ai,则ai(m,n,k)为表示景点ai的满意度为m,游玩时间为n,费用消耗为k,au为旅客旅行的起始点,at为旅客在结束所有景点之后要到达的地点,起始点以及终点的满意度,游玩时间和费用消耗均为0。设有n个景点,而且各个景点之间都是可以相互到达的,根据全排列算法,所有景点有n!种全排列,即有n!种景点线路的组合方式,对于每一种组合方式我们都可以得到其满意度,游玩时间和费用。但这不是所有的景点组合,我们设有K阶候选集合CA1={a1m,a2m,a3m,...,aim,akm}和CA2={a1n,a2n,a3n,...,ain,akn},那么这两个K阶候选集合可以产生K+1阶候选集合,若aim=ain(1?燮i?燮k-1)且akm≠akn,此时K+1阶候选集合为CA3={a1n,a2n,a3n,...,ain,...,akn,akm}。那么我们可以从第一阶开始生成候选集合,并且在产生完所有第K阶候选集合之后,产生K+1阶候选集合,这个过程即旅行路线的生成过程。在此过程当中,对于每一阶候选集合检查其集合费用消耗是否超过旅客限制,如超过则删除,如满足限制条件则进行时间限制检查,如不满足则删除,若满足则为符合条件的景点候选集合。此时产生的候选集合并不是最优的,因为在相同的满意度水平下所花费的时间和费用是不同的,所以需要进行排序优化,即对旅行路线进行优化。

2.3 行程规划

对于优化后的景点集合来说,既满足了每种类型旅客对于热门景点的需求,又可以据此利用最小生成树聚类算法进行行程规划。此算法应用广泛,不在赘述,只针对文章当中的应用进行解释。最小生成树聚类算法首先要计算最小生成树,对于一个带权边的无向图,选择所有边的权值和最小的树即为最小生成树。在文章当中边的权值为景点之间的距离,针对旅客不同的需求可以进行不同目标的行程规划。

2.3.1 按照时间来聚类的步骤

首先,假设旅行的天数为N,旅客需要在N天的时间内对区域内的热门景点进行游览,那么在获取了行程景点数据之后,首先构造全连接图,然后利用算法得到最小生成树,把其剩余的边按照权值从大到小的顺序切断N-1条边,最后即可得到N个子图。举例如下:

一位游客想在3天之内游玩这7个景点,那么我们需要对其行程进行规划。首先根据上图生成最小生成树,如图3。

接下来根据旅客的要求,把边按照权值从大到小的顺序切断,首先切断G和E之间的连线,在切断B和E之间的连线,可以得到三个子图,如图4.即旅客每天要去的景点,至此我们按照旅客的要求对其形成进行了规划。

2.3.2 按距离来聚类的步骤

按距离来聚类与按时间聚类类似,同样在得到景点数据之后构造全连接图,生成最小生成树,然后把剩余的边按照距离的大小排序,切断景点之间距离大于M的边,即可得到满足旅客对距离要求M的行程规划方案。方法比较简单,不再举例说明。

以上所述方法,可以在获取旅客行为偏好之后,筛选出满足旅客需求的热门景点,然后可以根据旅客的旅行时间要求或者每天行程距离的限制进行行程规划,得到每天需要旅行的热门景点的集合;对于每天要去的景点我们则可以进一步进行线路规划,在最大程度上满足旅客需求。之所以可以这样做的前提是所查询到的景点都集中在一定区域内,对于跨区域的景点,或者说远距离的大城市之间的线路规划来说意义不大,因为旅客旅行一般会选择一个目标城市,具体旅行只是集中在一定区域内,旅行结束随即返回。相对于长距离的旅客运输方式的选择,类似携程,去哪儿等旅游网站对这种线路的选择是十分便捷的,或者说相对于不同交通运输方式的选择一开始就由旅客的类型所决定,无非是考虑到不同交通运输方式的经济性以及替代性会导致不同类型旅客在相同两点之间的选择是一致的,例如在一千公里左右的行程上民航与高铁具有很高的竞争性和替代性,文章对此不再讨论。

3 旅行线路推介模型验证

假设一名天津休闲旅客计划五一期间去西安进行四天的旅行,五月一号天津至西安的平均机票价格为649元,需要两个小时;高铁二等座平均票价为547元,需要五个小时;普快列车硬座平均票价为168.5元,需要17个小时。休闲旅客对于时间和价格的要求不高,但是从旅客满意度的角度考虑,在耗时较少,花费较少,准时且安全舒适的条件下,高铁二等座是最佳选择。在此情况下旅客当天可以到达西安,旅客即可对热门景点进行查找。当旅客输入西安作为关键词查找景点时,系统按照前文所述流程对西安的热门景点进行查找,热度排名前二十的结果如表1所示。

旅客根据自己的需求选择其中的十个景点进行游玩,假设旅客选择了排名前十的景点,那么根据每个景点的经纬度可以计算景点之间的直线距离,进一步可以得到这十个景点的全连接图。如图5所示(单位:km)。

旅客想要在四天之内游览这些景点,那么我们可以得到最小生成树,如图6所示。

对于最小生成树,我们按照权值从大到小的顺序依次切断3条边,可得到图7。

至此,我们按照旅客的要求,根据已知的方法为旅客安排四天的行程,第一天去世园会;第二天去大雁塔,大唐芙蓉园,华清池,钟楼,古城墙,大明宫和大唐西市;第三天去秦岭,第四天去秦皇陵。以上结果得到的是行程的规划,即每组景点都是由无向图连在一起,并不是线路规划,那么下面我们进行线路规划,首先我们可以得到这十个景点的相关数据(如表2所示)。

根据表2信息以及行程规划结果,我们利用全排列算法对景点a2,a3,a4,a5,a6,a7,a9这七个景点进行线路规划,由于在行程规划当中,我们计划第二天走完这七个景点,第三天去秦岭,它们之间的距离较远,为减少第三天的行程,设定这七个景点的起点和终点不一致,终点靠近秦岭,分别为au和at,那么我们可以知道不论怎样的排列,它的满意度和花销总是一定的,因为景点的数量是固定的,所以我们只需要找到最符合旅客的时间要求的景点排列即可。通过计算我们发现按照华清池,大明宫,大雁塔,古城墙,钟楼,大唐芙蓉园,大唐西市这样的顺序来游览所花费的时间最接近旅客要求并且没有超过,旅行时间为10.5h。至此我们对该旅客的旅行行程及旅行线路均进行了规划,从时间安排以及满意度方面尽可能满足旅客的需求。

在以上规划过程当中,我们采用了首先进行行程规划再进行路线规划的步骤,还存在一种方法就是首先进行线路规划再进行行程规划,按照后者进行的话,我们在获取热门景点的数据之后即可进行线路规划,但是此时会由于起点和终点的不同,导致从一阶开始的每一个排列都会有一组不同的属性。在这个过程当中我们是不考虑景点的数量的,所以从一阶开始,我们就要对每一个排列的满意度,时间以及花费进行检查,剔除不符合旅客要求的,直至找到最接近旅客的要求,同时保证满意度最高。在得到线路之后再进行行程规划,但此时存在的问题是行程规划的结果会不会影响线路规划的效果,答案是否定的,因为此时我们只需要在线路规划的基础上进行行程规划,方法类似前文叙述的过程,不在讨论。那么两种方法孰优孰劣?单从规划的效果来看,后者优于前者,从文章给出的例子不难看出,行程规划的结果在很大程度上限制的线路规划,由于一天的时间是有限的,这很可能导致无解的情况的存在,而后者则不需要担心这种问题。

4 结束语

随着旅游业持续稳定的增长,设计出满足旅客个性化需求的旅行线路推送系统可以促进个性化旅行的发展,鉴于此,文章在旅行线路推送设计的过程中,考虑到旅客的选择偏好,针对不同类型旅客可以推送不同的旅行线路,将旅客的景点满意度作为最主要的参考因素,并且在推送过程中考虑到时间约束以及成本约束,可以最大程度的比较旅行线路的成本,最终还可以通过可视化的界面推送旅行线路以及行程规划方案。另外在系统的可操作性和简洁性上,旅客可以根据喜好删减景点数量,从而得到新的旅行方案,十分便捷。但是文章存在不足之处是所建模型推送的线路集中在一定区域内,对于区域与区域之间的连接方式,即可能进行更长时间的旅行线路还需要进一步的研究,这牵扯到不同的交通运输方式的选择。另外在旅客满意度当中也可以加入更多的参考因素,或者在景点获取方面可以加入关联景点的推送等等。总的来说,旅客线路推介系统的研究的主要目的是减少旅客负担,为旅客在旅行过程当中提供建设性的指导,从而使其旅行更加愉悦,具有不小的商业潜力,期望能进一步发掘其商业价值,并运用到实际生活当中。

参考文献

[1]侯新华,文益民.基于协同过滤的旅游景点推荐[D].长沙:湖南工业职业技术学院,2012.

[2]麻风梅.基于游客综合兴趣度的旅游景点推荐[D].安康:安康学院,2014.

[3]马腾腾,朱庆华,曹菡,等.基于Hadoop 的旅游景点推荐的算法实现与应用[D].南京:南京大学,2016.

[4]曹阳.城市旅游规划行程链的模型构建及其应用研究[D].南京:南京师范大学,2014.

[5]胡乔楠.基于旅游文记的旅游景点推荐及行程路线规划系统[D].杭州:浙江大学,2015.

[6]李敏.年长者旅游行为的心理学分析[D].珠海:吉林大学 珠海学院,2008.

[7]赵凌云.面向服务的消费者行为分析及推荐模型研究[D].山东:山东师范大学,2014.

[8]田雨佳.基于旅游资源学视角的旅游公路网布局理论与方法研究[D].西安:长安大学,2012.

[9]凌文辁.行为科学在中国――战略决策研究[Z].2007.

[10]宋乐怡,熊辉,张蓉.下一代移动推荐系统[J].华东师范大学学报,2000.

[11]Anne Graham. Demand for leisure air travel and limits to growth[J].Journal of Air Transport Management,2000,6(2).

[12]厉新建,崔莉,万文平,等.高铁乘客的旅游特征与消费偏好分析[J].北京第二外国语学院学报,2013.

[13]郭金玉,张忠彬,孙庆云.层次分析法的研究与应用[J].2008,18(5):148.

[14]吴春阳.数据挖掘在电子商务旅游线路推荐系统中的应用研究[D].重庆交通大学,2009.

[15]Majid A.基于地理标签的社会媒体数据挖掘的智能旅游推荐研究[D].杭州:浙江大学,2012.

[16]决策的程序与偏好选择行为[Z].武汉: 武汉大学系统工程研究中心,2000.

作者简介:宏磊(1993-),男,甘肃庆阳人,主要研究方向为航空运输管理。