五一去哪里人最少?爬取3000条数据,分析出性价比最好的地方
因为在“美名其曰”的五天假期里,有两天是周末,有两天是前后两周调休,有半天是青年节,只有半天是劳动节,这样的放假方式让很多人都感到不满,当然也包括老李。
其实今年假期如此安排,就是为了弥补去年因为疫情而备受打击的旅游业,主要目的就是为了拉动经济增长,促使大家进行消费。
调休2天,从放假天数看是多此一举,但是5天假期和3天假期在刺激GDP方面是质变,比如旅游业,5天可以出省游,3天一般只能本地游,前者促进消费的能力远高于后者。
而从实际效果上看更能证明,距离五一假期还有整整一个星期,各大旅游出行app上的火车票、机票、热门景点门票、酒店民宿就已经被抢售一空了,今年的旅游出行将是五一假期最火热的内容。
而年年假期景点都是人山人海,怎么避免高峰人群、享受性价比最高的旅游出行计划呢?老李今天特意从网上爬取了3000多条数据,打包成了3个Excel表,导入到FineBI里进行数据分析,看一看今年什么地方最值得去!
数据准备
数据源的爬取这里不说了,很简单的爬取过程,爬取过程大家可以参考老李之前的文章,总共爬取了3605条数据,部分数据如下:
下面就要进行简单的数据处理和加工了,一般在Excel里就可以实现简单的数据清洗,但是excel的可视化程度太低,所以这次我选择用专业的数据分析工具——FineBI进行数据可视化(看文末):
FineBI可视化
首先进行数据导入,FineBI可以直接导入本地的数据源,如excel表、sql表等,也可以连接数据库,从数据库里直接取数,适合企业级的大数据抽取。当然这里就没必要了,直接导入excel表:
导入数据之后我们可以新建一个自助数据集进行处理,为什么要新建一个呢?原因是为了防止直接对源数据表进行处理造成的数据更改和破坏,相当于复制了一个表,再怎么对这个表处理也不会破坏源表的数据了:
这次要分析的数据还算是比较干净,因此不需要太多的加工处理,直接创建可视化组件就行了:
在可视化后台中,只需要将分析的字段拖拽到横纵坐标轴、选择对应的图表类型就可以了,如下图所示:
其中的过程也不详细介绍了,大家感兴趣的可以自己下载尝试一下,下面直接给大家展示分析结果。
可视化分析
1、全国哪里旅游的人最多
可以看到五一假期期间,大部人还是选择去南部旅游,江西省是五一期间全国旅游人数最多的省份,以及湖南省、贵州省、广东省、福建省都是旅游热门省份;
近年来越来越多人喜欢去西部进行旅游,新疆、甘肃、宁夏都是近几年非常火热的旅游地点,而山东、河南、陕西省等则是依靠文化底蕴吸引了不少人;
比较意外的是东三省和四川的旅游人数并不多。
2、全国旅游收入最高的省份
江西省毫无疑问是五一假期旅游收入和旅游人数的双料冠军,整体与上图的情况是差不多的;
3、哪些城市最受欢迎?
上图展示了五一假期销售门票最多的10个城市,可以看出虽然江苏、湖南是旅游人数最多的省份,但是从旅游城市上看,浙江杭州、上海、北京和香港才是最受欢迎的旅游城市;
4、哪些城市的好评最高?
上图从app里收到的好评率为主,可以看出旅客最满意的城市是武汉、海口、澳门等,属于旅游人数少、好评率高的旅游城市,十分建议大家去;
5、门票打折最优惠的地方?
在五一假期海南的琼海市的优惠促销力度最大,平均折扣是6.9折,其次是澳门、扬州、重庆的平均优惠力度也很大;
6、平均门票最便宜的地方?
肇庆、成都、南宁等城市的平均门票价格是最低的,其次扬州、阳江、清远、青岛的门票价格也基本偏低;
免责声明:
① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。
② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341