二手车场分析及可视化系统(附件)【字数:6773】
目 录
一、引言 1
(一)背景意义 1
(二)研究内容 1
二、 关键技术介绍 2
(一)Scrapy 2
(二)MongoDB 2
(三)Pandas 2
(四)pycharm 3
(五)HBuilder 4
三、数据采集与存储 4
(一)结构分析 5
(二)数据获取 7
(三)数据存储 7
四、数据清洗 7
(一)数据浏览 8
(二)解除设置 8
(三)数据去空处理 8
(四)一致处理 8
五、数据分析 10
(一)分类汇总 10
(二)相关分析 11
六、数据可视化 11
(一)首页 12
(二)数据大屏 12
(三)品牌排行 13
(四)购车分析 14
(五)未来预测 18
七、总结和展望 20
八、致谢 21
参考文献 23
附录 各部分详细代码 24
引言
随着中国汽车产业的高速发展,汽车的保有量迅速增长,汽车的置换率也逐年提升,为二手车行业提供了广阔的发展空间。
近年来,中国为扩大内需以刺激消费相关政策下,人们日常出行对汽车的需求日益强烈,经济实惠的二手车成为众人的首选,繁荣的二手市场带动了二手车相关行业的快 *51今日免费论文网|www.51jrft.com +Q: ¥351916072$
速发展。
2021年二手车交易量1319.2万辆,同比增长66.4%,再创历史新高,庞大的二手车交易量,在互联网信息时代,人们迫切需要了解二手车相关的大数据可视化。
(一)背景意义
随着中国经济的发展,人们对生活水平的要求不断提高,二手车因此逐渐进入人们视野。虽然二手车交易量快速增长,但是二手车市场的发展也存在很多的问题,一方面是二手行业发展过于迅速,相关管理政策还未完善,常有不法分子以次充好,蒙骗他人;另一方面在互联网信息时代,人们青睐于网上选购,面对网页上琳琅满目的商品,常常不知所措。本文将通过对二手车数据的采集、清洗、分析、可视化来提高企业服务客户的能力。
(二)研究内容
本文采用CSS定位、反爬行和动态代理技术获取二手车网站数据,采用去重、去空、分类汇总等进行数据清洗和分析,采用ECharts图表和Python中MVC框架完成数据可视化。数据采集部分包括:网站分析、数据获取、数据储存;数据清洗部分包括:去重处理、一致处理、去空处理;数据分析部分包括:分类汇总、相关分析、聚类分析;可视化部分包括:品牌可视化、保值率可视化、地区可视化。
具体如图11所示。
/图11 研究内容
关键技术介绍
本文涉及数据采集、清洗、分析、可视化等大数据的技术,采用PyCharn、HBuilder、Scrapy、MongoDB、Pandas等框架或软件,下面进行详细介绍。
(一)Scrapy
Scrapy[12]是适用于Python的一个快速、高层次的屏幕抓取和web抓取框架,用于抓取web站点并从页面中提取结构化的数据。Scrapy用途广泛,可以用于数据挖掘、监测和自动化测试。
Scrapy吸引人的地方在于它是一个框架,任何人都可以根据需求方便的修改。它也提供了多种类型爬虫的基类,如BaseSpider、sitemap爬虫等,最新版本又提供了web2.0爬虫的支持。
如图21所示。
图21 Scrapy框架介绍
(二)MongoDB
MongoDB[34]是一个介于关系数据库和非关系数据库之间的产品,是由C++语言编写,旨在为WEB应用提供可扩展的高性能数据储存解决方案。
MongoDB是非关系数据库当中功能最丰富,最像关系数据库的。它支持的数据结构非常松散,是类似json的bson格式,因此可以存储比较复杂的数据类型。
MongoDB最大的特点是它支持的查询语言非常强大,其语法有点类似于面向对象的查询语言,几乎可以实现类似关系数据库单表查询的绝大部分功能,而且还支持对数据建立索引。
如图22所示。
图22 MongoDB基础
(三)Pandas
Pandas[56]是基于NumPy的一种工具,该工具是为解决数据分析任务而创建的。
Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。
Pandas提供了大量能使我们快速便捷地处理数据的函数和方法。你很快就会发现,它是使Python成为强大而高效的数据分析环境的重要因素之一。
如图23所示。
图23Pandas基础
(四)PyCharm
PyCharm是一种Python IDE(Integrated Development Environment,集成开发环境),带有一整套可以帮助用户在使用Python[78]语言开发时提高其效率的工具,比如调试、语法高亮、项目管理、代码跳转、智能提示、自动完成、单元测试、版本控制。此外,该IDE提供了一些高级功能,以用于支持Django框架下的专业Web开发。
如图24所示。
图24 PyCharm
(五)HBuilder
HBuilder [910]是DCloud(数字天堂)推出的一款支持HTML5的Web开发IDE。 HBuilder的编写用到了Java、C、Web和Ruby,本身主体是由Java编写,它基于Eclipse,所以顺其自然地兼容了Eclipse的插件。快是HBuilder的最大优势,通过完整的语法提示和代码输入法、代码块等,大幅提升HTML、CSS的开发效率。
原文链接:http://www.jxszl.com/jsj/wlw/607571.html