多元统计分析法的各地区城镇职工基本养老保险情况研究
目录
摘要4
关键词4
Abstract4
Key words4
1 选题意义与多元统计分析方法4
1.1 选题意义 4
1.2 多元统计分析方法 5
1.2.1 聚类分析法5
1.2.2 主成分分析法7
1.2.3 回归分析法8
2 结果与分析8
2.1 聚类分析法的结果与分析8
2.1.1 2009年基本养老保险的聚类分析9
2.1.2 2010年基本养老保险的聚类分析9
2.1.3 2011年基本养老保险的聚类分析9
2.1.4 2012年基本养老保险的聚类分析9
2.1.5 2013年基本养老保险的聚类分析10
2.1. 6 2009~2013年聚类分析结果综合 10
2.2 主成分分析法的结果与分析13
2.2.1 2009年基本养老保险的主成分分析13
2.2.2 2010年基本养老保险的主成分分析14
2.2.3 2011年基本养老保险的主成分分析15
2.2.4 2012年基本养老保险的主成分分析16
2.2.5 2013年基本养老保险的主成分分析17
2.2.6 2009~2013年主成分分析结果综合18
2.3 回归分析法的结果与分析19
2.3.1
*51今日免费论文网|www.jxszl.com +Q: *351916072*
2009年基本养老保险的回归分析19
2.3.2 2010年基本养老保险的回归分析19
2.3.3 2011年基本养老保险的回归分析20
2.3.4 2012年基本养老保险的回归分析20
2.3.5 2013年基本养老保险的回归分析21
2.3.6 2009~2013年回归分析结果综合22
致谢22
参考文献22
附录A 数据23
附录B 程序24
基于多元统计分析法的各地区城镇职工基本养老保险情况研究
引言
1 选题意义与多元统计分析方法
1.1 选题意义
近年来,我国的城镇职工基本养老保险制度始终在不断地完善和进步,但由于我国实行的战略是非均衡发展,所以各地区的城镇职工基本养老保险情况还存在着很大的差距,也就是仍然存在着许多突出的问题。如何良好的解决这些问题自然是每一个公民(上至在位者,下至普通群众)都应该热切关注的。
如果我们经过了一定的阅读的话,那就不难发现,现下所有的关于城镇职工基本养老保险制度的研究大多数是基于全国的一个整体状况的研究或者是就针对一个地区做出的小范围的研究,很少有专门针对于我国的非均衡发展而研究的关于全国各地区的一个分析,很多的建议和方法不一定适用于每一个地区,其有效性有的也只是在一个范围内的有效。
所以本次选题旨在通过对各地区城镇职工基本养老保险情况的统计分析,做成一个可以直接使用的具有参考价值的数据分析,让后来的学者可以更加直观的看到各省市的城镇职工基本养老保险情况,并从比较和归纳中得出更具针对性的得出各省市的城镇职工基本养老保险制度目前所存在的一些问题,然后具体问题具体分析,提出更加有说服力和更加贴合实际的观点与建议,从而更好的解决城镇职工基本养老保险的问题。为构建社会主义和谐社会、提升居民的生活水平、促进社会平稳以及带动经济的长期发展的道路上做出一点微薄的贡献。
1.2 多元统计分析方法
多元统计分析方法研究的是客观事物之中的多个变量之间的一种相互依赖的统计规律性,多元正态分析,又称多元分析,是它的一个较为重要的基础。
在多元统计分析中,每个个体都拥有的多个观测数据即被称为多元数据,我们通常认为,多元统计分析方法就是分析多元数据的统计方法。
在20世纪30年代,R.A.费希尔、H.霍特林、许宝碌和S.N.罗伊这一行人等在多元统计分析方向作出了一系列奠定根底的工作,使其在理论上得到了非常迅速的展开。到了50年代中期,伴随着电子计算机的发展与遍及,在促进理论发展的同时,多元统计分析方法开始在地质、气象、生物、医学、图像处理、经济分析等许多的畛域得到广泛运用。诸如SAS、SPSS此类的统计软件的出现,让工作者可以更简略便利的运用多元统计分析方法来解决实际问题。
重要的多元统计分析方法主要有:回归分析、判别分析、聚类分析、主成分分析、对应分析、因子分析、典型相关分析、多元方差分析等。
本文用到的多元统计分析方法有聚类分析、主成分分析、回归分析。
1.2.1 聚类分析法
聚类分析是研究样本分类问题的一种多元统计方法,常用的聚类方法有层次聚类法和K均值法。在本次的选题研究中由于篇幅问题只选用了层次聚类法。
层次聚类法首先要在聚类分析开始时让每个样本自成一类,而后依照定义的距离来度量所有样本之间的距离,将当前最小距离的样本或者小类再聚成一类,接着再次度量剩余的样本和小类(或者小类和小类)之间的距离,将当前最小距离的样本或小类再聚成一类,重复操作到所有的样本聚成一类为止。
几种常用的层次聚类法如下:
①中间距离法
当某步骤类A和类B合并成为类C后,按中间距离法来计算类C和其他类D的距离公式为:
(1)
常取,可知是以、和为三条边的三角形边上的中线。如图1所示。
②重心法
将两类间的距离定义为两类重心之间的距离,对于样本分类,每一类的重心就是属于该类样本的均值,类A和类B之间的类间距离如图2所示。
③类平均法
把两类样本相互之间平方距离的平均作为类之间的距离,即
(2)
具体情况如图3所示。
④离差平方和法
原文链接:http://www.jxszl.com/jsj/xxaq/45426.html