"景先生毕设|www.jxszl.com

例解r语言在概率论与数理统计中的应用(附件)【字数:9229】

2022-11-11 15:51编辑: www.jxszl.com景先生毕设
随着大数据时代的到来,利用概率进行数据分析的方法在各行各业取得了令人瞩目的变化。面对海量的数据信息,如何有效并简介的整理消化这些数据,将这些杂乱的数字转化为有价值的经济数据也渐渐充满了挑战。 作为一名应用统计学的大学生,如何通过教学实践,在学习数据分析基础的概率论和数理统计中跟上时代的进步,运用多元化的统计软件,进行实例操作比较,达到高效便捷处理数据的目的。在学习概率论与数理统计中穿插统计软件的使用,可以激发我们自己动手实践的兴趣和提高解决实际问题的能力,从而深刻的理解概率论与数理统计这门课程。目前流行的统计软件有很多,其中R软件在学界备受推崇,因为它计算和绘图的功能十分强大,使用灵活,实际应用的范围也十分广泛,而且这个软件是免费的,而且有大量的软件包可供使用。本文主要研究运用R软件在概率论和数理统计中描述统计量、参数估计、常见分布的计算、假设检验等方面的具体应用。关键词概率论与数理统计、R语言、假设检验、参数估计,描述统计,非参数估计。
目录
第一章 绪论 3
1.1 本文的研究背景、目的与意义 3
1.2 国内外研究现状 4
1.2.1 概率论与数理统计概括研究 4
1.2.2 R语言概括研究 5
第二章 概率论与数理统计中的基本概念 7
2.1 随机变量及几种常见分布 7
2.1.1 随机变量 7
2.1.2 常见的几种概率分布 7
2.2极限定理 9
2.2.1大数定理: 9
2.2.2中心极限定理: 9
2.3描述统计: 10
2.4参数估计: 11
2.5 假设检验 12
2.5.1参数检验 12
2.6非参数检验 13
分布拟合检验: 13
第三章 例解R语言在概率论与数理统计中的应用 14
3.1 在R语言中生成随机变量 14
3.2 用R语言计算随机变量的数字特征 15
3.3 用R语言进行变量相关性检验 17
3.4 R语言与概率分布 19
3.4.1二项分布: 20
3.4.2正态

 *景先生毕设|www.jxszl.com +Q: ^351916072
分布: 23
3.5 R与参数估计 25
3.5.1 矩估计 25
3.5.2区间估计: 26
3.6 R与统计检验 28
3.6.1对均值 28
3.6.2对方差 30
3.7分布拟合检验 31
第四章 本文总结 32
第五章 致谢 33
参考文献 34
第一章 绪论
1.1 本文的研究背景、目的与意义
伴随着时代的进步,个人电脑开始普及,互联网覆盖着世界的每个角落,笼罩着各行各业。强大的网络系统让线上线下海量的可提取数据有了爆炸式的增长。很多商业公司的网络系统里保存着TB级的客户数据,政府,教育机构以及学术研究中心同样拥有各种各样的学术档案和信息数据。而这些海量的数据中存在的规律以及庞大的经济价值是不言而喻的,甚至在这些数据中收集有价值的信息已经成为一种普遍的产业。但同时,寻找一种让大众便于理解和消化的方式展现这些潜在规律数据的信息也渐渐富有挑战性。
需求推动改革进步,数据分析科学也伴随着庞大网络数据的产生进行着发展。其实早在个人电脑个英特网的产生之前,很多统计学,经济学的研究人员就开发出了很多统计方法分享在各种大众的论坛上。然后这些全新的研究方法会被强大的程序员附上代码,开发到数据分析的统计软件中。这就成就了多元化的统计软件,使得数据处理分析变得更加高效便捷化。
在早期个人电脑刚出现运用在数据分析中的时候,在机器上运行一次数据是非常不容易的,机会也是非常难得的。在运行数据前,统计学家和分析师们会十分小心精细的调整好各种参数和数据选项,还有一系列的计算机计算执行代码公式。等到所有的计算程序全都运行结束后,展现的数据也可能是成千上万的。需要人为地检查筛选整个过程,删除多余不需要的数据。一直到今天,大多数的统计软件一定程度上继承了这种处理流程(导入数据—数据准备,探索和清理—拟合一个统计模型—评估模型拟合结果—模型的交叉验证—在数据上评估模型预测模型—形成结果)。
当然,统计软件的强大功能还不仅仅在此,生动形象有吸引力的图形展示数据法,会将数据信息整合成让人充满阅读兴趣的分析报告给需要这些数据的大众。而本文将要运用到的R软件,正是涵盖了这些优点的全面软件。
1.2 国内外研究现状
1.2.1 概率论与数理统计概括研究
18世纪60年代,英国伟大的数学家贝叶斯(T.Bayes),给出了现代概率论中著名的“贝叶斯定理”:是互相独立的不相容事件,且对任意i有,则对任意事件B,有
 (11)
19世纪末,20世纪初,英国统计学家皮尔逊(Pearson)发展了统计相关和回归理论,对现代数理统计起了至关重要的作用。
20世纪20年代至30年代,英国数学家费希尔(Fisher)拓展了正态总体下的各种统计量的抽样分布,将已有的相关性,回归性理论建造为系统的相关分析和回归分析。
1928年,维夏特(J.Wishart)将狭义的多元统计分析发展为一个统计学中的独立分支。
第二次世界大战期间,沃尔德(A。wald)提出了序贯分析和统计决策理论。
20世纪50年代,沃尔德发表了《统计决策函数》,把各种各样的统计问题统一起来用决策的观点来研究。
数理统计在最近的几年里理论上的发展并不是很明显,但最令人瞩目的是它在这个大数据时代下的普及和广泛应用。几乎渗透到了每一个行业中,学科中,只要有数据的地方,就会有数理统计的身影。很明显,数理统计已经成为了当今时代下不可或缺的数据工具之一。相信在将来,数理统计在数据处理上还会对社会做出巨大的贡献。
1.2.2 R语言概括研究
R语言是由S语言转化而来的,S语言是一种统计绘图用的语言。由Rick Becker开发于20世纪70年代的贝尔实验室。在一款名为Splus的商业软件的基础上,可以便捷的编写函数,建立数学模型,拥有极好的拓展性,在国际上有很好的学术应用。
20世纪末,新西兰Auckland大学的Robert Gentleman和Ross Ihaka在S语言的基础上开发了一套可以执行这种语言的软件,并且公开给世人,这就是我们现在使用的R语言。

原文链接:http://www.jxszl.com/jsj/sxtj/80801.html