还剩39页未读,继续阅读
本资源只提供10页预览,全部文档请下载后查看!喜欢就下载吧,查找使用更方便
文本内容:
《统计学原理贾俊平》ppt课件•统计学简介•统计学基础知识•描述性统计CATALOGUE•概率与概率分布目录•参数估计与假设检验•方差分析•相关分析与回归分析•时间序列分析与预测01统计学简介统计学的定义统计学是一门研究数统计学涉及的领域广据收集、整理、分析泛,包括社会科学、和推断的科学医学、经济学等它旨在探索数据的内在规律和特征,为决策提供数据支持和依据统计学的应用领域政府统计商业统计医学统计经济学统计用于市场调查、消费者用于临床试验、流行病用于宏观经济分析、金用于制定政策和规划,行为分析、产品研发等学研究、健康状况监测融市场研究、国际经济监测社会经济发展状况领域等比较等统计学的发展历程0102030417世纪中叶19世纪末20世纪中叶当前统计学开始形成独立的学科统计学开始应用于社会科学领计算机技术的普及推动了统计统计学在大数据时代扮演着越域学的快速发展来越重要的角色02统计学基础知识数据的类型与来源分类数据例如性别、婚姻状况等,只能用文字表示定量数据例如年龄、身高、体重等,可以用数字表示数据的类型与来源•顺序数据例如考试成绩、社会经济地位等,不仅可以用数字表示,而且数字之间还有顺序关系数据的类型与来源直接来源例如调查、观察、实验等间接来源例如各种出版物、报告、数据库等数据收集的方法01020304描述性统计用于对数据进行整理和描述,通过样本信息来推断总体特征,例如求平均数、中位数、众数、推断性统计例如利用样本平均数来估计总方差等体平均数数据的整理与展示数据的整理数据的展示对数据进行分类或分组,例如将考试用图表或图形来展示数据,例如柱状成绩按照优、良、中、及格和不及格图、折线图、饼图等进行分类对数据进行转换或变换,例如将身高用表格来展示数据,例如频数表、频数据从厘米转换为米率表等03描述性统计描述性统计的基本概念描述性统计数据类型利用数据来描述和概括一组数数值型、分类型据的特征数据来源描述性统计的作用观测、调查、实验等提供对数据的初步了解,为进一步统计分析打下基础数据的集中趋势与离散程度010203集中趋势算术平均数中位数描述数据向某一中心值靠所有数值的和除以数值个将数据按大小排列后,位拢的倾向数于中间位置的数值数据的集中趋势与离散程度众数出现次数最多的数值离散程度描述数据之间的差异程度方差各数值与算术平均数的差的平方的平均数数据的集中趋势与离散程度标准差方差的平方根变异系数标准差与算术平均数的比值数据分布的形状偏态正偏态负偏态描述数据分布的不对称性数据向右偏斜,长尾在右侧数据向左偏斜,长尾在左侧平峰态尖峰态峰态数据分布较为平坦,分散范围广数据分布较为尖锐,集中于中心描述数据分布的尖锐程度或平坦值程度04概率与概率分布概率的基本概念概率概率的确定方法描述随机事件发生的可能性大小的数通过大量重复实验中事件发生的频率值来估计概率的取值范围0到1之间,其中0表示事件不可能发生,1表示事件必然发生概率分布的类型离散概率分布描述离散随机变量的概率分布,如二项分布、泊松分布等连续概率分布描述连续随机变量的概率分布,如正态分布、指数分布等常见概率分布及其应用二项分布正态分布描述n次独立重复实验中成功次数概描述连续随机变量概率分布,广泛应率分布,常用于计数数据和可靠性工用于自然现象、经济数据和社会科学程等领域泊松分布指数分布描述单位时间内随机事件发生的次数描述随机事件发生的时间间隔概率分概率分布,常用于等待时间、交通流布,常用于寿命测试、排队论等领域等领域05参数估计与假设检验点估计与区间估计点估计用单一的数值来估计参数,如使用样本均值来估计总体均值区间估计用样本统计量落在某个区间的概率来估计参数,如95%置信区间假设检验的基本原理小概率事件原理如果一个事件的发生概率很小,那么在一次试验中该事件就不太可能发生反证法先假设原假设成立,然后推导出一个与已知事实或逻辑相矛盾的结论,从而否定原假设常见的假设检验方法t检验卡方检验用于比较两组数据的均值是否存在显著差异用于比较实际观测频数与期望频数之间的差异F检验Z检验用于比较两个总体的方差是否存在显著差异用于检验总体比例或比率是否显著不等于0或106方差分析方差分析的基本概念方差分析(ANOVA)一种统计方法,用于比较两个或多个组之间的平均值是否存在显著差异前提假设数据满足独立性、正态性和方差齐性目的检验各组数据的均值是否相等,从而判断不同条件或处理对结果的影响方差分析的步骤与实例计算离差平方和计算方差分析表分别计算组内和组间离差平方包括组间方差、组内方差、总和方差、F值和P值准备数据计算自由度判断显著性整理分组数据,计算各组的平总自由度=样本数量-分组数,根据P值判断各组均值是否存均值和总体平均值组内自由度=组数-1,组间在显著差异通常P值小于自由度=总自由度-组内自由
0.05或
0.01时认为差异显著度方差分析的优缺点及应用场景优点01可以同时比较多个组的均值,相对其他统计方法更为高效;能够处理多种类型的数据,包括计数和计量数据;有助于了解不同条件或处理对结果的影响缺点02对数据的前提假设较为严格,如果数据不满足正态性或方差齐性,结果可能不准确;对样本量有一定的要求,样本量过小可能导致结果不稳定;无法提供各组间具体的差异值应用场景03在社会科学、医学、生物统计学等领域广泛应用,用于比较不同组之间的均值差异,例如不同治疗方法的效果比较、不同地区的教育水平比较等07相关分析与回归分析相关分析的概念与类型概念相关分析是研究变量之间关系的统计方法,通过收集数据并利用图表和统计指标来描述变量之间的关系非线性相关正相关两个变量之间的关系不是直线关系当一个变量增加时,另一个变量也相应增加线性相关负相关两个变量之间的关系可以用一条直线近似当一个变量增加时,另一个变量减少表示回归分析的基本原理回归分析是研究因变量与自变量之间关系的统计方法,通过建立回归模型来预测因变量的取值线性回归分析是最常用的回归分析方法,通过建立一条最佳拟合直线来描述因变量与自变量之间的关系回归分析的基本原理回归分析的基本步骤
1.确定因变量和自变量
2.收集数据回归分析的基本原理
3.建立回归模型
4.估计模型的参数
5.检验模型的适用性
6.应用模型进行预测线性回归分析的实例与应用实例以消费者购买力与收入之间的关系为例,通过收集数据并利用线性回归分析方法,可以建立消费者购买力与收入之间的回归模型,进而预测消费者购买力的变化趋势应用线性回归分析在经济学、金融学、市场营销等领域有着广泛的应用,可以帮助决策者了解变量之间的关系,并做出科学合理的决策08时间序列分析与预测时间序列分析的基本概念时间序列的特点时间序列具有动态性、趋势性和周时间序列的定义期性等特点时间序列是按照时间顺序排列的一系列数据时间序列的分类根据数据性质的不同,时间序列可以分为定距、定比和定性三种类型时间序列的分解与预测方法时间序列的分解趋势预测方法季节预测方法时间序列的分解主要包括趋势预测方法包括线性回季节预测方法包括季节指趋势分解和季节分解两部归、指数平滑、ARIMA模数法、季节性自回归积分分型等滑动平均模型等时间序列分析的应用实例股票市场分析气候变化研究销售预测利用时间序列分析技术,可以对时间序列分析在气候变化研究中在商业领域,时间序列分析可以股票市场进行趋势分析和预测,也有广泛应用,例如对气温、降用于销售预测,帮助企业制定生帮助投资者制定投资策略水等气象数据的分析和预测产和销售计划,提高经营效益THANKS感谢观看。