还剩31页未读,继续阅读
本资源只提供10页预览,全部文档请下载后查看!喜欢就下载吧,查找使用更方便
文本内容:
应用统计第二章•引言•统计学基础•描述性统计•概率论基础•随机变量及其分布目•大数定律与中心极限定理•参数估计与假设检验•方差分析录contents01引言课程背景统计学是应用数学的一个分支,随着大数据时代的到来,统计学本课程旨在介绍应用统计的基本主要研究如何从数据中获取信息在各个领域的应用越来越广泛,概念和方法,培养学员分析和解和推断结论如医学、经济学、生物学等决问题的能力学习目标掌握统计学的基本概培养学员独立思考和念和方法,如描述性解决问题的能力,提统计、概率论、推断高数据分析和解读的统计等能力学会运用统计软件进行数据处理和分析,如Excel、SPSS等02统计学基础统计学的定义统计学是一门研究数据收集、整理、分析和推断的科学,目的是从数据中获取有用信息,并对未知或不确定的事物进行推断和预测统计学在各个领域都有广泛的应用,如医学、经济学、社会学、生物学等,是现代科学的重要组成部分统计学的分类描述统计学贝叶斯统计学主要研究如何通过图表、表格等方式与传统的推断统计学不同,贝叶斯统整理和展示数据,以及如何通过计算计学基于贝叶斯定理,通过先验概率各种统计量来描述数据的特征和规律和样本信息来更新对未知参数的信念推断统计学主要研究如何利用样本数据来推断总体特征和规律,包括参数估计和假设检验等方法统计学的研究方法参数估计相关分析通过样本数据来估计总体参数研究两个或多个变量之间关系的方法,如求平均数、中位数、的强度和方向的方法,如计算众数等相关系数、散点图等假设检验回归分析通过样本数据来检验关于总体研究一个因变量与一个或多个参数的假设是否成立的方法,自变量之间关系的数学模型,如t检验、卡方检验等如线性回归、逻辑回归等03描述性统计数据的收集与整理确定研究目的选择数据来源在收集数据之前,需要明确研究的目根据研究目的和范围,选择合适的数的和范围,以便有针对性地收集相关据来源,如调查、观察、实验等数据制定数据收集计划数据整理根据数据来源和目的,制定详细的数对收集到的数据进行筛选、分类、编据收集计划,包括收集方法、时间安码等处理,使其符合统计分析的要求排、人员分工等数据的描述性统计指标中位数标准差将数据从小到大排序后,位于表示数据离散程度的指标,计中间位置的数即为中位数算公式为每个数据点与均值之差的平方和的平均值再开方均值众数方差表示数据的平均水平,计算公出现次数最多的数即为众数表示数据离散程度的指标,计式为所有数据之和除以数据个算公式为每个数据点与均值之数差的平方和的平均值数据的图表展示01020304直方图折线图饼图条形图用于展示数据的分布情况,通用于展示数据随时间或其他变用于展示数据的比例关系,通用于展示分类数据的频数或频过直条的长短和高度表示各组量的变化趋势,通过折线的升过各扇形面积的大小来表示各率,通过条形的长短或高低来数据的频数或频率降来表示数据的变动情况组数据所占的比重表示各类别的频数或频率04概率论基础概率的基本概念概率的定义描述随机事件发生的可能性程度概率的取值范围0到1之间,其中0表示事件不可能发生,1表示事件一定发生必然事件和不可能事件必然事件概率为1,不可能事件概率为0概率的运算规则010203加法规则乘法规则全概率公式两个互斥事件的概率之和两个事件A和B同时发生的一个复杂事件的概率等于等于它们所包含的基本事概率等于事件A发生的概其所有可能结果的基本事件数之比率乘以事件B在A发生的条件概率之和件下发生的概率条件概率与独立性独立性两个事件A和B是独立的,当且仅条件概率的定义当PA∩B=PAPB在某个事件B发生的条件下,另一个事件A发生的概率贝叶斯公式在已知某个事件B已经发生的条件下,另一个事件A发生的概率等于PA∩B/PB,也可以表示为PA∣B=PB∣APA/PB05随机变量及其分布随机变量定义分类随机变量是用来描述随机现象的数学工具,根据取值的不同,随机变量可以分为离散通常用大写字母表示,如X、Y等型和连续型两种离散型随机变量连续型随机变量取值可以一一列举出来的随机变量,如投取值在某个区间内连续变化的随机变量,掷骰子的点数如人的身高离散型随机变量的概率分布定义离散型随机变量的概率举例投掷一枚硬币,正面朝常见离散型随机变量的概率分分布是指每个可能取值的概率,上的概率为
0.5,反面朝上的概布二项分布、泊松分布等通常用概率质量函数表示率为
0.5连续型随机变量的概率分布定义01连续型随机变量的概率分布是指某个区间内的概率,通常用概率密度函数表示举例02人的身高、体重等都属于连续型随机变量常见连续型随机变量的概率分布03正态分布、均匀分布、指数分布等06大数定律与中心极限定理大数定律大数定律的定义大数定律是指在大量独立重复的随机试验中,所观察到的某一事件出现的频率将趋于其概率大数定律的数学表达大数定律可以用数学公式表示为limn-∞PA_n=PA,其中A_n表示n次试验中事件A出现的次数,PA_n表示事件A出现的频率,PA表示事件A的概率大数定律的应用大数定律在统计学中有广泛的应用,例如在样本均值和样本比例的估计中,大数定律保证了样本均值和样本比例的估计量随着样本量的增加而趋于真实值中心极限定理中心极限定理的定义01中心极限定理是指在独立同分布的随机变量的大量独立重复试验中,它们的平均值的分布趋于正态分布中心极限定理的数学表达02中心极限定理可以用数学公式表示为limn-∞P∣∑xi−μ/σi∣x=1/4,其中xi表示第i次试验的结果,μ表示总体均值,σ表示总体标准差,∑表示求和符号中心极限定理的应用03中心极限定理在统计学中有广泛的应用,例如在样本均值的分布和样本比例的置信区间的计算中,中心极限定理保证了样本均值和样本比例的分布趋于正态分布,从而可以使用正态分布的性质进行推断和分析07参数估计与假设检验点估计与区间估计点估计区间估计优缺点比较用单一数值来表示未知参根据样本数据推断未知参点估计简单直观,但可能数的估计值,如样本均值、数的可能取值范围,如置不够精确;区间估计提供中位数等信区间更全面的信息,但计算较为复杂假设检验的基本概念假设检验的基本原理基于样本数据对未知参数或总体分布提出假设,1然后利用统计方法检验该假设是否成立假设检验的步骤提出假设、构造检验统计量、确定临界值、做出2决策假设检验的意义用于判断样本数据是否支持或拒绝某一假设,为3进一步的数据分析和决策提供依据单侧假设检验与双侧假设检验单侧假设检验双侧假设检验应用场景只关注参数的一个方向,如检验同时关注参数的两个方向,如检单侧假设检验常用于关注某一正平均值是否大于某一值验平均值是否在两个临界值之间面效应的情况,双侧假设检验则更适用于需要全面评估的情况08方差分析方差分析的基本思想方差分析的基本思想是通过对总变异方差分析是通过比较不同组数据的均的分解,将总变异分为组间变异和组值差异来检验多个总体均值是否相等内变异,并计算组间变异与总变异的的一种统计方法比例,即效应大小它假设各组数据来自独立随机样本,且各组数据的误差项具有相同的方差方差分析的步骤数据收集确定研究问题和假设根据研究目的和假设收集数据,确保数据质明确研究目的,提出假设,确定样本和实验设0102量计数据整理建立方差分析模型对数据进行整理和描述性统计分析,0304根据研究目的和数据特征选择合适的包括计算均值、标准差等统计量方差分析模型,如独立样本T检验、配对样本T检验、单因素方差分析等检验假设解释结果对方差分析模型进行统计检验,包括F检验0506根据统计检验结果解释研究假设是否成立,并和效应大小计算给出结论和建议方差分析的应用举例比较不同组学生的平均成绩差异01通过方差分析比较不同组学生(如不同班级或不同性别)的平均成绩是否存在显著差异比较不同产品质量的均值差异02通过方差分析比较不同产品质量的均值是否存在显著差异,以评估产品质量稳定性比较不同治疗方法的疗效差异03通过方差分析比较不同治疗方法(如药物治疗、手术治疗等)的疗效是否存在显著差异,以评估治疗方法的有效性THANKS感谢观看。