还剩25页未读,继续阅读
本资源只提供10页预览,全部文档请下载后查看!喜欢就下载吧,查找使用更方便
文本内容:
统计和统计数据22年课件目录•统计学的定义与基本概念•统计数据的收集与整理•描述性统计•概率论基础•随机变量与概率分布•参数估计与假设检验01统计学的定义与基本概念Chapter统计学是什么统计学是一门研究数据收集、整理、分析和推断的科学它旨在通过科学的方法和工具,从数据中提取有用的信息和结论,帮助人们做出决策和预测统计学在各个领域都有广泛的应用,如社会科学、医学、经济学、生物学等统计学的基本概念01020304数据变量总体与样本参数与统计量统计学研究的基础是在统计学中,变量是总体是研究对象的全参数是描述总体特征数据,包括数值型和用来描述数据特征的体,样本是从总体中的量,统计量是描述非数值型数据量度或度量抽取的一部分样本特征的量统计学的应用领域统计学在社会调查中广泛应用,社会调查如人口普查、民意调查等在医学领域,统计学用于临床试医学研究验、流行病学研究、药物疗效评估等在经济学中,统计学用于市场分经济学析、经济预测、评估政策效果等在生物学、地质学等自然学科中,自然学科统计学用于探索数据规律、进行实验设计和数据分析02统计数据的收集与整理Chapter统计数据的来源调查数据实验数据通过问卷调查、访谈等方式获取在科学实验、临床试验等实验活的原始数据动中获取的数据010203观测数据公开数据通过观察、监测等方式获取的数政府、企业、社会组织等公开的据,如气象观测、市场监测等数据,如政府统计数据、上市公04司年报等统计数据的收集方法01020304抽样调查普查网络爬虫第三方数据提供商从总体中选取一部分样本进行对全体对象进行调查,以获取通过网络爬虫技术自动抓取网从第三方数据提供商购买数据调查,以样本数据推断总体数全面、准确的数据络上的数据据统计数据的整理与展示数据清洗数据可视化对数据进行预处理,如缺失值通过图表、图像等形式将数据处理、异常值处理等,以保证展示出来,以便更好地理解数数据质量据数据分类与编码数据整合将数据按照一定的规则进行分将不同来源、不同形式的数据类和编码,以便进行数据分析进行整合,形成一个统一的数据集,以便进行综合分析03描述性统计Chapter描述性统计的定义与目的定义目的描述性统计是一种统计学方法,主要用于对数据进通过对数据进行描述性统计分析,可以更好地理解行整理、归纳和总结,以反映数据的总体特征和分数据,发现数据的内在规律和特点,为进一步的数布情况据分析和挖掘提供基础描述性统计的常用指标均值中位数众数标准差方差反映数据的平均水平,将数据按大小排序后,数据中出现次数最多的反映数据离散程度的指与标准差类似,也是反计算方法是所有数值相位于中间位置的数值数值标,计算方法是每个数映数据离散程度的指标,加后除以数值的数量对于奇数个数据,中位值与均值之差的平方的计算方法是每个数值与数就是中间那个数;对平均值再开方均值之差的平方的平均于偶数个数据,中位数值是中间两个数的平均值描述性统计的应用场景市场调查质量控制通过对市场调查数据的描述性统计分在生产过程中,通过对生产数据的描析,可以了解消费者的需求、偏好和述性统计分析,可以发现生产过程中行为特点,为企业制定营销策略提供的异常情况,及时进行调整和改进,依据提高产品质量数据分析在数据分析中,描述性统计是必不可少的一步,可以帮助我们了解数据的分布、异常值和趋势等,为进一步的数据分析和挖掘提供基础04概率论基础Chapter概率的基本概念010203概率必然事件随机事件描述随机事件发生的可能概率等于1的事件,表示概率介于0和1之间的事件,性大小的量度,通常用大该事件一定会发生表示该事件有可能发生也写字母P表示有可能不发生概率的运算规则加法规则乘法规则补事件两个互斥事件的概率之和两个事件同时发生的概率一个事件的补事件是该事等于这两个事件中任一事等于这两个事件概率的乘件不发生的事件,其概率件发生的概率积等于1减去该事件的概率条件概率与独立性独立性两个事件之间没有相互影响,一个条件概率事件的发生不影响另一个事件的发生在某个条件下,一个事件发生的概率贝叶斯公式用于计算在已知其他相关事件发生的条件下,某个事件发生的概率05随机变量与概率分布Chapter随机变量的定义与分类总结词随机变量是统计学的核心概念之一,用于描述随机现象的变量根据取值的不同,随机变量可以分为离散型和连续型两类详细描述随机变量是用来描述随机现象的变量,其取值具有随机性根据取值的特性,随机变量可以分为离散型和连续型两种类型离散型随机变量只能取可数的、不连续的值,而连续型随机变量可以取任何实数值离散型随机变量的概率分布总结词离散型随机变量的概率分布描述了随机变量取各个可能值的概率常见的离散型随机变量包括二项式随机变量、泊松随机变量等详细描述离散型随机变量的概率分布可以用概率质量函数或概率生成函数来描述,表示随机变量取各个可能值的概率常见的离散型随机变量包括二项式随机变量、泊松随机变量等,这些随机变量的概率分布具有特定的数学形式和性质连续型随机变量的概率分布总结词连续型随机变量的概率分布描述了随机变量在某个区间内取值的概率常见的连续型随机变量包括正态随机变量、指数随机变量等详细描述连续型随机变量的概率分布可以用概率密度函数或概率累积函数来描述,表示随机变量在某个区间内取值的概率常见的连续型随机变量包括正态随机变量、指数随机变量等,这些随机变量的概率分布具有特定的数学形式和性质在应用中,需要根据具体问题选择适当的概率分布来描述数据或现象06参数估计与假设检验Chapter点估计与区间估计点估计用单一数值来估计参数,如样本均值作为总体均值的估计区间估计用一个区间来估计参数,如样本均值±标准误作为总体均值的置信区间参数的假设检验参数假设检验基于样本数据对总体参数进行假设检验,判断假设是否成立双尾检验与单尾检验根据假设方向不同,分为双尾检验和单尾检验非参数假设检验非参数假设检验不依赖于总体分布的假设检验方法,如中位数检验、符号检验等优点与局限性非参数假设检验不受总体分布限制,但可能对数据要求较高,且检验效力相对较低THANKS感谢观看。