还剩21页未读,继续阅读
本资源只提供10页预览,全部文档请下载后查看!喜欢就下载吧,查找使用更方便
文本内容:
统计学基础课件第一章•统计学概述•统计数据的收集•统计数据的整理与展示•描述性统计目录•概率与概率分布contents01统计学概述统计学的定义统计学是一门收集、整理、分析和解释数据的科学,旨在从数据中获取有用的信息和知识它涉及到的方法和工具广泛应用于各个领域,如社会科学、经济学、生物学、医学等统计学的目的是提供一种系统的方法来探究数据的内在规律和结构,从而帮助人们做出更好的决策统计学的应用领域社会科学经济学生物学和医学商业和市场营销用于研究人类行为和社用于分析经济数据,如用于研究生物现象和人用于了解客户需求和市会现象,如人口普查、预测市场需求、评估投类健康,如临床试验、场趋势,如市场调研、民意调查等资风险等流行病学调查等顾客满意度调查等统计学的发展历程17世纪20世纪统计学开始发展,主要用于国随着计算机技术的发展,统计家管理和人口普查方法和数据分析得到了广泛的应用和发展19世纪现代随着概率论的引入,统计学开统计学与机器学习和人工智能始涉及随机抽样和统计分析等领域的结合,推动了大数据分析和数据挖掘等领域的快速发展02统计数据的收集数据来源直接数据来源包括调查、实验、观测等,这些方法可以直接从目标群体获取数据间接数据来源如公开出版物、政府机构、市场研究机构等,这些机构或平台会发布已经收集的数据数据收集方法定量数据通过数字量化表示的数据,可以进行数学运算和分析定性数据描述性的、类别性的数据,不能进行数学运算数据质量01020304准确性完整性时效性可比性数据是否真实、准确,没有误数据是否全面、完整,没有遗数据是否及时,没有过时在不同时间和空间上,数据是差或偏差漏否可以比较调查设计调查目的调查方法明确调查的目标和意图选择合适的调查方式,如问卷调查、访谈、观察等样本选择数据分析确定调查的范围和对象,如何选取有代表性预先设计好如何对收集的数据进行整理、分的样本类、分析和解读03统计数据的整理与展示统计数据的整理与展示数据整理数据分类将数据按照一定的标准进行分类,如按照年龄、性别、地区等进行分类,以便更好地理解和分析数据数据排序将数据按照一定的顺序进行排列,如按照数值大小进行升序或降序排列,以便更好地了解数据的分布情况-数据筛选从大量数据中筛选出符合特定条件的数据,如筛选出年龄在18-25岁之间的人群,以便进行更深入的分析统计数据的整理与展示数据整理数据展示方法-表格通过表格的形式展示数据,表格中包含数据的名称、数值和单位等信息,便于阅读和理解-图形图表制作-选择合适的图表类型根据数据的特征和关系选择合适的图表类型,如柱状图适用于展示分类数据之间的比较,折线图适用于展示时间序列数据的变化趋势-数据准备04描述性统计集中趋势的度量均值(Mean)众数(Mode)计算所有数值的和除以数值的数量,出现次数最多的数值,表示数据的集表示数据的中心倾向中趋势中位数(Median)将数据从小到大排序后,位于中间位置的数值,表示数据的中心倾向离散程度的度量方差(Variance)每个数值标准差(Standard四分位距(IQR)上四分位与均值之差的平方的平均值,Deviation)方差的平方根,数与下四分位数之差,表示数表示数据离散程度的大小表示数据离散程度的大小据的离散程度分布形态的度量偏态系数(Skewness)衡量数据分布形态是否对称的指标,大于0表示1正偏态,小于0表示负偏态峰态系数(Kurtosis)衡量数据分布形态的尖锐程度,大于3表示尖峰2态,小于3表示平峰态分布形态图通过绘制直方图或箱线图等图形,直观展示数据3分布的形态特征05概率与概率分布概率的基本概念010203概率定义概率性质概率的度量方法描述随机事件发生的可能非负性、规范性、有限可古典概率、统计概率和主性程度加性观概率概率分布概率分布函数离散概率分布连续概率分布描述随机变量取值范围的描述离散随机变量取值的描述连续随机变量取值的函数概率分布情况概率分布情况常见概率分布二项分布泊松分布描述n次独立重复试验中成功次数的描述单位时间内随机事件的次数情况情况正态分布指数分布描述连续随机变量取值的概率分布情描述随机事件发生的时间间隔情况况,具有对称性和集中趋势THANKS感谢观看。