还剩21页未读,继续阅读
本资源只提供10页预览,全部文档请下载后查看!喜欢就下载吧,查找使用更方便
文本内容:
《统计描述》ppt课件•统计描述概述•数据收集与整理•数值型数据的统计描述CATALOGUE•分类数据的统计描述目录•统计描述的注意事项01统计描述概述统计描述的定义01统计描述利用各种统计指标和图表,对数据进行整理、归纳和表达,以反映数据的分布特征和规律02统计描述是统计学中的基础内容,旨在通过对数据的初步处理,为进一步的数据分析和推断提供基础资料统计描述的目的概括数据的基本特征通过统计描述,可以概括出数据的基本特征,如均值、中位数、众数等,了解数据的集中趋势和离散程度探索数据的分布规律通过绘制直方图、箱线图等统计图表,可以直观地探索数据的分布规律,了解数据的偏态和异常值情况为数据分析和推断提供依据通过对数据的初步整理和归纳,可以为后续的数据分析和推断提供基础资料,帮助我们更好地理解数据背后的现象和规律统计描述的基本内容数据收集统计指标在进行统计描述之前,需要先利用各种统计指标,如均值、进行数据收集,确保数据的代中位数、众数、标准差等,对表性和可靠性数据进行描述数据整理统计图表对收集到的数据进行整理,包利用各种统计图表,如直方图、括数据筛选、分类、编码等操箱线图、散点图等,对数据进作,以便进行后续的统计分析行可视化表达02数据收集与整理数据收集的方法调查法观察法实验法文献法通过问卷、访谈等方式通过实地观察记录数据,通过实验设计获取数据,通过查阅文献资料获取收集数据,适用于大范适用于需要直接获取现适用于需要控制实验条数据,适用于历史数据围或特定目标群体的数场数据的情况件的情况或已有研究成果的收集据收集数据整理的步骤01020304数据筛选数据分类数据编码数据排序剔除无效、异常或重复的数据,将数据按照一定标准进行分类,将非数值型数据转换为数值型将数据按照一定顺序进行排列,确保数据质量便于后续分析数据,便于计算和分析便于查找和对比数据整理的图表展示柱状图折线图用于展示分类数据的频数分布情况用于展示时间序列数据的趋势变化情况饼图散点图用于展示整体中各部分的占比情况用于展示两个变量之间的相关关系03数值型数据的统计描述均值与中位数均值数值型数据的平均数,反映数据的中心位置计算公式为$bar{x}=frac{1}{n}sum_{i=1}^{n}x_i$,其中$n$是数据个数,$x_i$是每个数据点中位数将数据从小到大排序后,位于中间位置的数对于奇数个数据,中位数就是正中间的数;对于偶数个数据,中位数是中间两个数的平均值方差与标准差方差衡量数据离散程度的指标,计算公式为$s^2=frac{1}{n}sum_{i=1}^{n}x_i-bar{x}^2$方差越大,数据点越离散;方差越小,数据点越集中标准差方差的平方根,也是衡量数据离散程度的指标计算公式为$s=sqrt{s^2}$数据的离散程度010203全距四分位距变异系数数据中的最大值与最小值将数据分成四等分后,第标准差与均值的比值,用之差,反映数据的范围三四分位数与第一四分位于比较不同量纲数据的离计算公式为$R=maxx数之差计算公式为散程度计算公式为$CV-minx$$IQR=Q3-Q1$=frac{s}{bar{x}}$04分类数据的统计描述频数与频率频数每个类别中数据的个数频率频数与数据总数的比值,用于描述某一类别在总体中的相对重要性相对频率某一类别的频率与所有类别的频率之和的比值,用于比较不同类别的相对大小数据的集中趋势平均数众数出现次数最多的数,反映数据的普遍性所有数据之和除以数据个数,表示数据的中心位置中位数将数据按大小排序后,位于中间位置的数对于偏态分布的数据,中位数比平均数更能反映数据的集中趋势数据的离散程度方差标准差变异系数每个数据与平均数的差的方差的平方根,与方差具标准差与平均数的比值,平方的平均值,用于描述有相同的量纲用于比较不同组数据的离数据分散程度散程度,尤其适用于比较不同量纲的数据05统计描述的注意事项数据来源的可靠性确保数据来源的可靠性和权威性,在数据收集过程中,应遵循科学对于可能存在的数据误差和异常避免使用不可靠的数据源的方法和程序,确保数据的准确值,应进行合理的检验和处理,性和可靠性避免对统计结果产生不良影响数据处理的合理性对数据进行合理的预处理,如缺失值填充、异常值处理等,以确保数据的质量和可用性在数据处理过程中,应遵循科学的方法和原则,避免主观偏见和错误根据实际需求和数据特点,选择合适的数据处理方法和工具,提高数据处理效率图表展示的规范性选择合适的图表类型,如柱状在图表制作中,应遵循规范和对于图表中的标注、标签、图图、折线图、饼图等,以直观标准,确保图表的准确性和可例等元素,应进行合理的设置地展示数据的特点和规律读性和解释,提高图表的可理解性和说服力感谢您的观看THANKS。