还剩21页未读,继续阅读
本资源只提供10页预览,全部文档请下载后查看!喜欢就下载吧,查找使用更方便
文本内容:
《数据的数字特征》ppt课件•数据的集中趋势•数据的离散程度•数据的分布形态CATALOGUE•数据的其他特征目录•数据的数字特征的应用01数据的集中趋势平均数平均数是一组数据之和除以数据平均数容易受到极端值的影响,计算方法将所有数值加起来,的个数,用于描述数据的“平均如果数据集中存在极端值,平均然后除以数值的数量水平”数可能会偏离实际数据分布的中心中位数中位数是将一组数据从小到大如果数据量是奇数,中位数就中位数不受极端值影响,能够排列后,位于中间位置的数值是中间那个数;如果数据量是更好地反映数据分布的实际情偶数,中位数就是中间两个数况的平均值众数众数是数据中出现次如果数据中有多个众数最多的数值数,则说明数据分布不集中众数能够反映数据的集中趋势,特别是在数据中出现次数很多的情况下02数据的离散程度方差方差用于衡量一组数据的离散程度,即各数值与其平均数之间的偏差方差越大,数据点越分散;方差越小,数据点越集中方差计算公式$sigma^2=frac{1}{N}sum_{i=1}^{N}x_i-mu^2$,其中$sigma^2$是方差,$N$是数据点的数量,$x_i$是每个数据点,$mu$是平均数极差极差计算公式$R=x_{max}-极差是一组数据中的最大值与最小值x_{min}$,其中$R$是极差,之差,反映了数据的范围$x_{max}$是最大值,$x_{min}$是最小值极差越大,数据点分散范围越广;极差越小,数据点越集中标准差标准差是方差的平方根,用于衡量数据的离散程度标准差越大,数据点越分散;标准差越小,数据点越集中标准差计算公式$sigma=sqrt{frac{1}{N}sum_{i=1}^{N}x_i-mu^2}$,其中$sigma$是标准差,其余符号同方差计算公式03数据的分布形态正态分布010203描述特点应用正态分布是一种常见的概具有对称性,即均值为对在自然现象和社会科学中率分布,其形状呈钟形,称轴,标准差决定了分布广泛存在,如人类的身高、数据点在平均值附近最为的宽度考试分数等集中,向两端逐渐减少偏态分布描述特点应用偏态分布是指数据分布不偏态系数描述了分布的偏在金融、经济等领域中常对称,可能有一个或两个斜程度,大于0表示右偏,见,如股票价格、收入等尾部异常值小于0表示左偏峰态分布特点峰态系数描述了分布的峰部形态,描述大于3表示峰部比正态分布更尖,小于3表示更平缓峰态分布是指数据分布的峰部和尾部的形状和正态分布不同应用在气象、生物等领域中常见,如气温、生物生长等04数据的其他特征数据相关性定义分类分析方法数据相关性是指两个或多个数据数据相关性可以分为正相关和负可以使用散点图、线性回归等方变量之间的关系,当一个变量发相关正相关表示当一个变量增法来分析数据相关性生变化时,另一个变量也可能随加时,另一个变量也增加;负相之变化关表示当一个变量增加时,另一个变量减少数据稳定性定义数据稳定性是指数据的波动程度或变化趋势是否相对稳定影响因素数据稳定性的影响因素包括样本大小、异常值、数据分布等分析方法可以使用均值、中位数、方差等统计量来分析数据稳定性数据周期性定义数据周期性是指数据随时间变化呈现出一定的周期性规律分类数据周期性可以分为日周期、周周期、年周期等分析方法可以使用时间序列分析、傅里叶变换等方法来分析数据周期性05数据的数字特征的应用在统计学中的应用描述统计数据的数字特征是描述统计的重要组成部分,用1于描述数据的集中趋势和离散程度,如均值、中位数、众数等推论统计在推论统计中,数据的数字特征用于对总体进行2估计和检验,例如使用样本均值和标准差来估计总体均值和标准差统计决策在统计决策中,数据的数字特征是制定决策的重3要依据,例如根据均值和标准差制定风险和收益的决策在数据分析中的应用数据清洗01数据的数字特征可用于数据清洗过程,通过检查异常值和离群点来识别和处理错误或异常数据数据探索02在数据探索中,数字特征用于初步了解数据的分布、集中趋势和离散程度,为后续的数据分析提供基础可视化辅助03数据的数字特征可以作为数据可视化的辅助工具,例如在绘制箱线图、直方图和散点图时使用数字特征来描述数据在决策制定中的应用预测模型在预测模型中,数据的数字特征是重要的自变量,通过建立回归模型或其他预测模型来预测目标变量分类模型在分类模型中,数据的数字特征用于描述不同类别的数据,并用于分类和识别不同群体或对象风险评估在风险评估中,数据的数字特征用于量化风险和不确定性,例如计算概率和预期损失,以帮助决策者制定更加科学和合理的决策THANKS感谢观看。