文本内容:
医学统计学统计学是研究数据的搜集、整理与分析的科学,面对不确定数据做出科学的推断和预测,直至为采取一定的决策和行动提出依据和建议统计分析就是使数据变成信息,使信息变成知识,从而推动科学进步的一个过程医学统计学是运用统计学原理和方法研究生物医学资料的搜集、整理、分析和推断的一门学科变异宇宙中的事物千差万别,各不相同,即使是同质事物,就某一观察指标来看,各观察单位之间也有差别,这种同质事物之间的差别,称为变异总体是根据研究目的所确定的同质观察单位的全体个体是构成总体的最基本的观察单位样本是从总体中随机抽取的部分个体,进行观察和测量这些个体的测量值构成的集合称为样本含量随机即机会均等是实验设计中必须遵循的基本原则之一,在实验对象的抽样、分组、实施过程中均应遵循随机化原则随机变量统计分析最基本的是变量,即观察对象个体的特征或测量的结果由于个体的特征或指标存在个体差异,观察结果在测量前不能准确预测,故称为随机变量统计量由样本所算出的统计指标或特征值称为统计量是已知的,且随着试验的不同而不同,但统计量的分布是有规律的,这种规律是统计推断的理论基础总体参数是事物本身固有的、不变的,但往往是未知的抽样误差SE样本的统计指标与总体的统计指标的差别,称为抽样误差概率P频率的稳定性充分说明随机事件出现的可能是事物本身固有的一种客观属性,因而是可以被认识和度量的这个常数P就称为事件A出现的概率,记作PA或P这一定义称为概率的统计定义小概率事件若某件事件的发生概率很小,则称该事件为小概率事件不同研究问题对小概率的要求不同,医学研究中将概率小于等于
0.05或
0.01者称为小概率事件小概率原理这种小概率事件虽不是不可能事件,但一般认为小概率事件在一次试验中是不会发生的,这就是小概率原理是统计推断的一条重要原理参考值范围也称为正常值范围,医学上常把绝大多数正常人的某指标值范围称为该指标的正常值范围这里的绝大多数〃可以是90%、95%、99%等,最常用的是95%的可信区间CI区间估计是按一定的概率或可信度l-a用一个区间估计总体参数所在范围,这个范围称作可信度为1-a的可信区间,又称置信区间第一类错误拒绝了实际上成立的Ho这类〃弃真〃的错误称为I型错误或第一类错误第二类错误不拒绝实际上是不成立的Ho这类〃存伪〃的错误,称为II型错误或第二类错误把握度也称检验效能,即两总体确有差别,按a水准能发现他们有差别的能力抽样误差的表现形式,以及产生的原因?由于生物体的变异总是客观存在的,因而抽样误差是不可避免的,但抽样误差的规律是可以被认识的,因而是可以控制的〃统计推断〃就是运用抽样误差的规律性对总体的某些特征进行估计和推断一般来说,样本含量越大,抽样误差就越小,用样本推断总体的精确度就越高当样本无限接近总体时,抽样误差就会逐渐消失描述集中位置的指标有哪些?适用范围的异同?在统计学中用来描述集中位置的指标体系是平均数,包括算术均数、几何均数、中位数等算数均数,简称均数,山反映了一组观察值的平均水平,适用于单峰对称或近似单峰对称分布资料的平均水平的描述几何均数,适用于各变量值之间成倍数关系,分布呈偏态,但经过对数变换后成单峰对称分布的资料中位数,M既适用于资料呈偏态分布或不规则分布时集中位置的描述,也适用于开口资料的描述所谓开口资料,是指数据的一端或者两端有不确定值描述离散趋势的指标有哪些?适用范围的异同?极差、四分位数间距、方差和标准差、变异系数极差,又称全距,R是指一组数据中最大值与最小值之差极差大,说明资料的离散程度大优点简单明了缺点
①不灵敏仅利用了最大值和最小值,因此不能反映组内其他数据的变异程度;
②不稳定尤其在样本例数较多时,得到较大和较小的观察值的可能性越大,极差就有可能越大,故在样本例数相差悬殊时,不宜比较其极差四分位数,即P25和P75对P25来说,有25%的观察值小于它,称下四分位数,QL;对P75来说,有25%的观察值大于它,称为上四分位数,QU用四分位数间距反应变异程度的大小,虽然比极差稳定,但仍未考虑全部观察值的变异程度方差和标准差,对于一个总体而言,可以用数据集中各个观察值与均数之差(离均差)来反映数据集中每个个体的离散程度,然而并不能将所有的离均差加在一起来反映整个数据集的离散程度一一因为结果将为0标准差直接地、总结地、平均地描述了变量值的离散程度在同质的前提下,标准差越大,说明一组资料的变异程度越大变异系数,CV离散系数,标准差与均数之比,变异系数没有度量衡单位,常用于比较度量单位不同和均数相差悬殊的两组或多组资料的离散程度区分率和比、率和构成比比又称相对比,是A、B两个有关指标之比,说明A为B的若干倍或百分之几,他是对比的最简单形式,A/B构成比又称构成指标,它说明一种事物内部各组成部分所占的比重或分部常以百分数表示,=某一组成部分的观察单位数/同一事物内各组成部分的观察单位总数X100%率又称频率指标,用以说明某现象发生的频率或强度=实际发生某现象的观察单位数/可能发生某现象的观察单位总数x比例基数(K)正态分布的特征(高斯分布)?是统计学中一个重要的概率分布,其原因是
①医学研究中的某些观察指标服从或近似服从正态分布;
②很多统计方法建立在正态分布的基础之上;
③很多其他分布的极限为正态分布特征
①正态分布是一单峰分布高峰位置在均数X=四处,这一点由f(X)的定义即知总体中位数亦为小
②正态分布以均数为中心,左右完全对称这是因为f(X)的公式中(x—日)是平方项,故(x—日)值无论正负,只要绝对值相等,则纵高f(X)相等
③正态分布取决于两个参数,即均数H和标准差口为位置参数,口大,则曲线沿横轴向右移动,口小,曲线沿横轴向左移动为形态参数,表示数据的离散程度,若小,变异小,则曲线形态瘦高,大,变异大,则曲线形态矮胖
④有些指标不服从正态分布,但通过适当的变换后服从正态分布
⑤正态分布曲线下的面积分布是有规律的(计算)掌握正态曲线下面积的分布规律(正态分布与标准正态分布下的计算问题)t分布的特征
①t分布为一簇单峰分布曲线
②t分布以0为中心,左右对称
③t分布与自由度v有关,自由度越小,t分布的峰值越低,而两侧尾部翘的越高;自由度逐渐增大时,t分布逐渐逼近标准正态分布;当自由度为无穷大时,t分布就是标准正态分布掌握完整的假设检验写法假设检验的注意事项
①要有严密的研究设计
②选用的假设检验方法应符合其应用条件
③正确理解(X水平和P值的意义
④单侧检验和双侧检验
⑤结论不能绝对化校正(选择)校正的/未校正的多组率的比较(看例题)秩和检验的配对,编制,排序(会编号排序填表)书P116表
8.5(问答)非参数检验(秩和检验)的优缺点。