还剩7页未读,继续阅读
文本内容:
线性模型()广义线性模型5——我们知道,混合线性模型是一般线性模型的扩展,而广义线性模型在混合线性模型的基础上又做了进一步扩展,使得线性模型的使用范围更加广阔每一次的扩展,实际上都是模型适用范围的扩展,一般线性模型要求观测值之间相互独立、残差(因变量)服从正态分布、残差(因变量)方差齐性,而混合线性模型取消了观测值之间相互独立和残差(因变量)方差齐性的要求,接下来广义线性模型又取消了对残差(因变量)服从正态分布的要求残差不一定要服从正态分布,可以服从二项、泊松、负二项、正态、伽马、逆高斯等分布,这些分布被统称为指数分布族,并且引入了连接函数,根据不同的因变量分布、连接函数等组合,可以得到各种不同的广义线性模型要注意,虽然广义线性模型不要求因变量服从正态分布,但是还是要求相互独立的,如果不符合相互独立,需要使用后面介绍的广义估计方程
一、广义线性模型广义线性模型的一般方式为:有以下几个部分组成
1.线性部分
2.随机部分8*
3.连接函数连接函数为单调可微(连续且充分光滑)的函数,连接函数起了”y的估计值与”自变量的线性预测限的作用,在一般线性模型中,二者是一回事,但是当自变量取值范围受限时,就需要通过连接函数扩大取值范围,因此在广义线性模型中,自变量的线性预测值是因变量的函数估计值广义线性模型设定因变量服从指数族概率分布,这样因变量就可以不局限于正态分布一种形式,并且方差可以不稳定指数分布族的概率密度函数为其中6和(P为两个参数,0为自然参数,(p为离散参数,a,b,c为函数广义线性模型的参数估计广义线性模型的参数估计一般不能使用最小二乘法,常用加权最小二乘法或极大似然法回归参数需要用迭代法求解广义线性模型的检验和拟合优度广义线性模型的检验一般使用似然比检验、Wald检验模型的比较用似然比检验,回归系数使用Wald检验似然比检验是通过比较两个相嵌套模型(如模型P嵌套在模型K内)的对数似然函数来进行的,其统计量为G G=-2*(lp-lk)Ip是模型P的对数似然函数,1k是模型kl的对数似然函数模型P中的自变量是模型K中自变量的一部分,另一部分就是要检验的变量,这里G服从自由度为K-P的卡方分布广义线性模型的拟合优度通常使用以下统计量来度量离差统计量,pearson卡方统计量,AIC,AICC,BIC,CAIC准则,准则的值越小越好
二、广义估计方程(GEE)广义线性模型要求因变量相互自力,可是对于因变量存在相关性的数据则不得当因变量存在相关的数据多为纵向数据,纵向数据是指定时间顺序对个体进行重复测量得到的资料,是重复测量数据的一种,广义估计方程在广义线性模型的基础上开展而来,具有广义线性模型的优点,同时也能很好的办理纵向数据的相关性问题,是分析纵向数据的一种紧张方法广义估计方程最紧张的一个观点是为每一个观察工具零丁指定一个作业相关矩阵,从而办理了同一个观察工具重复测量成效之间的相关性,具体表示为各次重复测量成效两两之间的相关性大小常用Ria表示,是t*t维对角阵,t是总测量数,XXX的元素就表示为Yis和Yit的相关,虽然分体之间的相关性大概不尽不异,可是作业相关矩阵近似的表示个体之间平均的相关如果用RSt表示第S次测量和第t次测量之间的相关系数,那么作业相关矩阵会有以下几种形式
1.自力不相关Rst=O sRt
2.等相关,或可交换相关Rst=a s,t这种假设任意两次测量之间的相关是相等的,常用于不依赖时间顺序的重复测量比如间隔五分钟测量3次,3次测量成效大概相关,可是与时间先后顺序大概无关
3.不确定型相关相关矩阵非对角线上的元素均不等
4.稳态相关
5.自相关相关与间隔次数有关,间隔次数越长,相关关系越小
6.相邻相关只要相邻的两次观测值之间有关
7.稳态相关作业相关矩阵在拟合模型之前要先设定好,正确设定作业相关矩阵会增加模型估计的有效性,但是只要联接函数设置正确,并且总观察次数够大,即使作业相关矩阵设定不完全正确,0的可信区间和其他统计量仍然渐近正确广义估计方程的求解过程
1.假设重复测量值独立,按照广义线性模型计算出p,作为P的初始值,相当于普通最小二乘法估计
2.基于标准化残差和设定好的作业想干矩阵,计算出作业相关矩阵和作业协方差矩阵
3.根据当前的作业协方差矩阵,修正p的初始值
4.重复
2、3步骤,直到模型收敛
三、广义线性夹杂模型(GLMM)广义线性模型可以办理变量的非正态问题,可是还是要求数据的自力性广义估计方程办理了数据的自力性问题,可是有需求变量具有正态性而夹杂效应模型又要求因变量为连续型变量,这些都几何限制了模型的应用规模而广义线性夹杂模型可同时满足上述条件,数据既可以非正态也可以不自力,它涵盖了从简单线性回来模型到复杂的非正态纵向数据多变量模型的各种模型,是目前线性模型规模内比较完备的模型框架。